1. 概述

首先信息熵的计算公式如下

其中I(X)表示X的信息量

注:这里对数所使用的底,通常是 2, 自然常数e,或是10。当b = 2,熵的单位是bit;当b = e,熵的单位是nat;而当 b = 10,熵的单位是dit。

p(xi)是xi发生的概率英文里面叫做probability mass function,一个随机产生的事件所包含的信息本体数量,只与事件发生的机率相关。事件发生的机率越低,在事件真的发生时,接收到的信息中,包含的信息本体越大。含义是概率为 0 的事件对应的信息大, 反之信息量少,取对数的原因是使得乘积变为求和。信息熵即为信息量的数学期望。

则X,Y的联合信息量可以表示为

平均互信息为互信息的数学期望

则公式可以推出

2. 代码

用的MATLAB 2012b,发现没有这个函数,官网提供的information theory包,需要编译cpp,编译cpp又需要安装SDK,然而试了安装SDK好多次都不成功,一套流程真让人奔溃。。

于是网上搜索代码整理成MATLAB可以用的计算函数VectorMI

-------------------------------------------------------------------------------------------------------

function [MI,mi] = VectorMI(u1,u2,wind_size)

% Calculate the mutual information of two vector

% the size of u1 and u2 must be equal

% wind_size:size of the window

if nargin<2

disp('Error: please input at least two parameters:u1, u2');

return

end

if nargin==2

wind_size=floor(power(length(u1),1/3)+0.5);

end

x = [u1, u2];

n = wind_size;

[xrow, xcol] = size(x);

bin = zeros(xrow,xcol);

pmf = zeros(n, 2);

for i = 1:2

minx = min(x(:,i));

maxx = max(x(:,i));

binwidth = (maxx - minx) / n;

edges = minx + binwidth*(0:n);

histcEdges = [-Inf edges(2:end-1) Inf];

[occur,bin(:,i)] = histc(x(:,i),histcEdges,1);

pmf(:,i) = occur(1:n)./xrow;

end

% Calculate the joint probability density of u1 and u2

jointOccur = accumarray(bin,1,[n,n]);

%(xi?yi) The number of two data falling into the n * n aliquot is the joint probability density

jointPmf = jointOccur./xrow;

Hx = -(pmf(:,1))'*log2(pmf(:,1)+eps);

Hy = -(pmf(:,2))'*log2(pmf(:,2)+eps);

Hxy = -(jointPmf(:))'*log2(jointPmf(:)+eps);

MI = Hx+Hy-Hxy;

mi = MI/sqrt(Hx*Hy);

--------------------------------------------------

3. MI可以解答非线性的关系

今天计算了一个例子,是概率书上对于皮尔逊相关系数不能解决线性关系的例子:

n=1:1000;

x=cos(n');

y=cos(n'+pi/2);

[MI,zMI] = x_calcelateMI([x,y],30)

C=corr(x,y)

结果:

zMI =

0.5719

C =

-9.0316e-04

其中 x_calcelateMI是我自己计算MI的函数zMI是标准化的互信息,c是相关系数,理论上c是0,结果也是十分接近于0,但可以看出互信息很高,说明互信息可以很好的衡量非线性关系,验证了我的想法。

4. 遇到的问题

增加路径界面方式:

另外一点要提示的是,如果自己写的函数要运行的话,需要在面板上 add path

首 先把主界面调出来,有两种方式,一种是在命令窗口输入pathtool,另一种是在matlab菜单调用(File -> Set Path…)。打开主界面后,相信不用太多解释了。Add Folder… 或者 Add with subfolders… 就可以了,添加完毕后,如果需要保存该路径,则在close前save一下就可以了。

这种方式的好处是如果路径有问题,matlab会马上报错,告诉用户添加失败。

找不到m文件的问题:

但是不是里面生效,所以还得rehash toolbox

如 果你已经把工具箱正确添加到搜索路径下,这种情况一般不会发生。也就是说,通过“文件夹copy -> 运行matlab ->添加路径”步骤后,该文件夹下所有文件应该都可以访问到。但是,当你对该文件夹下的m文件更新(包括修改和新增)了以后,此时如果你不重启 matlab,则可能会出现找不到m文件的问题(特别是该工具箱中的文件没有依赖关系,它们只是被放在一起方便调用,当你新增一个m文件到该文件夹下而不 重启matlab的时候,会造成这一新增m文件访问失败)。解决这个问题的方法之一显然是重启matlab,如果你不想重启,也可用第二个方法:在命令窗 口输入: rehash toolbox,“强制”matlab刷新toolbox目录下的所有文件,这样就可以正确访问了。

matlab 互信息计算公式,MATLAB计算Mutual information(互信息)函数相关推荐

  1. matlab 互信息计算公式,matlab几种计算互信息的方法

    [实例简介] 里面包含几种用于matlab计算两个序列之间的互信息的方法,用于评价变量之间的耦合程度,可以参考和学习. [实例截图] [核心代码] 互信息计算 ├── KraskovMI │   └─ ...

  2. mutual information matlab,Mutual information and Normalized Mutual information 互信息和标准化互信息...

    实验室最近用到nmi( Normalized Mutual information )评价聚类效果,在网上找了一下这个算法的实现,发现满意的不多. 浙江大学蔡登教授有一个,http://www.zju ...

  3. 电机matlab程序计算公式,MATLAB用于电机电磁计算的计算机编程

    文件介绍: 该文件为 doc 格式,下载需要1积分 MATLAB用于电机电磁计算的计算机编程 MATLAB是一种功能极其强大的解释性语言,它提供的运算符及数据结构之丰富,图形功能之完美.功能箱之丰富, ...

  4. Matlab 二维凸包计算(内置函数)

    文章目录 一.简介 二.实现代码 三.实现效果 参考资料 一.简介 Matlab中的凸包算法不同于很经典的Graham算法,它采用的是Delaunay三角剖分的方式来获取凸包,这里也进行记录一下. 二 ...

  5. 位移传递率matlab编程,各种谱计算,频响函数,传递率

    A.信号与谱的分类 由于时域信号有不同的分类, 变换后对应的频域也有不同的谱 信号可分为模拟(连续)信号和数字(离散)信号, 连续信号变换后称为谱密度, 离散信号变换 后称为谱. 连续信号又可分为绝对 ...

  6. matlab坡度计算公式,matlab解二阶微分方程怎么用matlab来解呢?x的定义域是(0,l),i是道路横坡坡度,w是降雨强度,k是路面横向...

    共回答了16个问题采纳率:81.3% 你的方程即为: y'*y' + y''*y' +w/k =0 s = dsolve('Dy*D2y + Dy^2 + w/k ', 'y(l) = a', 'Dy ...

  7. 机器学习特征筛选:互信息法(mutual information)

    机器学习特征筛选:互信息法(mutual information) 互信息法多为分类问题的分类变量的筛选方法 经典的互信息也是评价定性自变量对定性因变量的相关性的,为了处理定量数据,最大信息系数法被提 ...

  8. 互信息(Mutual Information)的介绍

    互信息,Mutual Information,缩写为MI,表示两个变量X与Y是否有关系,以及关系的强弱. 如果 (X, Y) ~ p(x, y), X, Y 之间的互信息 I(X; Y)定义为: No ...

  9. 【立体匹配】Stereo Processing by Semiglobal Matching and Mutual Information(SGM)

    Stereo Processing by Semiglobal Matching and Mutual Information 基于半全局匹配和互信息的立体处理 Stereo Processing b ...

最新文章

  1. C++类class和结构体struct区别
  2. 为什么我的理论和实践之间的差距相对较大
  3. C语言如何实现面向对象?
  4. HDU1102 Constructing Roads 最小生成树
  5. 使自己的注意力集中方法
  6. SystemUI之状态栏notification icon加载流程
  7. Python稳基修炼的经典案例8(计算机二级、初学者必须掌握的例题)
  8. 有软件开发,就要有软件测试!
  9. 页面查询条件选框被隐藏的问题
  10. 6.Jenkins 权威指南 --- 高级构建
  11. linux ls 输出格式,(转)linux 中使用ls指定输出时间格式
  12. 用 Python 给自己的头像加一个小国旗或者小月饼
  13. 简单做(ZTD)的十个好习惯总结
  14. Python代码写好了怎么运行?
  15. 2k的地址范围 计算机组成原理,计算机组成原理课后习题
  16. 缓动动画_核心动画概念:缓入缓出
  17. vscode修改快捷键为idea的快捷键
  18. GD32F130之GPIO
  19. Kylin_麒麟介绍
  20. iOS 解决时间相差8小时问题

热门文章

  1. oracle merge into insert,Oracle Merge Into 用法
  2. Openflow 、TTP和OF-DPA的关系和介绍
  3. 亚马逊无货源教你怎么注册
  4. 学习这篇总结后,你也能做出天天快报一样的推荐系统 1
  5. 【Linux】confluence 7.9 安装教程-协同办公必备 构建企业wiki
  6. WEB入门.五 页面设计简介
  7. clrscr()及gotoxy()函数
  8. 禅道按照官方配置后,发现同局域网的其他电脑无法访问
  9. linux网卡 loopback,linux loopback什么意思?
  10. 聚乙二醇-透明质酸-量子点-美法仑复合物,简写为PEG-HA-QDs-MEL|Ni掺杂水溶性PbS硫化铅量子点