Relationship between the Hessian and Covariance Matrix for Gaussian Random Varia
原文:https://onlinelibrary.wiley.com/doi/pdf/10.1002/9780470824566.app1
考虑一个高斯随机变量θ、平均值θ´、协方差矩阵∑θ,的联合概率分布为
目标函数可以定义为上式的负对数(我们无非就是要找概率最大的点嘛)
它是线性微分方程中各分量的二次函数。通过对 θl 和 θl* 求部分偏导,可以得到在(l,l*)上的Hessian矩阵(只和最后一部分有关,那好比对1/2x^2求二阶导,出来就是“1”,也就是这里的协方差矩阵的逆,Hessian矩阵)
所以海森矩阵等于协方差矩阵的逆
对于高斯随机分布,由于其目标函数为θ的二次函数,所以其二阶导数为常数。因此Hessian矩阵的计算并不需要平均值θ*。
Hessian矩阵中的元素携带随机向量的条件信息,因为它们是通过固定所有其他参数获得的。对角元素是目标函数在相应方向上的曲率。这些对角元的倒数即是非确定参数的条件方差。However, 协 方差 矩阵 的 对角 元素 θ parameters. 边际 差异 的
在许多应用中,目标函数是隐式已知的,因此Hessian矩阵的分量必须通过数值计算,例如,通过有限差分法,对角元素由(连续的问题化成数值形式表达)
△θ为只有第l为不为0的向量:
进一步,非对角元素可计算如下:
这里同上,△θl与△θl‘只有第l和l’为不为0的向量
以均值为μ,方差为σ的高斯随机分布为例:
取负对数
假设目标函数是已知的,所以有限差分方法用于估计Hessian,因此,该随机变量的方差。通过
(A.5)式中,Hessian可以在任意点上求值:
显然,上式结果并不依赖于估计点θ与步长△θ。
然而,对于其他概率分布,方程(a .4)是不正确的,但如果不确定性很小,它提供了一个很好的近似。然而,有限差分法计算的海森矩阵依赖于估计点和步长。估计点可以固定在最可能的分布值和步长的选择必须小心处理。这将在下一个示例中讨论。
以伽玛随机分布为例:
假设正值随机变量为带形状参数α>0及逆尺度参数β>0的伽玛分布,由以下单位给出的PDF:
Γ(a)为伽玛函数。方差和均值分别由αβ与αβ²给出。如果α=1,那么此分布为指数分布,θ的近似值为0(应该是这样翻译吧)。如果α>1,则θ的近似值为
目标函数可定义为:
同样,我们假设目标函数是隐式已知的。由方程(A.5)计算:
与高斯随机变量相反,这种解决方案依赖于估计点还有有限差分步长。(对比A.10)
对于具有较小不确定性的随机变量,其方差可近似为H(θ*)的逆。为了演示这一点,令 (A.11) 中α=μ/β,则均值为μ,方差是μβ。对于很小的β,Hessian矩阵可用有限差分法估计,可以近似为
因此, Hessian 估计方差提供了一个很好的近似: H(θ)−1 ≈ μβ。接下来,展示的两案例,它们对应一个大的方差和一个小的方差。
案例1:α= 10和β= 0.1
这个分布对应于图A1中比较离散的概率密度函数。这里是均值为αβ = 1方差为αβ² = 0.1,因此,变量系数(又称离散系数,标准差/均值)为1/√10≈32%,表示不确定性较大的情况。通过使用公式(A.14),图A.2显示了在0.5以内的不同有限差分步长的Hessian和估计方差。可以清楚地看到,估计依赖于步长。方差的正确值是0.1,但是这个变异系数很大的随机变量的估计值是10%
案例 2: α = 100 and β = 0.01
这个分布对应A1中比较集中的概率密度函数。这里是均值为αβ = 1,方差为αβ² = 0.01,变异系数为10%。这个随机变量的均值和案例1相同但方差更小。图A3显示了使用不同有限差分步长估计的Hessian和方差。同样,估计取决于步长。在步长较小时,方差的正确值为0.01,估计误差约为1%。
一般来说,有限差分估计方差对于分布的变异系数较小更准确,因为在这种情况下,PDF的局部拓扑更能代表全局分布。这个例子表明,这个近似是可接受的,变异系数为10%。
Relationship between the Hessian and Covariance Matrix for Gaussian Random Varia相关推荐
- R语言使用psych包进行探索性因子分析EFA、使用cov2cor函数将原始数据的协方差矩阵将其转换为相关性矩阵( covariance matrix into correlation matrix)
R语言使用psych包进行探索性因子分析EFA.使用cov2cor函数将原始数据的协方差矩阵将其转换为相关性矩阵( covariance matrix transform into correlati ...
- 【Matlab】错误使用 classify (line 233) The pooled covariance matrix of TRAINING must be positive definite.
在 Matlab 用 Classify 函数做判别分析时,有时会碰到下面的问题: 错误使用 classify (line 233) The pooled covariance matrix of TR ...
- 加权协方差矩阵(weighted covariance matrix)
国内完全没一个有用的,这里给出了加权协方差矩阵计算函数.用的时候可以将权重先归一化. def weighted_cov(values, weights):"""Compu ...
- 散布矩阵(Scatter Matrix)及其与协方差矩阵(The Covariance Matrix)的关系
在多元统计和概率论中,散点矩阵是一种统计量,用来估计协方差矩阵,例如多元正态分布. In multivariate statistics and probability theory, the sca ...
- 实验笔记之——covariance matrix pooling
本博文为协方差池化的实验笔记.具体理论请参考博客<学习笔记之--covariance pooling> 实验python train.py -opt options/train/train ...
- covariance matrix r语言_时间序列分析|ARIMAX模型分步骤详解和R中实践
这是关于时间序列的第N篇文章,本文将介绍ARIMAX模型,简单来说就是在ARIMA的基础上增加一个外生变量.ARIMAX和ARIMA相比在理论上没有太多新的内容,所以本文直接介绍在R里怎么一步一步跑A ...
- 协方差矩阵(covariance matrix)
Xn×d⇒(XTX)d×d X_{n\times d}\Rightarrow \left (X^TX\right )_{d\times d} (1)协方差矩阵:半正定(semi-positive de ...
- A geometric interpretation of the covariance matrix(reproduced)
转载自:http://www.visiondummy.com/2014/04/geometric-interpretation-covariance-matrix/
- Why does the Eigen decomposition of the covariance matrix of a point cloud give its orientation?
数学分析 PCA 协方差矩阵的几何角度解释 我见过的使用PCA估计点云法向量的最好的解释
最新文章
- 某阿里程序员女朋友吐槽男友整天玩失踪!早晨问候一声,晚上十一点才回信息!中间完全消失!阿里加班真的这么恐怖吗?...
- 最详细的java泛型详解
- Arraylist线程不安全原因
- linux uart中断程序,linux 串口中断实现
- enet分割_论文阅读 | CVPR 2016 | 语义分割论文: ENet
- tensorflow代码中的一个bug
- oracle数据库操作文档,oracle数据库操作
- js 小写金额转大写金额
- 利用python爬取租房信息_Python实战:爬取租房信息
- 知道如何防止域名被封,干货!赶紧收藏
- 广西壮族自治区公安厅信息中心异地容灾系统(三期)项目招标
- 【产品功能】配置网卡从此与关机无缘,弹性网卡支持热插拔功能
- OUC-SE-BLOG1
- 工作自动扩张的时间管理与柳比歇夫时间记录统计(时间管理讲座笔记)
- 第8周训练总结(4.20)
- 有关Word 2003中制表符和制表位
- 陈年:追随PPG 直销衬衫拒绝烧钱
- CentOS 6.8 时间同步
- 反向传播算法公式推导
- accept限制文件上传格式
热门文章
- 周鸿祎的绝招—“寄生战略”
- DCIM 系统是如何智能改善数据中心主机管理的
- [下载] M20PXX 系列 SPI Flash datasheet
- SQL中 raiserror使用
- 8.2.2-elasticsearch内置分词器之whitespace/stop
- 使用ansible kubectl插件连接kubernetes pod以及实现原理
- mysql timestampdiff datediff_MySql中 DATEDIFF 函数 和 TIMESTAMPDIFF 时间 函数
- HTML---背景样式
- plt.xscale、plt.yscale将 x轴 和 y轴 的比例设置为对数比例
- mysql tinyint 2_mysql中Tinyint(1)、Tinyint(2)