已知最大熵模型为 P w ( y ∣ x ) = 1 Z w ( x ) e x p ( ∑ i = 1 n w i f i ( x , y ) ) P_{w}(y|x)=\frac{1}{Z_{w}(x)}exp\Big(\sum_{i=1}^nw_{i}f_{i}(x,y)\Big) Pw​(y∣x)=Zw​(x)1​exp(i=1∑n​wi​fi​(x,y))其中, Z w ( x ) = ∑ y e x p ( ∑ i = 1 n w i f i ( x , y ) ) Z_{w}(x)=\sum_{y}exp\Big(\sum_{i=1}^nw_{i}f_{i}(x,y)\Big) Zw​(x)=y∑​exp(i=1∑n​wi​fi​(x,y))对数似然函数为 L ( w ) = ∑ x , y P ~ ( x , y ) ∑ i = 1 n w i f i ( x , y ) − ∑ x P ~ ( x ) log ⁡ Z w ( x ) L(w)=\sum_{x,y}\tilde{P}(x,y)\sum_{i=1}^nw_if_i(x,y)-\sum_{x}\tilde{P}(x)\log{Z_{w}(x)} L(w)=x,y∑​P~(x,y)i=1∑n​wi​fi​(x,y)−x∑​P~(x)logZw​(x)
推导过程:
对于给定的经验分布 P ~ ( x , y ) \tilde{P}(x,y) P~(x,y),模型参数从 w w w到 w + δ w+\delta w+δ,对数似然函数的改变量是 L ( w + δ ) − L ( w ) = ∑ x , y P ~ ( x , y ) log ⁡ P w + δ ( y ∣ x ) − ∑ x , y P ~ ( x , y ) log ⁡ P w ( y ∣ x ) L(w+\delta)-L(w)=\sum_{x,y}\tilde{P}(x,y)\log{P_{w+\delta}(y|x)}-\sum_{x,y}\tilde{P}(x,y)\log{P_w(y|x)} L(w+δ)−L(w)=x,y∑​P~(x,y)logPw+δ​(y∣x)−x,y∑​P~(x,y)logPw​(y∣x) = ∑ x , y P ~ ( x , y ) log ⁡ ( 1 Z w + δ ( x ) e x p ( ∑ i = 1 n ( w i + δ i ) f i ( x , y ) ) ) − ∑ x , y P ~ ( x , y ) log ⁡ ( 1 Z w ( x ) e x p ( ∑ i = 1 n w i f i ( x , y ) ) ) =\sum_{x,y}\tilde{P}(x,y)\log{\bigg(\frac{1}{Z_{w+\delta}(x)}exp\Big(\sum_{i=1}^n({w_{i}+\delta_{i}})f_{i}(x,y)\Big)\bigg)-\sum_{x,y}\tilde{P}(x,y)\log{\bigg(\frac{1}{Z_{w}(x)}exp\Big(\sum_{i=1}^nw_{i}f_{i}(x,y)\Big)\bigg)}} =x,y∑​P~(x,y)log(Zw+δ​(x)1​exp(i=1∑n​(wi​+δi​)fi​(x,y)))−x,y∑​P~(x,y)log(Zw​(x)1​exp(i=1∑n​wi​fi​(x,y))) = ∑ x , y P ~ ( x , y ) ( log ⁡ 1 Z w + δ ( x ) + ∑ i = 1 n ( ( w i + δ i ) f i ( x , y ) ) ) − ∑ x , y P ~ ( x , y ) ( log ⁡ 1 Z w ( x ) + ∑ i = 1 n ( w i f i ( x , y ) ) ) =\sum_{x,y}\tilde{P}(x,y)\Big(\log{\frac{1}{Z_{w+\delta}(x)}}+\sum_{i=1}^n((w_{i}+\delta_{i})f_{i}(x,y))\Big)-\sum_{x,y}\tilde{P}(x,y)\Big(\log{\frac{1}{Z_{w}(x)}}+\sum_{i=1}^n(w_{i}f_{i}(x,y))\Big) =x,y∑​P~(x,y)(logZw+δ​(x)1​+i=1∑n​((wi​+δi​)fi​(x,y)))−x,y∑​P~(x,y)(logZw​(x)1​+i=1∑n​(wi​fi​(x,y))) = ∑ x , y P ~ ( x , y ) ∑ i = 1 n δ i f i ( x , y ) − ∑ x P ~ ( x ) log ⁡ Z w + δ ( x ) Z w ( x ) =\sum_{x,y}\tilde{P}(x,y)\sum_{i=1}^n\delta_{i}f_{i}(x,y)-\sum_{x}\tilde{P}(x)\log{\frac{Z_{w+\delta}(x)}{Z_{w}(x)}} =x,y∑​P~(x,y)i=1∑n​δi​fi​(x,y)−x∑​P~(x)logZw​(x)Zw+δ​(x)​
参考:
《统计学习方法》,李航,p89

计算对数似然函数改变量相关推荐

  1. 深入理解Pytorch负对数似然函数(torch.nn.NLLLoss)和交叉熵损失函数(torch.nn.CrossEntropyLoss)

    在看Pytorch的交叉熵损失函数torch.nn.CrossEntropyLoss官方文档介绍中,给出的表达式如下.不免有点疑惑为何交叉熵损失的表达式是这个样子的 loss ⁡ ( y , clas ...

  2. SoftMax函数,交叉熵损失函数与熵,对数似然函数

    深度学习以及机器学习中都会用到SoftMax函数,交叉熵损失函数与熵,对数似然函数等一些数学方面的知识,此文作为个人学习笔记. 1.softmax函数 (1)定义 多分类问题中,我们可以使用SoftM ...

  3. 最大似然法、似然函数及对数似然函数

    似然函数 统计学中,似然函数是一种关于统计模型参数的函数.表示模型参数中的似然性. 定义:给定输出x时,关于参数θ的似然函数L(θ|x)(在数值上)等于给定参数θ后变量X的概率: 其中,小x是指联合样 ...

  4. 贝叶斯公式的对数似然函数_最大似然估计和贝叶斯估计学习体会

    最大释然估计和贝叶斯参数估计 Jiangxiaodong 1 引言 在之前的学习中我们已经知道如何根据先验概率和类条件概率密度来设计最有分类器.但在模式识别的实际应用中,通常得不到有关问题的概率结构的 ...

  5. 贝叶斯公式的对数似然函数_最大似然法与似然函数

    在统计学中,最大似然估计,也称最大概似估计,是用来估计一个概率模型的参数的一种方法 通俗来讲,最大似然估计是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导致这样结果的模型参数值. 定义 ...

  6. 机器学习中的数学原理——对数似然函数

    这个专栏主要是用来分享一下我在 机器学习中的 学习笔记及一些感悟,也希望对你的学习有帮助哦!感兴趣的小伙伴欢迎 私信或者评论区留言!这一篇就更新一下< 白话机器学习中的数学--对数似然函数> ...

  7. 负对数似然函数的推导

    似然函数的理解 概率用于在已知一些参数的情况下,预测接下来的观测所得到的结果.参数->结果 似然性则是用于在已知某些观测所得到的结果时,对有关事物的性质的参数进行估计.结果->参数 举个例 ...

  8. 【数据挖掘】高斯混合模型 ( 高斯混合模型参数 | 高斯混合模型评分函数 | 似然函数 | 生成模型法 | 对数似然函数 | 高斯混合模型方法步骤 )

    文章目录 I . 高斯混合模型 参数简介 ( 参数 ) II . 高斯混合模型 评分函数 ( 评价参数 ) III. 似然函数与参数 IV . 生成模型法 V . 对数似然函数 VI . 高斯混合模型 ...

  9. Bailian2739 计算对数【对数】

    2739:计算对数 总时间限制: 1000ms 内存限制: 65536kB 描述 给定两个正整数a(a>1)和b.可以知道一定存在整数x,使得 x <= logab < x + 1 ...

最新文章

  1. html在线测试接口,apiManager: 小幺鸡在线接口管理系统,支持在线测试,支持json,txt,xml,html,js,流,和 WebSocket...
  2. SSH框架执行自己定义的SQL语句
  3. Linux 学习笔记_12_文件共享服务_3_NFS网络文件服务
  4. php 按 截取字符串,PHP按符号截取字符串的指定部分
  5. Unity3D 旋转
  6. 漫步数学分析十五——连续
  7. 数字校园APP——可行性报告分析
  8. 170308、oracle查看被锁的表和解锁
  9. 从零手写VIO(三)——LM算法
  10. LibreOJ #10003加工生产调度(Johnson算法求解最短时间)
  11. 2019最新Python学习教程_Python学习视频_Python学习路线:学Python,这次你可得认真看完了!
  12. linux 迁移类型,迁移到Linux前必须要知道的五个方面
  13. Learning Affinity from Attention End-to-End Weakly-Supervised Semantic Segmentation withTransformers
  14. Ucase()函数和Lcase()函数
  15. 华为鸿蒙系统会在哪些手机上更新,那些华为手机可以升级鸿蒙系统!
  16. 动手试试!手把手教你如何适配 iPhone X
  17. Ineffective mark-compacts near heap limit Allocation failed-JavaScript heap out of memory vue项目内存溢出
  18. Leetcode 345 Reverse Vowels of a String 字符串处理
  19. 2019团体程序设计天梯赛L1 L1-1 PTA使我精神焕发L1-2 6翻了L1-3 敲笨钟L1-4 心理阴影面积L1-5 新胖子公式L1-6 幸运彩票L1-7 吃鱼还是吃肉
  20. Vue-vben-admin Vue3+TS Axios的封装源码分析

热门文章

  1. 1. Vue CLI脚手架
  2. VS 一个解决方案里面建立多个项目
  3. NameNode堆内存估算
  4. tshark命令示例
  5. JavaScript - 解析JSON
  6. 网线连接olt配置计算机IP,EPON-ONU-OLT配置手册.pdf
  7. 私有vlan(PVLAN)实验配置步骤
  8. MySQL+Java 图书管理系统
  9. 【问题解决】电脑突然/总蓝屏,终止代码显示:UNEXPECTED_STORE_EXCEPTION
  10. html js表单,HTML HTML 表单 - 闪电教程JSRUN