频率派——统计机器学习

频率派认为θ\thetaθ是未知的变量,XXX服从概率分布,然后通过极大似然估计求参。
似然:P(X∣θ)P(X|\theta)P(X∣θ),X是确定的,而θ\thetaθ是变量,它描述对于不同的θ\thetaθ,X出现的概率是多少。所以我们需要最大化似然函数P(X∣θ)P(X|\theta)P(X∣θ),来求出最适合的参数。

高斯分布

在实际生活中,很多问题的数据可以被建模成包含一定噪声的高斯分布模型
高斯分布模型是具有如下概率分布的模型:θ:(u,o)\theta:(u,o)θ:(u,o)
p(x∣θ)=12Πexp−(x−u)22o2p(x|\theta)=\frac{1}{\sqrt{2Π}}exp^{-\frac{(x-u)^2}{2o^2}}p(x∣θ)=2Π​1​exp−2o2(x−u)2​,它代表随机变量xix_ixi​取不同值的概率大小,u表示高斯分布的均值,o代表分布的标准差。
假设有一批n个样本的数据服从高斯分布,data=(x1,x2...xn)n,pdata=(x_1,x_2...x_n)_{n,p}data=(x1​,x2​...xn​)n,p​每个xix_ixi​的似然函数是p(xi∣θ)p(x_i|\theta)p(xi​∣θ),它表达每个样本在不同θ\thetaθ下的出现的概率。
那么所有data的对数似然是logP(X∣θ)=log∏i=1nP(xi∣θ)=∑i=1nlogP(xi∣θ)=∑log12Πexp−(x−u)22o2logP(X|\theta)=log\prod_{i=1}^nP(x_i|\theta)=\sum_{i=1}^nlogP(x_i|\theta)=\sum log\frac{1}{\sqrt{2Π}}exp^{-\frac{(x-u)^2}{2o^2}}logP(X∣θ)=log∏i=1n​P(xi​∣θ)=∑i=1n​logP(xi​∣θ)=∑log2Π​1​exp−2o2(x−u)2​
下面我们需要极大化似然函数来求参θ:(方差,标准差)\theta:(方差,标准差)θ:(方差,标准差):
argmaxlog∏i=1nP(xi∣θ)argmaxlog\prod _{i=1}^nP(x_i|\theta)argmaxlog∏i=1n​P(xi​∣θ)等价于极小化负对数似然
min:−log∏i=1nP(xi∣θ)min:-log\prod_{i=1}^n P(x_i|\theta)min:−log∏i=1n​P(xi​∣θ),简写:min:−log∏i=1nP(xi)=−∑i=1nlog∏kKpky=−∑i=1n∑k=1Kyk∗logpkmin:- log\prod_{i=1}^nP(x_i)=-\sum_{i=1}^n log\prod_k^K p_k^y=-\sum_{i=1}^n \sum_{k=1}^K y_k*logp_kmin:−log∏i=1n​P(xi​)=−∑i=1n​log∏kK​pky​=−∑i=1n​∑k=1K​yk​∗logpk​
其中P(xi)=∏k=1KpkyP(x_i)=\prod_{k=1}^Kp_k^{y}P(xi​)=∏k=1K​pky​
注意: pk代表该样本预测为类别k的概率p_k代表该样本预测为类别k的概率pk​代表该样本预测为类别k的概率, 本质上等于交叉熵损失函数

关于高斯分布的理解:

我们假设数据服从高斯分布,开始并不知道分布的均值和方差,那我们就需要求这个数据的均值和方差,那怎么求呢?
我们可以通过算法(EM,感知机)来用模型去拟合数据,模型提供预测概率分布,数据服从真实概率分布,随着模型的训练,预测概率分布在逐渐拟合真实概率分布,那如何衡量两个分布的差异?我们用到KL散度,似然函数,交叉熵。接下来我们需要使得两个分布更加接近, 那就需要最小化两个分布的差异(最小化交叉熵…)。模型参数在不断更新,在这个过程中(最小化损失函数)也是在最大化每个预测样本的似然函数,使每个样本更接近真实分布。本质上是在更新预测概率分布的均值和方差,直到最后收敛,我们可以找到最接近真实概率分布的均值和方差了。
如果有两个类别的数据,那么这两个类别的数据分布是不一样的,我们最终要求的是两个高斯分布分别的均值和方差。

模型的EM训练过程,直观的来讲是这样:我们通过观察样本的真实概率值和模型预测概率值的接近程度,来判断一个模型是否拟合良好。然后我们通过调整模型以让新模型更适配采样的真实概率值。反复迭代这个过程很多次,直到两个概率值非常接近时,我们停止更新并完成模型训练。
现在我们要将这个过程用算法来实现,所使用的方法是模型生成的数据来决定似然值,即通过模型来计算数据的期望值。通过更新参数μ和σ来让期望值最大化。这个过程可以不断迭代直到两次迭代中生成的参数变化非常小为止。该过程和k-means的算法训练过程很相似(k-means不断更新类中心来让结果最大化),只不过在这里的高斯模型中,我们需要同时更新两个参数:分布的均值和标准差.

高斯分布/概率分布总结相关推荐

  1. 机器学习(十五)异常检测

    文章目录 Log 一.问题动机(Problem motivation) 1. 直观理解异常检测 2. 正式定义异常检测 3. 异常检测应用案例 ①欺诈检测 ②工业生产领域 ③数据中心的计算机监控 二. ...

  2. PRML(3)--Chapter2(上)-概率分布-二元变量、多项式变量、高斯分布、指数族分布

    PRML第二章上-概率估计 2.1二元变量 2.1.1 beta 分布 2.2 多项式变量 2.3 高斯分布 2.3.1条件高斯分布.2.3.2边缘高斯分布 2.3.3 高斯变量的贝叶斯定理 2.3. ...

  3. 【白板推导系列笔记】数学基础-概率-高斯分布-求联合概率分布

    X∼N(μ,Σ)=1(2π)p2∣Σ∣12exp(−12(x−μ)TΣ−1(x−μ))x∈Rp,r.v.\begin{gathered} X \sim N(\mu,\Sigma)=\frac{1}{( ...

  4. 机器学习中的数学——常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)

    分类目录:<机器学习中的数学>总目录 相关文章: · 常用概率分布(一):伯努利分布(Bernoulli分布) · 常用概率分布(二):范畴分布(Multinoulli分布) · 常用概率 ...

  5. java 概率分布_那些跟高斯分布有些相似的概率分布【1】:Student-t Distribution初探...

    这个系列打算跟大家讲讲一些概率分布,一些大家可能知道但又不那么了解的概率分布,这里我们不会像教科书那么样侧重具体的内容,而是希望大家从理解的角度去重新认识这些概率分布,因为深入的理解才会在你想要解决某 ...

  6. 常用的概率分布:伯努利分布、二项分布、多项式分布、高斯分布、指数分布、拉普拉斯分布和Dirac-delta分布

    伯努利分布(Bernoulli distribution) **伯努利分布:**单个二值随机变量的分布.由单个参数φ∈[0,1]控制. 例:抛硬币,正面朝上的概率. 二项式分布(binomial di ...

  7. 概率,概率分布,高斯分布,高维高斯分布

    文章目录 前言 一.概率与概率密度 二.高斯分布是什么? 三 .高维高斯分布 总结 前言 高斯分布的理解, 它在低维和高维的形式. 一.概率与概率密度 两个基本的概念: 概率:在某事件出现某一结果的可 ...

  8. 概率论中高斯分布(正态分布)介绍及C++11中std::normal_distribution的使用

    高斯分布:最常用的分布是正态分布(normal distribution),也称为高斯分布(Gaussian distribution): 正态分布N(x;μ,σ2)呈现经典的"钟形曲线&q ...

  9. 深度学习需要掌握的 13 个概率分布(附代码)

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 知乎作者:Sophia  来源:深度学习自然语言处理 本文仅用于学术分享 ...

最新文章

  1. 每日一皮:这翻译...真辛苦老外看纪录片纯靠脑补 ...
  2. Opencv实战【1】人脸检测并对ROI区域进行部分处理(变身乔碧萝!!!)
  3. 自动采集壁纸的微信小程序
  4. SpringCloud工作笔记052---各种数据库在java中的连接配置_以及连接驱动
  5. Linux命令解释之chmod
  6. Uncaught SyntaxError: Unexpected token ‘var‘
  7. CSDN资源分享分红2元,哈哈
  8. Java贪吃蛇全代码
  9. 万恶的火狐插件IE Tab Plus+引起的Superfish.com
  10. 视频内容理解相关方法
  11. MarkDown基础语法笔记
  12. 浏览器解析jsx_jsx的本质
  13. 基于C语言设计的一个医院叫号系统
  14. 易捷行云新一代私有云全场景智能统一运维|轻运维之场景化运维
  15. 山水文园集团:向着更美好 稳步前行
  16. python牛顿迭代法求根例题_python求根算法
  17. 时光里,我们都是赶路人
  18. 安卓uc斗鱼html5,斗鱼HTML5播放器
  19. c++ 关于heap的STL用法
  20. Ubuntu系统SSH免密登录,以及SSH免密登录原理

热门文章

  1. 什么是教学用计算机,实用的计算机教学计划3篇
  2. Android studio中将gbk转换为utf-8编码
  3. ASP.NET大型制造业生产ERP网站源码C#大气制造业通用ERP管理系统源码
  4. 深圳高新技术企业补贴政策有哪些?2021深圳高新技术企业补贴政策汇总
  5. loadrunner入门教程(26) --计划操作
  6. jquery mobile android浏览器,我们怎样使用jQuery Mobile实现手机新闻浏览器
  7. vue使用elemtui + xlsx实现excel导入,上传到koa后端
  8. [ IntelliJ IDEA Java开发配置 : 不断完善中]
  9. 电脑为什么不能运行php文件路径,window_windows系统下英雄联盟不能启动 指定路径不存在的解决办法,小编把英雄联盟从别人电脑里 - phpStudy...
  10. 同声翻译器软件的作用你知道吗