高斯分布/概率分布总结
频率派——统计机器学习
频率派认为θ\thetaθ是未知的变量,XXX服从概率分布,然后通过极大似然估计求参。
似然:P(X∣θ)P(X|\theta)P(X∣θ),X是确定的,而θ\thetaθ是变量,它描述对于不同的θ\thetaθ,X出现的概率是多少。所以我们需要最大化似然函数P(X∣θ)P(X|\theta)P(X∣θ),来求出最适合的参数。
高斯分布
在实际生活中,很多问题的数据可以被建模成包含一定噪声的高斯分布模型
高斯分布模型是具有如下概率分布的模型:θ:(u,o)\theta:(u,o)θ:(u,o)
p(x∣θ)=12Πexp−(x−u)22o2p(x|\theta)=\frac{1}{\sqrt{2Π}}exp^{-\frac{(x-u)^2}{2o^2}}p(x∣θ)=2Π1exp−2o2(x−u)2,它代表随机变量xix_ixi取不同值的概率大小,u表示高斯分布的均值,o代表分布的标准差。
假设有一批n个样本的数据服从高斯分布,data=(x1,x2...xn)n,pdata=(x_1,x_2...x_n)_{n,p}data=(x1,x2...xn)n,p每个xix_ixi的似然函数是p(xi∣θ)p(x_i|\theta)p(xi∣θ),它表达每个样本在不同θ\thetaθ下的出现的概率。
那么所有data的对数似然是logP(X∣θ)=log∏i=1nP(xi∣θ)=∑i=1nlogP(xi∣θ)=∑log12Πexp−(x−u)22o2logP(X|\theta)=log\prod_{i=1}^nP(x_i|\theta)=\sum_{i=1}^nlogP(x_i|\theta)=\sum log\frac{1}{\sqrt{2Π}}exp^{-\frac{(x-u)^2}{2o^2}}logP(X∣θ)=log∏i=1nP(xi∣θ)=∑i=1nlogP(xi∣θ)=∑log2Π1exp−2o2(x−u)2
下面我们需要极大化似然函数来求参θ:(方差,标准差)\theta:(方差,标准差)θ:(方差,标准差):
argmaxlog∏i=1nP(xi∣θ)argmaxlog\prod _{i=1}^nP(x_i|\theta)argmaxlog∏i=1nP(xi∣θ)等价于极小化负对数似然
min:−log∏i=1nP(xi∣θ)min:-log\prod_{i=1}^n P(x_i|\theta)min:−log∏i=1nP(xi∣θ),简写:min:−log∏i=1nP(xi)=−∑i=1nlog∏kKpky=−∑i=1n∑k=1Kyk∗logpkmin:- log\prod_{i=1}^nP(x_i)=-\sum_{i=1}^n log\prod_k^K p_k^y=-\sum_{i=1}^n \sum_{k=1}^K y_k*logp_kmin:−log∏i=1nP(xi)=−∑i=1nlog∏kKpky=−∑i=1n∑k=1Kyk∗logpk
其中P(xi)=∏k=1KpkyP(x_i)=\prod_{k=1}^Kp_k^{y}P(xi)=∏k=1Kpky
注意: pk代表该样本预测为类别k的概率p_k代表该样本预测为类别k的概率pk代表该样本预测为类别k的概率, 本质上等于交叉熵损失函数
关于高斯分布的理解:
我们假设数据服从高斯分布,开始并不知道分布的均值和方差,那我们就需要求这个数据的均值和方差,那怎么求呢?
我们可以通过算法(EM,感知机)来用模型去拟合数据,模型提供预测概率分布,数据服从真实概率分布,随着模型的训练,预测概率分布在逐渐拟合真实概率分布,那如何衡量两个分布的差异?我们用到KL散度,似然函数,交叉熵。接下来我们需要使得两个分布更加接近, 那就需要最小化两个分布的差异(最小化交叉熵…)。模型参数在不断更新,在这个过程中(最小化损失函数)也是在最大化每个预测样本的似然函数,使每个样本更接近真实分布。本质上是在更新预测概率分布的均值和方差,直到最后收敛,我们可以找到最接近真实概率分布的均值和方差了。
如果有两个类别的数据,那么这两个类别的数据分布是不一样的,我们最终要求的是两个高斯分布分别的均值和方差。
模型的EM训练过程,直观的来讲是这样:我们通过观察样本的真实概率值和模型预测概率值的接近程度,来判断一个模型是否拟合良好。然后我们通过调整模型以让新模型更适配采样的真实概率值。反复迭代这个过程很多次,直到两个概率值非常接近时,我们停止更新并完成模型训练。
现在我们要将这个过程用算法来实现,所使用的方法是模型生成的数据来决定似然值,即通过模型来计算数据的期望值。通过更新参数μ和σ来让期望值最大化。这个过程可以不断迭代直到两次迭代中生成的参数变化非常小为止。该过程和k-means的算法训练过程很相似(k-means不断更新类中心来让结果最大化),只不过在这里的高斯模型中,我们需要同时更新两个参数:分布的均值和标准差.
高斯分布/概率分布总结相关推荐
- 机器学习(十五)异常检测
文章目录 Log 一.问题动机(Problem motivation) 1. 直观理解异常检测 2. 正式定义异常检测 3. 异常检测应用案例 ①欺诈检测 ②工业生产领域 ③数据中心的计算机监控 二. ...
- PRML(3)--Chapter2(上)-概率分布-二元变量、多项式变量、高斯分布、指数族分布
PRML第二章上-概率估计 2.1二元变量 2.1.1 beta 分布 2.2 多项式变量 2.3 高斯分布 2.3.1条件高斯分布.2.3.2边缘高斯分布 2.3.3 高斯变量的贝叶斯定理 2.3. ...
- 【白板推导系列笔记】数学基础-概率-高斯分布-求联合概率分布
X∼N(μ,Σ)=1(2π)p2∣Σ∣12exp(−12(x−μ)TΣ−1(x−μ))x∈Rp,r.v.\begin{gathered} X \sim N(\mu,\Sigma)=\frac{1}{( ...
- 机器学习中的数学——常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)
分类目录:<机器学习中的数学>总目录 相关文章: · 常用概率分布(一):伯努利分布(Bernoulli分布) · 常用概率分布(二):范畴分布(Multinoulli分布) · 常用概率 ...
- java 概率分布_那些跟高斯分布有些相似的概率分布【1】:Student-t Distribution初探...
这个系列打算跟大家讲讲一些概率分布,一些大家可能知道但又不那么了解的概率分布,这里我们不会像教科书那么样侧重具体的内容,而是希望大家从理解的角度去重新认识这些概率分布,因为深入的理解才会在你想要解决某 ...
- 常用的概率分布:伯努利分布、二项分布、多项式分布、高斯分布、指数分布、拉普拉斯分布和Dirac-delta分布
伯努利分布(Bernoulli distribution) **伯努利分布:**单个二值随机变量的分布.由单个参数φ∈[0,1]控制. 例:抛硬币,正面朝上的概率. 二项式分布(binomial di ...
- 概率,概率分布,高斯分布,高维高斯分布
文章目录 前言 一.概率与概率密度 二.高斯分布是什么? 三 .高维高斯分布 总结 前言 高斯分布的理解, 它在低维和高维的形式. 一.概率与概率密度 两个基本的概念: 概率:在某事件出现某一结果的可 ...
- 概率论中高斯分布(正态分布)介绍及C++11中std::normal_distribution的使用
高斯分布:最常用的分布是正态分布(normal distribution),也称为高斯分布(Gaussian distribution): 正态分布N(x;μ,σ2)呈现经典的"钟形曲线&q ...
- 深度学习需要掌握的 13 个概率分布(附代码)
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 知乎作者:Sophia 来源:深度学习自然语言处理 本文仅用于学术分享 ...
最新文章
- 每日一皮:这翻译...真辛苦老外看纪录片纯靠脑补 ...
- Opencv实战【1】人脸检测并对ROI区域进行部分处理(变身乔碧萝!!!)
- 自动采集壁纸的微信小程序
- SpringCloud工作笔记052---各种数据库在java中的连接配置_以及连接驱动
- Linux命令解释之chmod
- Uncaught SyntaxError: Unexpected token ‘var‘
- CSDN资源分享分红2元,哈哈
- Java贪吃蛇全代码
- 万恶的火狐插件IE Tab Plus+引起的Superfish.com
- 视频内容理解相关方法
- MarkDown基础语法笔记
- 浏览器解析jsx_jsx的本质
- 基于C语言设计的一个医院叫号系统
- 易捷行云新一代私有云全场景智能统一运维|轻运维之场景化运维
- 山水文园集团:向着更美好 稳步前行
- python牛顿迭代法求根例题_python求根算法
- 时光里,我们都是赶路人
- 安卓uc斗鱼html5,斗鱼HTML5播放器
- c++ 关于heap的STL用法
- Ubuntu系统SSH免密登录,以及SSH免密登录原理
热门文章
- 什么是教学用计算机,实用的计算机教学计划3篇
- Android studio中将gbk转换为utf-8编码
- ASP.NET大型制造业生产ERP网站源码C#大气制造业通用ERP管理系统源码
- 深圳高新技术企业补贴政策有哪些?2021深圳高新技术企业补贴政策汇总
- loadrunner入门教程(26) --计划操作
- jquery mobile android浏览器,我们怎样使用jQuery Mobile实现手机新闻浏览器
- vue使用elemtui + xlsx实现excel导入,上传到koa后端
- [ IntelliJ IDEA Java开发配置 : 不断完善中]
- 电脑为什么不能运行php文件路径,window_windows系统下英雄联盟不能启动 指定路径不存在的解决办法,小编把英雄联盟从别人电脑里 - phpStudy...
- 同声翻译器软件的作用你知道吗