看到的一篇

  比较简单容易理解的文章,貌似是电子书的一章告诉你为什么叫二项分布,又为什么叫多项分布。

二项分布

如果掷一枚硬币,正面向上的结局的概率为0.5 。反面向上的结局的概率也是0.5。那么出现正面向上事件或者反面向上事件的概率就是0.5+0.5=1,即二者必居其一。

如果掷两次硬币,根据独立事件的概率乘法定理那么两次都是正面(反面)向上的概率是0.5×0.5=0.25。另外第一个是正第二个是反的出现概率也是0.5×0.5=0.25。同理第一个反第二个正的出现概率也是0.5×0.5=0.25。于是一正一反的概率是前面两个情况的和,即0.25+0.25=2×0.25=0.5。它们的合计值仍然是1。列成表就是:

两个正面的概率

一正一反的概率

两个反面的概率

0.25

2×0.25=0.5

0.25

 

注意到代数学中

(a+b)2=a2+2ab+b2,

而在a=0.5,b=0.5时,有

12=(0.5+0.5)2=0.25+2×0.5×0.5+0.25=1

这说明掷两次硬币的各个结局的出现概率可以通过对二项式的平方展开而得到。顺此,对于掷n次硬币的各种结局的出现概率也可以通过对二项式的n次方的展开而得到。

例如n=3时,有(注意0.5×0.5×0.5=0.125)

13=(0.5+0.5)3=0.125+3×0.125+3×0.125+0.125=

0.125+0.375+0.375+0.125=1

上式4项中的4个概率值0.125、0.375、0.375、0.125分别对应于3正、2正1反、1正2反和3反,这四种结局。

注意到对二项式的展开的牛顿公式:

(a+b)n=an+nan-1b++[n!/m!(n-m)!](an-mbm)+…bn

a,b分别等于0.5代入上式我们就得到n+1项,以其通项而论,它就代表了有n-m个正面m个反面的事件的出现概率。即这种类型的问题(如掷多次硬币)的概率分布恰好可以用二项式展开的牛顿公式表示。而这也就是为什么把这种概率分布类型称为二项分布的原因。

如果a,b并不等于0.5,那么只要把A事件出现的概率以p代入,把B事件的出现概率以(1-p)代入,以上公式仍然正确,(a+b仍然=1)。

所以对于仅有A,B两个结局的随机事件,如果A事件出现概率为p,B事件的出现概率为1-p,那么在n次随机实验中A事件出现n-m 次B事件出现m次的情况(对应一种复合事件)的出现概率P应当是(这里的P是大写的)

P=[n!/m!(n-m)!][pn-m(1-p)m]

注意到上面公式的对称性,它也可以写为

P=[n!/m!(n-m)!][pm(1-p)n-m]

它就是所谓二项分布概型的随机事件的出现概率公式,也是牛顿二项式展开在变量为对应概率值的情况下的通项。它就是本章公式(11.3)的由来。

另外,当p=0.5时,显然[pm(1-p)n-m]总是等于1/(2)n,注意到[p+(1-p)]n=1,所以二项式公式展开的n+1项的各个系数的合计值应当等于2n

上式中并没有p,所以这个系数和公式与p的具体数值无关。一般概率图书中对二项分布多有介绍。

多项分布

把二项分布公式再推广,就得到了多项分布(在一般概率书中很少介绍它,但是热力学中涉及到它)。

某随机实验如果有k个可能结局A1,A2,…,Ak,它们的概率分布分别是p1,p2,…,pk,那么在N次采样的总结果中,A1出现n1次,A2出现n2次,…,Ak出现nk次的这种事件的出现概率P有下面公式:

这就是多项分布的概率公式。把它称为多项式分布显然是因为它是一种特殊的多项式展开式的通项。

我们知道,在代数学里当k变量的和的N次方的展开式 (p1+ p2+…+ p)N是一个多项式,其一般项就是前面的公式给出的值。如果这变量恰好是可能有的各种结局的出现概率,那么,由于这些概率的合计值对应一个必然事件的概率。而必然事件的概率等于1,于是上面的多项式就变成了

(p1+ p2+…+ p)N =1N=1

即此时多项式的值等于1。

因为(p1+ p2+…+ p)N的值等于1。我们也就认为它代表了一个必然事件进行了次抽样的概率(=1,必然事件)。而当把这个多项式可以展开成很多项时,这些项的合计值等于1提示我们这些项是一些互不相容的事件(N次抽样得到的)的对应概率。即多项式展开式的每一项都是一个特殊的事件的出现概率。于是我们把展开式的通项作为A1出现n1次,A2出现n2次,…,Ak出现nk次的这种事件的出现概率。这样就得到了前面的公式。

如果各个单独事件的出现概率p1,p2,…,pk都相等,即p1=p2=…=pk=p(注意这里是小写的p),

注意到p1+p2+…+pk =1,就得到p1=p2 =…=pk =p=1/

把这个值代入多项式的展开式,就使展开式的各个项的合计值满足下式:

∑[ N!/(n1!n2!…nk!)](1/k)N=1

即∑[ N!/(n1!n2!…nk!)]=kN

以上求和中遍及各个ni的一切可能取的正整数值,但是要求各个ni的合计值等于。  即

n1+n2+…nk=N

在热力学讨论物质微观状态的可能个数时,经常用另外的思路引出N!/(n1!n2!…nk!)式。并且称它为热力学几率。它是一个比天文数字还大很多的数,把它称为几率(概率)并不妥当。但是热力学里由于各个微观状态的出现概率相等,这对应我们在前面讨论的p1=p2 =…=pk =p=1/k于是

[N!/(n1!n2!…nk!)](1/kN

就真正具有数学上的概率的含义。换句话说,物理学里的热力学几率[N!/(n1!n2!…nk!)]乘上(1/kN)以后就是数学中定义的(具有归一性)的概率了。

为什么叫二项分布,又为什么叫多项分布?相关推荐

  1. 二项式定理与二项分布、多项式定理与多项分布

    二项式定理与二项分布 二项式定理 二项式定理我们在高中就学过了,即: (a+b)n=(n0)anb0+(n1)an−1b1+....+(nn−1)a1bn−1+(nn)a0bn=∑i=0n(ni)an ...

  2. 伯努利分布,二项分布,多项分布

    师兄给我说,做机器学习的方法有两种:一种是修改公式的那种,另外一种是类比.我觉得我适合的应该就是类比的这种,公式太难了.. 伯努利分布 记住这种分布的话,就开始想抛硬币,只抛一次硬币.正面朝上的概率是 ...

  3. 伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布

    https://blog.csdn.net/michael_r_chang/article/details/39188321 https://www.cnblogs.com/wybang/p/3206 ...

  4. 干货| 详解狄利克雷分布(LDA)、二项分布、Beta分布、多项分布

    最近在撰写笔记 [Sklearn源码学习笔记](含官网样例解读)无监督学习之高斯混合模型 的过程中,官方Sklearn源码中BayesianGaussianMixture()方法涉及到狄利克雷分布相关 ...

  5. 各类分布----二项分布,泊松分布,负二项分布,gamma 分布,高斯分布,学生分布,Z分布...

    伯努利实验: 如果无穷随机变量序列  是独立同分布(i.i.d.)的,而且每个随机变量  都服从参数为p的伯努利分布,那么随机变量  就形成参数为p的一系列伯努利试验.同样,如果n个随机变量  独立同 ...

  6. 机器学习西瓜书各章详细目录定位

    第一章 绪论 1.1 引言(P1) 1.2 基本术语(P2) 1.3 假设空间(P4) 1.4 归纳偏好(P6) 1.5 发展历程(P10) 1.6 应用现状(P13) 1.7 阅读材料(P16)   ...

  7. 漫步数理统计二十二——二项及相关分布

    之前我们介绍了均匀分布与超几何分布,这篇文章我们讨论一些其他在统计中经常使用的分布,首先从二项与相关分布开始. 伯努利试验是一个随机试验,输出为两个相互独立且有穷中的一个,例如成功或失败(男或女,生或 ...

  8. 狄利克雷分布主题模型LDA

    狄利克雷分布主题模型LDA 文章目录 狄利克雷分布主题模型LDA 1.整体把握LDA 2.前提知识 2.1 gamma函数 2.2 四个分布 2.2.1 二项分布 2.2.2 多项分布 2.2.3 B ...

  9. 从幂律分布到特征数据概率分布——12个常用概率分布

    在机器学习领域,概率分布对于数据的认识有着非常重要的作用.不管是有效数据还是噪声数据,如果知道了数据的分布,那么在数据建模过程中会得到很大的启示. 首先,如下图所示8个特征数据概率分布情况(已经做归一 ...

  10. 【机器学习算法】逻辑回归为什么叫逻辑回归

    文章目录 逻辑回归以及为什么叫逻辑回归 从sigmoid函数引出 逻辑回归的统计学模型:伯努利分布 线性回归模型的通式:广义线性模型 指数族分布 逻辑回归以及为什么叫逻辑回归 逻辑回归虽然名字里有回归 ...

最新文章

  1. python爬取动态网页图片_python爬虫之爬取动态加载的图片_百度
  2. idea插件GsonFormat的使用
  3. Swift学习笔记(8)--函数
  4. 莱斯信道衰落下的QPSK误码率分析
  5. tensorflow学习笔记:tf.control_dependencies,tf.GraphKeys.UPDATE_OPS,tf.get_collection
  6. 华为mate20pro权限管理_华为钉子户--谈谈Mate20Pro
  7. 人人都在谈的图数据库到底是个啥?
  8. 假如有Thread1、Thread2、ThreaD3、Thread4四条线程分别统计C、D、E、F四个盘的大小,所有线程都统计完毕交给Thread5线程去做汇总,应当如何实现?
  9. 需求分析的初稿出来了
  10. java拦截器_springMVC入门(八)------拦截器
  11. 张珺 2015/07/13 个人文档
  12. 深入浅出新一代云网络——VPC中的那些功能与基于OpenStack Neutron的实现(二)-带宽控制...
  13. web前端三大主流框架分析对比
  14. 【CASS精品教程】CASS9.1查询功能大全(坐标、长度、面积、方位角)
  15. arping命令解析
  16. 计算机基础知识教程页码,如何设置word文档页码从任意页开始
  17. 计算机桌面保护时间,请教一个屏幕保护的问题,域内的计算机可以设置不同时间的屏幕保护策略吗?...
  18. [含lw+源码等]S2SH+mysql的报刊订阅系统[包运行成功]Java毕业设计计算机毕设
  19. 使用Python调用OUTLOOK发邮件(带附件)
  20. Android 9.0 cmds

热门文章

  1. Quartus II not support the EP2C5F256I8 device,如何解决
  2. 单开双控_单开双控怎么接线
  3. 怎么将手机上保存的CAD图纸发送给好友
  4. python全局变量在哪创建_python设置全局变量
  5. windows server 2012双网卡 实现局域网代理上网
  6. 银行智慧网点如此建设,用银行ATM自助服务终端无线联网方案
  7. 关于 EXT-X-VERSION
  8. 鼓音源混音教程|为什么制作人都偏爱鼓音源、采样制作专辑?|MZD Studios
  9. 追梦算法----马的遍历
  10. 一套完整的MES系统,要这样去搭建