为什么在很多应用中常采用正态分布/高斯分布、中心极限定理
为什么在很多应用中常采用正态分布/高斯分布?
当我们由于缺乏关于某个实数上分布的先验知识而不知道该选择怎么样的形式时,正态分布是默认的比较好的选择,有两个原因:
一,我们想要建模的很多分布的真实情况是比较接近正态分布的。 中心极限定理说明很多独立随机变量的和近似服从正态分布。
二,在具有相同方差的所有可能的概率分布中,正态分布在实数上具有最大的不确定性。 因此,我们可以认为正态分布是对模型加入的先验知识量最少的分布。
补充中心极限定理:
客观背景:在实际中有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的,而其中每一个别因素在总的影响中所起的作用都是微小的,这种随机变量往往近似服从正态分布。
这一事实,表明了正态分布的重要性,及为什么实际应用中会常遇到正态分布。另一方面,它提供了独立同分布随机变量之和的近似分布,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以采用正态分布来近似。
常见的三个中心极限定理:
A、独立同分布的中心极限定理:加了同分布
相互独立同分布的随机变量(Xi)之和:随机变量(Z),Z服从正态分布。Xi可以服从正态分布,也可以服从二项分布,等等。
相互独立同分布的随机变量(Xi,i=1,2,…)之和即大量相互独立的随机因素;
随机变量X即综合影响。
B、李雅普诺夫中心极限定理:
无论各个随机变量Xi(i=1,2,…,n)服从什么分布,它们的和 当n很大时,Z就近似服从正态分布。
这就是为什么实际应用中为什么经常遇到正态分布的一个重要原因,说明了正态分布的重要性。因为,在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和。即中心极限定理说明独立随机变量的和近似服从正态分布(要求加项的个数充分大)。
Eg,在任意时刻,一个城市的用电量是大量用户用电量的总和;一个物理实验的测量误差是许多观察不到的、可加的微小误差所合成的,这个测量误差往往近似服从正态分布。
三个要素:
变量Xi:
随机、
相互独立、
相加(综合/总的)
随机变量Xi之和Z:Z=X1+X2+X3+… X~正态分布。
C、棣(di)莫弗-拉普拉斯中心极限定理(A的特殊情况):
要求各个相互独立的随机变量Xi服从二项分布。该定理说明了正态分布是二项分布的极限分布。
这篇博文特别生动形象,推荐:
https://www.matongxue.com/madocs/589.html
数学研究者认为正态分布是一个经验公式。
文章里用高尔顿钉板装置,生动展示了正态分布的产生过程:
弹珠往下滚时,撞到钉子就会随机选择往左走还是往右走;
一颗弹珠一路滚下来会多次选择方向(很多颗钉子),所有弹珠掉下去后最终的分布神奇地接近正态分布的图形。
为什么在很多应用中常采用正态分布/高斯分布、中心极限定理相关推荐
- 正态分布与中心极限定理
正态分布 定义 正态分布(英语:normal distribution)又名高斯分布(英语:Gaussian distribution),是一个非常常见的连续概率分布.正态分布在统计学上十分重要,经常 ...
- 大数定理、正态分布、中心极限定理
大数定理.正态分布.中心极限定理 坑 *中心极限定理说的是,每次抽样后样本的均值,服从正态分布. *大数定理说的是,随着样本量的增加,样本的均值,接近于总体的均值(切比雪夫大数定律).还可以这样理解: ...
- 中心极限定理_统计学基础知识3——正态分布与大数定律、中心极限定理
正态分布,也称常态分布,又名高斯分布. 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线. 若随机变量X服从一个数学期望为μ.方差为σ^2的正态分布,记为N(μ,σ ...
- 误区:思维中常犯的6个基本错误
原书名:Don'tBelieveEverythingYouThink:The6BasicMistakesWeMakeinThinking 中文书名:误区:思维中常犯的6个基本错误 作者:ThomasE ...
- c语言错误出在花括号上,初学者在学习c语言编程过程中常出现的错误分析
在高校经常中开设的第一科关于程序设计的语言就是C语言,这种语言有很多优势,比如说使用比较灵活,功能比较强大,可以用于编写程序.软件,但是对于初学者来说, 1 0 8 应用方法论 22第霸 0赫 6乱 ...
- Python培训常识:Python面试中常被问到的几种设计模式要知道
学习Python技术大家都是为了日后能够找到适合自己的工作岗位,那么除了要学习好Python技术外,对于面试环节的问题也要有所了解,本期小编为大家介绍的Python培训教程就算关于Python面试中常 ...
- 统计计量 | 实证研究中常犯的18个统计学错误, 避坑防雷指南!
来源:知乎 本文约2500字,建议阅读5分钟 本文为你介绍统计学中18个常见错误. 1 变量之间关系可以分为两类 函数关系:反映了事务之间某种确定性关系: 相关关系:两个变量之间存在某种依存关系,但二 ...
- e - 数据结构实验之查找五:平方之哈希表_面试中常被问到的Hash表,你了解吗
#新人扶持计划# Hash表在面试中经常被问到,今天我们来了解下. Hash表也称散列表,也有直接译作哈希表,Hash表是一种特殊的数据结构,它同数组.链表以及二叉排序树等相比较有很明显的区别,它能够 ...
- 微型计算机中常体积的,微型计算机原理及应用第2章.ppt
微型计算机原理及应用第2章 第2章 微型计算机的基本组成电路 2.1 算术逻辑单元 2.2 触发器 2.3 寄存器 2.4 三态输出电路 2.5 总线结构 2.6 存储器 习题 任何一个复杂的电路系统 ...
- 【视频相关】视频中常出现的参数解释——2018年6月16日
视频中常出现的参数解释 [帧 Frame] 帧速率(FPS,frame per second 帧率):每秒钟出现的帧数 由胶片概念的产生而出现,把静态的连续画面进行播放以达到动态影像需要每秒出现8格, ...
最新文章
- 一天一个shell实例(3)定时备份文件(转)
- r语言 聚类求和_R语言聚类分析,如何导出将分类结果?
- mysql表创建在哪_mysql创建表命令是哪句
- 程序员们有福了:独立于GUI的Java应用框架 Reflex 诞生了!
- NEO智能合约开发(一)不可能完成的任务
- 上传问题分析2--文件重名
- 自断前程,未来80%IT工作将实现自动化
- mysql 连接 指定字符集_关于Mysql连接池配置指定字符集的问题
- MFC关键技术-命令传递机制
- linux命令之history命令
- LeetCode Solutions : Reorder List
- 二.激光SLAM框架学习之A-LOAM框架---介绍及其演示
- java 父类中的this_父类方法中的this
- 【CoreBluetooth】iOS 系统蓝牙框架
- Linux ldd时某个依赖库so not found的一种特殊情形
- EhCache的使用
- 卡口和电子警察的区别
- Chrome对开发有用的插件
- PDF软件推荐——Sumatra PDF - imsoft.cnblogs
- 飞鸽短信平台发送国际短信