文章目录:

  • 1 生活中的正态分布

  • 2 名字由来

  • 3  剖析细节

  • 4 有偏分布

每个人都相信它(正态分布):实验工作者认为它是一个数学定理,数学研究者认为它是一个经验公式。----加布里埃尔·李普曼

本文主要是为了之后讲解最小二乘法、岭回归等优化方法做个铺垫。

1 生活中的正态分布

生活中女性的身高,

假设你有200个相亲对象,然后你老妈搜集了他们所有人的身高信息,然后以5cm为单位,来数一数每5cm各有多少人。接着用身高为横轴,人数为纵轴,画了下面的图:

这种数据分布就是正态分布,正态分布像是一个小山,两头低,中间高,左右对称,大部分数据集中在平均值,小部分分布在两端

实际上人的分高确实是符合正态分布的。2017年我国18岁及以上成年男性的平均身高是167.1cm,所以167.1的身高就是中国普遍男性身高的数值,如果是150cm或者是190cm都是人数比较少的,处于分布两端的人群。

神奇的地方在于,不管是人的身高,手臂长度,肺活量,还是他们的考试成绩,都符合正态分布。

这是为什么呢?

2 名字由来

正太正态分布为什么不叫“正点”呢?

这个要从这个东西说起,下面这个东西

这个东西叫做高尔顿钉板,你猜猜这是谁发明的?没错,就是维多利亚时期的学者Francis Galton(高尔顿)。他做了这个钉板之后,发现这种形状适用于很多数据,所以他将其命名为“正态分布”(The Normal Distribution).

正态分布的英文“normal”,表示常见的,典型的 , 用来表示这种分布能代表多种多样的数据类型。

3  剖析细节

高尔顿钉板中,每一个小珠子下滚的时候,撞到柱子就会随机的向左走或者向右走。然后一个小珠子一路滚下来会选择多次方向,最终的分布就会接近正态分布。

关键点在于,一个事情经过多个随机的因素的影响,结果似乎就是正态分布

女性身高可能会受父母身高的影响、饮食习惯的影响、是否喜好运动的影响 等等,这些影响类比成高尔顿钉板中的柱子。

此外,还要注意一点就是高尔顿钉板 中,所有珠子的初始状态一致。

4 有偏分布

现实中,也有很多有偏分布,比如在医学中的检测。有一种说法是因为在细胞中,细胞分类是乘法而非加法。所以用log方法来将乘法变成加法,所以log方法也可以把有偏数据变成正态分布。

对横坐标取log:


【个人感想】人生也是如此,左边是贫穷,右边是富有。人生面临无数的随机选择,大部分人落在了中间位置,成为了一般人。少数运气不好的和运气好的人变成了特别穷的人和特别富有的人,但是大部分的我们变成了普通人。我们之所以努力,就是希望在每一次选择的时候,可以做出更好的选择,让我们的未来更好。共勉!

- END -

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/662nyZF本站qq群1003271085。加入微信群请扫码进群(如果是博士或者准备读博士请说明):

【数学基础】正态分布为什么如此常见?相关推荐

  1. SLAM的数学基础(3):几种常见的概率分布的实现及验证

    转自:https://www.cnblogs.com/cyberniklee/p/7977142.html 分布,在计算机学科里一般是指概率分布,是概率论的基本概念之一.分布反映的是随机或某个系统中的 ...

  2. scipy 概率 泊松分布_概率论中常见分布总结以及python的scipy库使用:两点分布、二项分布、几何分布、泊松分布、均匀分布、指数分布、正态分布......

    概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布. 离散概率分布也称为概率质量函数(probability mass function).离散概率分布的例子有 ...

  3. 概率论中常见分布总结以及python的scipy库使用:两点分布、二项分布、几何分布、泊松分布、均匀分布、指数分布、正态分布...

    概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布. 离散概率分布也称为概率质量函数(probability mass function).离散概率分布的例子有 ...

  4. 两个多元正态分布的KL散度、巴氏距离和W距离

    ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 追一科技 研究方向 | NLP.神经网络 正态分布是最常见的连续型概率分布之一.它是给定均值和协方差后的最大熵分布(参考<&quo ...

  5. 正态分布的峰度和偏度分别为_ML中的正态分布

    机器学习的本质就是用概率分布来解释世界上的所有事情,并用各种各样的模型和算法来逼近目标的概率分布,而概率分布的核心就是正态分布.正态分布又叫高斯分布,是机器学习理论中最常见的分布. 正态分布流行的原因 ...

  6. python概率论_概率论中常见分布总结以及python的scipy库使用

    概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布. 离散概率分布也称为概率质量函数(probability mass function).离散概率分布的例子有 ...

  7. matlab中表示拉普拉斯分布_神奇的正态分布

    在统计学中有各种各样的分布,称为统计分布,例如有离散型的伯努利分布.二项分布.超几何分布.几何分布.负二项分布.泊松分布,有连续型的均匀分布.指数分布.t分布.卡方分布.F分布.正态分布等等,其中正态 ...

  8. Python实战:如何生成正态分布数据?

    Python实战:如何生成正态分布数据? 在统计学中,正态分布是最常见的概率分布之一.在数据分析.机器学习及其他领域,我们经常需要生成符合正态分布的随机数.Python作为一种流行的编程语言,在实现正 ...

  9. 统计学习 | 正态分布 Normal Distribution

    参考资料 统计学-1:判断数据是否满足正态分布 - 知乎 (zhihu.com) 正态分布!你真的了解么?_检验 (sohu.com) 正态检验 (Normality Test)--常见方法汇总与简述 ...

最新文章

  1. RRDTool 存储原理简介——基于时间序列的环型数据库
  2. vSphere vCenter 4.0 安装图解
  3. 如何在Mac下显示Finder中的所有文件
  4. 日常生活中怎样利用计算机的,数据存储与管理在日常生活中的三种方式
  5. 5行Python就能爬取 3000+ 上市公司的信息?
  6. Android: 创建一个AlertDialog对话框,必须按确定或取消按钮才能关闭对话框,禁止按[返回键]或[搜索键]关闭
  7. php 网页转pdf
  8. yapi 插件_精神多了,当Swagger遇上YApi,瞬间高大上了!
  9. 新款苹果电脑_“Mac历史性的一天”!别了,英特尔!苹果电脑将采用自研芯片,公司股价又创新高...
  10. 很多人搞不清楚的两个类Vector,ArrayList
  11. NLP学习—11.实现基于PyTorch与LSTM的情感分类
  12. python 代码行数统计工具_Python实现代码行数统计工具
  13. oracle union orderby,Oracle中union 和 order by 的联用
  14. c语言小学生入门自学,啊哈C语言:小学生坐在马桶上都可以读懂的C语言编程入门书 PDF 扫描版[20M]...
  15. Golang代码注释规范及goland代码注释模板配置
  16. 分享一个AUTO uninstaller|AUTOCAD 安装失败解决方案
  17. 1506.01186-Cyclical Learning Rates for Training Neural Networks
  18. 平安科技表格识别——原理解读
  19. 使用C++让鼠标指针抖动
  20. Centos Linux 单机安装 HBase 、使用 HBase

热门文章

  1. 记录些实用的linux指令串
  2. libgdx 学习笔记七 Libgdx模块概述
  3. Silverlight实用窍门系列:40.Silverlight中捕捉视频,截图保存到本地【附带实例源码】...
  4. Qt使用UDp通信、套接字socket的成员函数bind()的作用
  5. linux 列出内存/cpu使用率前10的进程
  6. POJ3686 The Windy's 【费用流】*
  7. Java语言基础JavaScript
  8. uva 755 487--3279
  9. 方法参数是结构体指针,报错信息是空指针怎么办
  10. 北斗导航 | 现代授时技术——北斗GPS导航系统