生活中常见的均值为算术平均值(或平均数):将所有的数字加起来,然后除以数字的个数。

注:μ表示平均数,∑x表示数字的和,n表示数字个数

或使用频数计算算术平均值

注:∑f表示频数和,∑fx表示频数与数字的乘积和

生活中常遇到新闻上说当前某个城市的平均房价,平均工资。特别是平均工资特别让我们气愤,总感觉自己在拖国家后腿。其实我们是被平均了

姓名 收入(月)
张三 8000
王二 8000
李四 10000
张五 8000
陈六 5000
刘七 5000
马云 60000000
马化腾 50000000

如果按照算术平均数进行计算,上面个八个人的平均月收入是13755687.5,不难看出平均月收入远低于平均收入。相对普通人的月收入,二马的收入被称为异常值。异常数据的存在经常导致的问题是数据倾斜。

当数据向右倾斜时,平均值大于大部分数字;当数据向左倾斜时,平均值小于大部分数字。

注:除上述图形的形式观察数据倾斜情况外,在数据统计过程中,我们常用方差,标准差等观察数据分布情况,这些在之后会说到

当偏斜数据和异常值使平均值产生误导时,我们需要用其他方式表示典型值,例如中间值,即中位数。首先我们把需要的值按照升序或者降序进行排列,取一列数中的中间的数字,如果该列数据为偶数,则取中间两个数的算术平均数。例如上面的月收入数据中间数为(8000,8000),取平均值得中位数为8000。中位数的主要特点就是不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。

相比与平均数,如果数据未出现倾斜,中位数等于平均数;如果数据向右倾斜,则中位数小于平均数;反之则大于。

相比于老外,中国人都是无神论者,从古至今都是敢与天搏和地斗,用毛泽东的话说:“敢叫日月换新颜”。但是有些人就是命好,赶上拆迁了,个人资产瞬间提升。利于郑州的一个城中村的家庭存款情况汇总如下:

家庭存款(万) 10 20 30 3000 3500 5000
户数 2 5 3 3 5 2

不难算出上述表格中家庭存款平均数与中位数相等均为1515万。但是中位数与平均数都不能体现该村家庭存款的真实情况,这时我们需要另一个平均数——众数。

众数是数据集中出现频率最高的数值,与平均数与中位数不一样的是,众数是数据集中的一个数值,且该数值在数据集中频繁出现。有时,数据的众数可以不止一个。如果有一个以上的数值具有最大频数,则每一个这样的数值都是众数。如果数据看上去体现了多趋势或多批数据,那么我们就为每一批数据给出一个众数。如果一批数据有两个众数,则被称为双峰数据。

众数不仅能用于数值型数据,还能用于类别数据,众数是唯一能用于类别数据平均数。具有最高频数的组被称为众数组。

统计中常用的统计方法:观察法、金氏插入法、皮尔逊经验法

1、观察法:若数据已归类,则出现频数最多的数据即为众数;若数据已分组,则频数最多的那一组的组中值即为众数。用观察法求得的众数,一般是粗略众数。

2、金氏插入法:计算公式如下或 

式中L 表示众数所在组的精确下限,U 表示众数所在组的精确上限,fa 为与众数组下限相邻的频数,fb为与众数组上限相邻的频数, i 为组距。

3、皮尔逊经验法:计算公式

式中ξ 为样本均值, Md 为中数,用皮尔逊公司计算所得众数近似于理论众数,常称为皮尔逊近似众数。众数是皮尔逊(Pearson,K.)最先提出并在生物统计学中使用的,以上是数据出自于离散型随机变量时求众数的方法,对于连续型随机变量ξ ,若概率密度函数为 f ,且 f 恰有一个最大值,则此最大值称为ξ 的众数,有时也把 f 的极大值称为众数; f 有两个以上极大值时,亦称复众数。

注:该文中部分内容参考了《深入浅出统计学》,百度百科

机器学习中的数学(2):均数相关推荐

  1. 机器学习中的数学 人工智能深度学习技术丛书

    作者:孙博 著 出版社:中国水利水电出版社 品牌:智博尚书 出版时间:2019-11-01 机器学习中的数学 人工智能深度学习技术丛书 ISBN:9787517077190

  2. 机器学习中的数学:一份新鲜出炉的热门草稿

    来源:机器之心 本文约1500字,建议阅读5分钟. 本文为你分享近日<Mathematics for Machine Learning>的全部草稿已放出,我们整理了这本书的简要概述. 近日 ...

  3. 机器学习中的数学知识(part4)--拟牛顿法

    学习笔记,仅供参考,有错必究 文章目录 机器学习中的数学知识 拟牛顿法 面临的问题(局部极小/鞍点) 机器学习中的数学知识 拟牛顿法

  4. 机器学习中的数学知识(part3)--凸优化

    学习笔记,仅供参考,有错必究 文章目录 机器学习中的数学知识 凸优化 非凸优化 机器学习中的数学知识 凸优化 下面是实际问题中常见的凸集,记住它们对理解后面的算法非常有帮助. n n

  5. 机器学习中的数学知识(part2)

    学习笔记,仅供参考,有错必纠 参考自:<机器学习与应用>–雷明 文章目录 机器学习中的数学知识 泰勒展开 梯度下降法 牛顿法 机器学习中的数学知识 泰勒展开 梯度下降法

  6. 机器学习中的数学知识(part1)

    学习笔记,仅供参考,有错必纠 参考自:<机器学习与应用>–雷明 文章目录 机器学习中的数学知识 偏导数与梯度 雅克比矩阵 Hessian矩阵 奇异值分解 向量与矩阵求导 机器学习中的数学知 ...

  7. 我们该如何学习机器学习中的数学

    数学在机器学习中非常重要,不论是在算法上理解模型代码,还是在工程上构建系统,数学都必不可少.通常离开学校后很难有机会静下心学习数学知识,因此我们最好能通过阅读小组或读书会等形式营造环境,并专注学习那些 ...

  8. 机器学习中的数学(七)--凸优化的基础知识

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

  9. 机器学习中的数学(六)--信息论与激活函数

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

  10. 机器学习中的数学(四)--线性代数

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

最新文章

  1. mysql表一定要主键吗_最滋补五脏的食物表,一定要给家人存下
  2. 检测子进程的结束返回状态,status的取值可以是哪些?(简析)
  3. js动态改变下拉菜单内容示例 .
  4. foxmail、outlook发送邮件,进度条很慢
  5. CodeForces - 364A Matrix(思维+数学)
  6. C++11的for循环使用auto的新用法
  7. java怎么给list集合排序_java list集合排序按某一属性排序操作
  8. tab vue 竖排_vue 实现tab切换保持数据状态
  9. HTML表格属性跨列,HTML表格的使用 与 跨行跨列
  10. APP UI自动化测试:框架选择、环境搭建、脚本编写……全总结
  11. Camshift算法
  12. 校园二手交易平台项目总结 ‎2013‎年‎12‎月‎23‎日,‏‎5:57:29
  13. 2021小结暨2022打脸计划
  14. android 检查电话号码是否合理(含大陆和香港格式)
  15. 解决警告Presenting view controllers on detached view controllers is discouraged 以及引申
  16. C语言之动态内存管理
  17. 看《大话西游》,你哭了么
  18. 接口测试中Post方法怎么测?
  19. rockchip中的vop
  20. 微信文件删除了怎么恢复,2个实测有效的办法推荐

热门文章

  1. 第一次走绿道,从长岭陂到梅林水库_我是亲民_新浪博客
  2. ROS::机器人系统分布式配置
  3. 华为荣耀+T8950
  4. 光纤传感器实验模块_光纤传感器实习模块_实习3振动丈量试验模块doc
  5. python演示动画_Python八大行星漂亮动画演示-Go语言中文社区
  6. 数据源(DataSources)
  7. 机器学习实验《多源数据集成、清洗和统计》 C++ 实现
  8. 安卓手机通过蓝牙与单片机通信
  9. STM32CubeMX(8)——利用HC-05实现两个单片机之间的通信
  10. 元宇宙里的性、亲密关系与恋爱?你有没有想过这个问题?