1. 前言


统计学是应用数学的一个分支,主要通过利用 概率论 建立 数学模型 ,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。

2. 统计学中的基本概念


2.1 统计数据的类型


2.1.1 按计量尺度划分

2.1.2 按收集方法划分

2.1.3 按时间状况划分

2.2 样本和总体


2.3 参数和统计量


2.4 变量


3 描述性统计


3.1 集中趋势分析

3.1.1 众数

3.1.2 中位数






3.1.3 平均数

3.1.3.1 算术平均数


3.1.3.2 加权平均数


3.1.3.3 几何平均数

3.1.4 四分位数

3.1.5 众数、中位数、平均数的比较、关系以及应用

3.2 离散程度分析


3.2.1 分类型数据:异众比率


3.2.2 顺序型数据:四分位差

3.2.3 数据型数据:极差

极差:极差为数据样本中的最大值与最小值的差值:
R = m a x ( i ) − m i n ( i ) R = \ max(i)-min(i)\, R= max(i)−min(i)
是所有方式中最为简单的一种,它反应了数据样本的数值范围,是最基本的衡量数据离散程度的方式,受极值影响较大。

如在数学考试中,一个班学生得分的极差为60,放映了学习最好的学生与学习最差的学生得分差距为60.

3.2.4 数据型数据:平均差

平均差:即,
M d = ∑ i = 1 n ∣ x i − x ˉ ∣ n M_{d} = \frac{\sum_{i=1}^{n}\left |x_{i} -\bar{x} \right |}{n} Md​=n∑i=1n​∣xi​−xˉ∣​

针对分组数据为:
M d = ∑ i = 1 n ∣ x i − x ˉ ∣ f i n M_{d}=\frac{\sum_{i=1}^{n}\left |x_{i} -\bar{x} \right |f_{i}}{n} Md​=n∑i=1n​∣xi​−xˉ∣fi​​
各变量值与平均值的差的绝对值之和除以总数n,平均差以平均数为中心,能全面准确的反应一组数据的离散状况,平均差越大,说明数据离散程度越大,反之,离散程度越小。

3.2.5 数据型数据:方差或标准差



3.2.6 自由度

3.2.7 相对位置的度量:标准分数

3.2.8 相对离散程度:离散系数


3.3 分布的形状


3.3.1 偏态系数

3.3.2 峰态系数

4. 参数估计与假设检验

4.1 参数估计


4.1.1 估计量与估计值

4.1. 评价估计量的标准

4.1.3 点估计

4.1.4 区间估计



4.2 假设检验


4.2.1 什么是假设

4.2.2 原假设

4.2.3 备择假设

4.2.4 两类错误

4.2.5 假设检验的流程

4.2.6 双侧检验与单侧检验

4.2.7 利用P值进行决策

4.3 一个总体参数的推断


4.3.1 总体均值的推断

4.3.1.1 方差已知或未知:大样本

案例 1 : 区间估计

案例 2 : 假设检验(总体方差已知)

案例 3 : 假设检验(总体方差未知)

4.3.1.2 方差已知:小样本

案例1:区间估计

案例2:假设检验

4.3.1.3 方差未知:小样本


案例1:区间估计

案例2:假设检验

4.3.2 总体方差的推断

案例1:区间估计

案例2:假设检验

4.3.3 小结

4.4 两个总体参数的推断


4.4.1 方差已知或未知:大样本

案例1:区间估计

4.4.2 方差未知但相等:小样本

案例1:区间估计

4.4.3 两个总体均值之差的估计:小样本

案例1:区间估计


案例2:假设检验

4.5 多个总体参数的推断


4.5.1 方差分析

4.5.1.1 什么是方差分析

4.5.1.2 方差分析中的相关术语



4.5.1.3 方差分析的思想和原理

4.5.1.4 方差分析中的基本假定



4.5.1.5 方差分析问题的一般提法

4.5.2 单因素方差分析

4.5.2.1 提出假设

4.5.2.2 构造检验统计量











4.5.2.3 统计决策

4.5.2.2 方差分析表

4.5.2.4 关系强度的测量


4.5.3 方差中的多重比较



4.6 多分类数据频数的检验——卡方检验


数据分析之统计知识总结相关推荐

  1. 知乎好问 | 数据分析到底需要哪些能力?

    数据分析师的能力模型是数据分析面试的时候,常会被问到的一个问题,对这个问题的理解能够体现出候选人对这一职位的理解和未来发展的思考. 以我的理解来讲,数据分析师的元能力是问题解决能力,此外,解决更负责的 ...

  2. 【转载】几封读者来信的回复

    作者博客地址 趁着中秋期间,终于能抽一些闲暇的时间(感谢我的太太),集中整理了一下邮件.有朋友邮件问到自己正在从事.或即将进入数据科学领域时,碰到的困惑.再回想,这几年也经常面试候选人,每当我以抱歉结 ...

  3. 软件工程师薪水_13个薪水最高的技术工作软件工程师可以致力于提高薪水

    软件工程师薪水 如果您是计算机科学专业的毕业生或正在考虑的人 在软件开发界从事职业或有经验的人 正在考虑他的下一个职业发展但不确定的程序员 您应该去哪个领域,然后您来对地方了. 在本文中,我将告诉您您 ...

  4. 数据分析统计知识—描述性统计

    整理一下自己所掌握的数据分析中涉及的统计学知识点,参考的文章或链接会放在下面,此篇为描述性统计相关,涵盖的并不全面,后续会慢慢的完善,如有纰漏欢迎指正~ 目录 知识点参考来源 一.样本常见属性 1.1 ...

  5. R语言统计入门课程推荐——生物科学中的数据分析Data Analysis for the Life Sciences

    Data Analysis for the Life Sciences是哈佛大学PH525x系列课程--生物医学中的数据分析(PH525x series - Biomedical Data Scien ...

  6. pandas 数据分析 相关性_探索 COVID-19 新冠数据来学习 Pandas

    来源:python中文社区 本文约2100字,建议阅读6分钟. 使用 pandas 数据分析工具来学习一些基本的 pandas 命令,并探索数据集中包含的内容. 欧洲疾病预防控制中心(https:// ...

  7. 清华大数据能力提升项目《数据分析方法》选课开始 !(附旁听名额)

    大数据背景下,信息类专业人才在各个行业的需求量巨大的同时,也在综合能力上提出了新的要求,不仅需要掌握对大数据进行高效处理的工具和平台搭建.分析和处理的理论方法,而且需要数据人才对行业知识的了解及应用. ...

  8. 心得丨一文告诉你想学数据分析该读什么书、从哪本读起

    作者:三郎 因工作原因要学习一些数据的知识,从人人都是产品经理网站上并没有找到一篇从入门到进阶成体系的文章,且查找的分享都是数据体系中一个分支的分支,整体看起来烟雾缭绕,经一位前辈点播还是先从书籍中建 ...

  9. Python数据分析很难学?60天就够了!

    广泛被应用的数据分析 谷歌的数据分析可以预测一个地区即将爆发的流感,从而进行针对性的预防:淘宝可以根据你浏览和消费的数据进行分析,为你精准推荐商品:口碑极好的网易云音乐,通过其相似性算法,为不同的人量 ...

最新文章

  1. sklearn SVM(支持向量机)模型使用RandomSearchCV获取最优参数及可视化​​​​​​​
  2. NLPIR智能语义:大数据挖掘助力人工智能快速发展
  3. python38怎么用_Python基础练习实例38(数组操作)
  4. mybatis的select、insert、update、delete语句
  5. kepware是什么软件_OPC服务器软件介绍
  6. mac系统node安装指定版本
  7. linux宝塔面板打不开 ssh也连不上,SSH能访问,但是宝塔面板打不开,输入bt命令无任何反应!...
  8. Ant批量打包工具的使用
  9. C++希尔密码的实现以及运用
  10. 栈的应用 括号匹配 c++
  11. JavaScript权威指南 第11章JavaScript标准库
  12. 用读小说的方式掌握c语言(仅适合初学,目的是让c的学习不枯燥)
  13. uni-app实现PDA的离线语音(二)MT-TTS离线语音合成插件下载及集成
  14. python 模拟微信浏览器请求_2020-03-06 python selenium 模拟访问网页检查更新并微信通知...
  15. 用“视觉”确保品质——IC芯片质量检测
  16. dede 梦织生成xml 网站地图
  17. 特征工程与CTR预估
  18. 客户端与服务器端交互原理
  19. 服务器端渲染和客户端渲染有什么区别?
  20. ATX微机开关电源维修教程(典型)

热门文章

  1. 使用计算机翻译功能吗,微信上怎么使用翻译功能 翻译功能设置教程
  2. EM78系列单片机的开发工具及编程器
  3. WIX插件安装包的生成(三) 批量导入文件
  4. Spark动态加载外部资源文件
  5. 开源项目-超市订单管理系统
  6. java int类型能表示的数值范围
  7. 回文是指正读反读均相同的字符序列,如“abba“和“abdba“均是回文,但“good“不是回文。试写一个算法判定给定的字符向量是否为回文。(提示:将一半字符入栈)
  8. B. 三维空间的点(继承)
  9. MFC CString
  10. mysql connector java5.1.30_mysql connector java下载