描述性统计分析——分布形态描述

一.相对位置的度量—标准化值

1.标准化值

1)也称为标准分数,描述的是一个数据在全体数据中的相对位置的度量,可以判断一组数据中是否有离群值,常用来对变量进行标准化 处理(建模时)

2)计算公式

含义是(数据-数据均值)/标准差 将数据变为均值为0,标准差为1的数据。

同时也把标准化值理解为,原始数据到均值的距离是标准差的多少倍。

2.例子

3.数据分布

经验法则表明:当一组数据对称分布时

(1)约有68%的数据在平均数加减1个标准差的范围之内

(2)约有95%的数据在平均数加减2个标准差的范围之内

(3)约有99%的数据在平均数加减3个标准差的范围之内

切比雪夫不等式

1.切比雪夫不等式提供的是下”下界“,是所占比例至少是多少,对任意分布的数据·,至少有
的数据落在平均数加减k个标准差之内。

当一组数据不是堆成分布时:

(1)约有75%的数据在平均数加减2个标准差的范围之内

(2)约有89%的数据在平均数加减3个标准差的范围之内

(3)约有94%的数据在平均数加减4个标准差的范围之内

二 .分布形态描述-偏态与峰态

1.偏态

1)定义

偏态是指数据分布的偏斜程度。

2)测量方法

使用偏态系数进行测量,符号SK

未分组

分组

3)偏态的判断

**判断依据:**尾巴在那边就是什么分布

4)偏态与平均值,中位数,众数之间的关系

5)偏态程度区分

2.峰态

1)定义

峰态指的是数据分布的扁平程度

2)测量方法

使用峰态系数表示,符号K

3)计算方法

未分组

分组

4)峰态判断

5)峰态程度

描述性统计分析——分布形态描述相关推荐

  1. spss数据分析(频数分析、描述性统计分析、探索性分析、连列表分析)

    1频数分析 对平均数.四分位数.百分位数.标准差.方差.偏度等统计量进行分析 原始数据 分析-描述统计-频率 输出:   2描述性统计分析 分析-描述统计-描述 输出: 勾选了将标准化得分另存为变量后 ...

  2. python数据分析及可视化(二)离散程度、标准化值、分布形态、描述性统计图表

    描述性统计 平均指标 调和平均数 算术平均数的变种,本质跟算术平均数是一致的. 定义:变量值倒数的算术平均值的倒数.表示的符号:HHH 调和平均数(根据未分组数据计算的):H=n1x1+1x2+... ...

  3. matlab描述统计分析步骤,MATLAB实现描述性统计分析的例子例题

    MATLAB实现描述性统计分析的例子例题 1. 基本统计量 对随机变量x,计算其基本统计量的命令如下: 均 值:mean(x) 中位数:median(x) 标准差:std(x) 方 差:var(x) ...

  4. stata统计分析及行业应用案例分析_描述性统计分析的应用——基于描述性统计分析识别优质股票...

    描述性统计分析的应用 -基于描述性统计分析识别优质股票 内容导入: 大家好,这里是每天分析一点点. 上期给大家介绍离散趋势,本期介绍描述性统计分析的基本原理与应用,包括集中趋势.离散趋势.偏度与峰度的 ...

  5. PART 4 描述性统计分析

    一.参数估计 1⃣️ 估计 · 分布剖析 有两条法则可以告诉你:大部分数据落在概率分布中的哪个区域. 经验法则--适用于符合正态分布的任何数据集.表明:几乎所有的数据都位于距离均值3个标准差的范围内. ...

  6. 数据分析师一定要掌握的基础——描述性统计分析

    申明:文章内容是作者自己的学习笔记,教学来源是开课吧讲师梁勇老师. 以下博客内容讲解了描述性统计分析的所有知识点,以及利用鸢尾花数据集的分析加强对各个统计量的理解. 数理统计基础-描述性统计分析 1. ...

  7. Part 4 描述性统计分析(占比 10%)——上

    文章目录 [后续会持续更新CDA Level I&II备考相关内容,敬请期待] [考试大纲] [考试内容] [备考资料] 1.统计基本概念 1.1.统计学的含义及应用 1.1.1.统计学的含义 ...

  8. CDA学习-------描述性统计分析

    统计学含义 统计学是一门收集.处理.分析.解释数据并从数据中得到结论的科学. 数据分析步骤 收集数据----->处理数据----->分析数据----->解释数据 描述性统计分析: 研 ...

  9. CDA Level1知识点总结之描述性统计分析

    描述性统计分析 策略分析 考点总结 描述性统计分析介绍 描述性统计图表--直方图.散点图.箱型图 统计分布 相关分析 参数估计 点估计 区间估计 假设检验 习题整理(易错题.难题) 策略分析 参数估计 ...

最新文章

  1. 印度太阳能企业争取对中、台、马实施反倾销税
  2. cuda测试caffe编译安装
  3. 微软面试题系列(四):在二元树中找出和为某一值的所有路径
  4. .NET 云原生架构师训练营(模块二 基础巩固 依赖注入)--学习笔记
  5. 小程序服务器api接口,百度智能小程序API 开放接口
  6. 程序员的职业素养文摘
  7. VC/VS开发问题集锦
  8. django-cbv与fbv
  9. python列表框_Python列表框
  10. CVPR 2020百度-涵盖全视觉领域22篇
  11. 尴尬!罗永浩刚发布抗菌材料,专业人士就看不下去了:别听人瞎说
  12. 95-910-172-源码-FlinkSQL-Flink SQL提升吞吐的利器 MicroBatch
  13. 对是否要用Linux的思考
  14. 【HNOI 2016】序列
  15. ipad的文件连接服务器,使用Termius从iPad连接到Linux服务器
  16. C扩展php的方法(制作php扩展库)
  17. 使用 做签名的post_使用 Go 添加 JWT 认证
  18. 白日门传奇手游源码端
  19. C虾仔笔记 - HorizontalScrollView水平滚动视图
  20. 滴答清单、为知笔记、Effie,谁才是写稿爱好者的最佳战友?

热门文章

  1. 如何申请Google AdSense账号?(申请技巧及答疑)
  2. 计算机专业论文写作方向
  3. c语言递归求乘法口诀表,1一9的乘法口诀表
  4. WebRTC混音器模块
  5. 蚂蚁金服互联网IT运维体系实践
  6. 为了给女友挑合适的内衣,我用 Python 爬了天猫内衣店的数据!
  7. 从细节入手:点击输入框,提示文字瞬间变身小精灵
  8. 教你用堆排序解决topk问题
  9. 交通运输部印发《城市公共交通“十三五”发展纲要》
  10. maya硬表面布线卡线