本章主要介绍数据分析中最基本的分析方法一一描述性统计分析,主要包括数据的集中趋势、离中趋势和数据分布的测度指标,以及根据这些指标进行的比较分析方法;直方图、茎叶图、箱线图等统计图的含义和画法。

2.1
数据概览:直方图

可以判断数据的分布(例如正态分布)

2.2
数据的集中趋势

在统计学中是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点所在的位置。最常见的就是平均数、分位数和众数。

2.2.1 平均数

它主要适用于定量数据,而不适用于定性数据。平均数是概括数据的一个强有力的指标,它通过消除极端数据的差异将大量的数据浓缩成一个数来概括,可以较好地实现数据集中趋势的度量,但这种过度的浓缩使其存在容易受极端值影响的缺点

2.2.2 分位数

适用范围较广,既适合顺序数据,也适合定量数据。四分位数,是一种特殊的百分位数,它不受极端值的影响。在统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数字就是四分位数。

2.2.3 众数

类数据的集中趋势最常用的一种测度值,它主要适用于分类数据。一般只有在数据量较大的情况下,众数才有意义。一组数据中不是只有一个众数。

2.3
数据的离中趋势

一组数据在某一中心值分散的程度,它反映了各个数据远离其中心点的程度。主要有极差、分位距、平均差、方差、标准差和离散系数。

极差(也叫全距)是一组数据中的最大值与最小值的差距。

分位距,四分位距是第三个四分位数减去第一个四分位数的差。

方差与标准差。方差是数据组中各数据值与其算术平均数离差平方的算术平均数。方差的平方根就是标准差。

离散系。一组数据的标准差与其算术平均数对比的结果,以测定其相对离中程度。克服计量单位问题。

2.4
数据分布的测定

在描述性统计中,数据分布形态的测定主要以正态分布为标准进行衡量,一组数据的分布形状是通过直方图将该数据分布在数轴上拟合出一条曲线,将曲线的尖峭程度和对称性与正态分布曲线相比较,其测试指标包括偏态和峰度。

2.4.1 数据偏态及其测定

在对称分布的情况下,平均数、中位数与众数是合而为一的。

在偏态分布的情况下,平均数、中位数与众数是分离的。如果众数在左边,平均数在右边,即数据的极端值在右边,数据分布曲线向右延伸,则称为右向偏态。右向偏态,众数的数值较小,平均数的数值较大,平均数与众数之差为正值,所以右向偏态又称为正向偏态。

测定偏态的指标是偏态系数。偏态系数(SK)是对数据分布的不对称性(偏斜程度)的测定。

SK=0时,分布是对称的。
SK<0时,分布呈负偏态,SK值越小,负偏程度越高。
SK>0时,分布呈正偏态,SK值越大,正偏程度越高。

2.4.2 数据峰度及其测定

峰度是指数据分布的尖峭程度或峰凸程度。根据变量值的集中与分散程度,峰度一般可表现为三种形态:尖顶峰度、平顶峰度和标准峰度。

峰度系数K<0,与正态分布相比,该分布一般为扁平、瘦尾,肩部较胖。

峰度系数K>0,与正态分布相比,该分布一般为尖峰、肥尾,肩部较瘦。

2.5
数据的展示——统计图

统计图是利用点、线、面、体等绘制成几何图形,以表示统计数据大小关系和变动情况的各种图形的总称。在数据分析中,把利用统计图形展现统计数据的方法叫作统计图示法,由于该方法具有形象具体、简明生动、通俗易懂、一目了然等特点,因此在描述性数据分析中得到了广泛的应用。常用的统计图有条形图、扇形图、折线图、箱线图、茎叶图和直方图等。

条形图是一种以长方形的长度为变量的统计图表。条形图可以清楚地表明各种数量的多少,易于比较数据之间的差别。

扇形图是用整个圆形表示总数,用圆形内各个扇形的大小表示各部分数量占总数的百分比。扇形图可以很清楚地表示出各部分数量同总数之间的关系。

折线图是利用线形的升降起伏(上升或下降)来表示统计数据的增减变化的统计图。与条形图比较,折线图不仅可以表示数量的多少,还可以反映同一事物在不同时间里的发展变化情况。折线图在生活中运用得较为广泛,其主要用于显示时间数列的数据。

茎叶图,将数的大小基本不变或变化不大的位作为一个主干(茎),将数变化大的位作为分枝(叶),列在主干的后面。茎叶图能直观地反映数据的集中趋势

箱线图,显示一组数据分散情况的统计图。提供有关数据的位置和分散情况的参考。数据分析领域经常被使用,如品质管理分析、异常值检查

第2章 描述性统计分析相关推荐

  1. 《从零进阶!数据分析的统计基础》-2.描述性统计分析

    目录: 第二章 描述性统计分析 2.1直方图 2.2数据的计量尺度 定类尺度 定序尺度 定距尺度 定比尺度 2.3数据的集中趋势 2.3.1定量数据:平均数 2.3.2顺序数据:中位数和分位数 2.3 ...

  2. 莱鸟学spss数据分析之第六章---描述性分析

    第6章 描述性分析 数据的分布特征主要有三个:数据分布的集中趋势.数据分布的离散趋势.数据频数的分布形态. 6.1.1 集中趋势 集中趋势的目的是找到最能代表整个数据的数值. 1.适用类型 ● 若为定 ...

  3. 金融时间序列描述性统计分析【python复现】

    金融时间序列描述性统计分析 前言 金融时间序列是金融市场的一个重要组成部分.在研究金融市场的各种现象以及对进行建模时,金融时间序列的描述性统计分析都是一项基础的且必不可少的工作. 本章主要介绍描述性统 ...

  4. R语言描述性统计分析:相关性分析

    R语言描述性统计分析:相关性分析 相关性分析:pearson.spearman.kendall 相关性系数的显著性检验: 偏相关性分析: library(ISwR) attach(thuesen) c ...

  5. R语言描述性统计分析:假设检验

    R语言描述性统计分析:假设检验 单样本t检验: 双样本t检验: 方差齐性检验: 配对样本t检验: 单样本Wilcoxon符号秩检验: 两样本Wilcoxon符号秩检验: daily.intake &l ...

  6. 怎么计算一组数据的波动_[理论+spss实战]一组数据的描述性统计分析

    长按二维码,关注[学术点滴]获取更多资讯. 问:拿到一组数据首先要干什么?答:进行数据的基本分布描述 本次推文分两部分 第一部分:理论部分 第二部分:SPSS实战操作 操作者 微信公众号[学术点滴] ...

  7. r 函数返回多个值_第四讲 R描述性统计分析

    在"R与生物统计专题"中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现.以从浅入深,层层递进的形式在投必得医学公众号更新. 在上一讲中,我们介绍了第三讲 R编程基础- ...

  8. python会计实证研究_描述性统计分析在实证研究中的作用及具体软件实现——以SPSS为例...

    描述性统计分析在实证研究中的作用及具体软件实现 --以SPSS为例 为了提升经管代码库(https://bbs.pinggu.org/forum-2626-1.html)人气,一大早起床,打算就微观实 ...

  9. 什么是描述性统计分析( descriptive statistics)?主要包含哪些内容?

    什么是描述性统计分析( descriptive statistics)?主要包含哪些内容? 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估 ...

最新文章

  1. Android Animation学习(五) ApiDemos解析:容器布局动画 LayoutTransition
  2. 文轩在线:如何让IT部门成为企业的价值中心
  3. Eclipse 搭建struts2 spring3 hibernate3环境实战 待完善
  4. LeetCode 34 在排序数组中查找元素的第一个和最后一个位置
  5. Referenced file contains errors (http://www.zeroturnaround.com/alderaan/rebel-2_0.xsd).
  6. 学习笔记 - Nginx在多层代理下获取真实客户端IP地址
  7. .Net MVC 自定义Action类型,XmlAction,ImageAction等
  8. LeetCode刷题(34)-Rotate List
  9. 力扣——实现 strStr()
  10. unicode编码java_JAVA转化Unicode编码
  11. java 任务链模式,flink部署运行架构
  12. html编辑中,出现报错 semi-.colon excepted css(………)
  13. Linux的PS1美化
  14. HNOI2015 亚瑟王
  15. .NET发送邮箱(验证码)
  16. Excel编号相同数字
  17. 企查查访问超频怎么办_Springboot与Selenium合体变蜘蛛爬企查查
  18. 微信公众号抓取 操作手机相关操作 ②
  19. Redis常用命令小总
  20. 回顾LIGO之父的传奇人生,这次他会再失诺贝尔物理学奖吗?

热门文章

  1. ffmpeg 视频像素尺寸转换SwsContext、sws_scale 函数解释
  2. java soot_java代码优化框架 soot
  3. 理财笔记 - 生日前的幻想
  4. 原核转录组非编码RNA研究
  5. grub源码分析之boot.S
  6. 自动驾驶遥控泊车RPA系统功能规范
  7. Relation Network for Person Re-identification
  8. asyncio+aiohttp异步爬虫
  9. Lua调用外部脚本_艾孜尔江撰
  10. EUI组件之DataGroup