PART 4 描述性统计分析
一、参数估计
1⃣️ 估计
· 分布剖析
有两条法则可以告诉你:大部分数据落在概率分布中的哪个区域。
经验法则——适用于符合正态分布的任何数据集。表明:几乎所有的数据都位于距离均值3个标准差的范围内。具体:
大约68%的数值位于距离均值1个标准差的范围内;
大约95%的数值位于距离均值2个标准差的范围内;
大约99.7%的数值位于距离均值3个标准差的范围内。
切比雪夫不等式——适用于任何数据集。表明:对于任意分布,都至少有1-1/k^2的X落在离均值k个标准差的范围内。具体:
至少75%的数值位于距离均值2个标准差的范围内;
至少89%的数值位于距离均值3个标准差的范围内;
至少94%的数值位于距离均值4个标准差的范围内。
· 参数估计
· 步骤:选定参数——选定统计量——抽样分布——得出结果
· 定义
参数估计:用样本统计量去估计总体的参数
估计量:用来估计总体参数的统计量
估计值:根据一个具体的样本计算出来的估计量的数值
· 抽样分布
1)样本均值的抽样分布
2)样本比例的抽样分布
由二项分布的原理和渐近分布的理论,当n充分大时,np>5且np>5时,p的分布可用正态分布去逼近,即:
P~N(p,pq/n)
切忌:须进行连续型修正+-1/2n
3)样本方差的抽样分布
· 评价估计量的三标准
无偏性:估计量抽样分布的数学期望等于被估计的总体参数
有效性:也称最小方差性,即方差越小的估计量越有效
一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数
· 估计-得出结果
两类方法
· 点估计
定义:用样本估计量构造的某一个值直接作为总体参数的估计值
具体方法:矩估计法、最大似然法、顺序统计量估计法、最小二乘法
特点:优点(简单、精确);缺点(不准确)
· 区间估计
定义:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。
置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间
置信水平:置信区间中包含总体参数真值的次数所占的比例
⚠️注意:
比如说抽取100个样本,根据每个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含总体参数的真值,有5%没包含,则95%这个值称为置信水平。
1)表述:构造置信水平为95%的置信区间
2)置信区间是一个随机区间,它会因样本的不同而不同,且不是所有的区间都包含总体参数的真值
3)在实际问题中,由一个样本构造的区间是一个特定的区间,而不再是随机区间,所以我们无法知道这个样本所产生的区间是否包含总体参数的真值,我们只能希望这个区间是大量包含总体参数真值的区间中的一个。
思考:
如何衡量区间对总体参数估计的准确性?
1)总体的参数值总是存在的、且固定的,但是是未知的;
2)不能说“某个区间以90%的概率包含总体参数”;也不能说总体参数有90%的可能性落在某个区间。
一个特定区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题,但是,用概率可以知道在多次抽样得到的区间中大概有多少个区间包含参数的真值。
总体均值的区间估计
总体比例的区间估计
总体方差的区间估计
· 小结
二、描述性统计分析
1⃣️统计的基本概念
【数据分析步骤】核心:数据
收集数据➡️处理数据➡️分析数据➡️解释数据
分析数据的方法
· 描述性分析
-研究数据收集、处理和描述的统计学方法
总体规模、对比关系、集中趋势、离散程度、偏态、峰态…..
· 推断性分析
-研究如何利用样本数据来推断总体特征的统计学方法
估计、假设检验、列联分析、方差分析、相关分析、回归分析…..
· 基本概念-数据
1)统计学的对象是数据
2)数据的形式:数字(可进行比较)&文本(不可运算)「注:阿拉伯数字不一定是数字,在处理数据时,它只是一个代替的符号而已,也可以表示文字」
3)数据的分类
按照计量尺度:
· 分类型数据(不可排序,不可计算)
按现象的某种属性对其分类或分组而得到的反映事物类型的数据,又称定类数据
如按照性别将人口分为男、女两类
· 顺序型数据(可排序,不可计算)
某一有序类别的非数字型数据
如将产品分为一等品、二等品、三等品、次品等
· 数值型数据(可排序,可计算)
· 基本概念
总体
样本
参数:要研究的总体的某种特征值,如总体均值、总体标准差、总体比例等
统计量:指根据样本数据计算出来的一个量,如样本均值、样本标准差、样本比例等
变量
-变量的具体表现称为变量值,即数据
-分为:分类变量、顺序变量、数值型变量
2⃣️数据的描述性统计
⚠️必会!
撰写一份数据描述统计分析报告
五个角度:
一、总体规模的描述——总量指标
二、对比关系的描述——相对指标
三、集中趋势的描述——平均指标
四、离散程度的描述——变异指标
五、分布形态的描述——偏态与峰态
六、描述性统计图表
PART 4 描述性统计分析相关推荐
- R语言描述性统计分析:相关性分析
R语言描述性统计分析:相关性分析 相关性分析:pearson.spearman.kendall 相关性系数的显著性检验: 偏相关性分析: library(ISwR) attach(thuesen) c ...
- R语言描述性统计分析:假设检验
R语言描述性统计分析:假设检验 单样本t检验: 双样本t检验: 方差齐性检验: 配对样本t检验: 单样本Wilcoxon符号秩检验: 两样本Wilcoxon符号秩检验: daily.intake &l ...
- 怎么计算一组数据的波动_[理论+spss实战]一组数据的描述性统计分析
长按二维码,关注[学术点滴]获取更多资讯. 问:拿到一组数据首先要干什么?答:进行数据的基本分布描述 本次推文分两部分 第一部分:理论部分 第二部分:SPSS实战操作 操作者 微信公众号[学术点滴] ...
- r 函数返回多个值_第四讲 R描述性统计分析
在"R与生物统计专题"中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现.以从浅入深,层层递进的形式在投必得医学公众号更新. 在上一讲中,我们介绍了第三讲 R编程基础- ...
- python会计实证研究_描述性统计分析在实证研究中的作用及具体软件实现——以SPSS为例...
描述性统计分析在实证研究中的作用及具体软件实现 --以SPSS为例 为了提升经管代码库(https://bbs.pinggu.org/forum-2626-1.html)人气,一大早起床,打算就微观实 ...
- 什么是描述性统计分析( descriptive statistics)?主要包含哪些内容?
什么是描述性统计分析( descriptive statistics)?主要包含哪些内容? 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估 ...
- 数据分析方法-描述性统计分析
一.数据分析的分类与作用 二.数据分析方法-描述性统计分析
- stata统计分析及行业应用案例分析_描述性统计分析的应用——基于描述性统计分析识别优质股票...
描述性统计分析的应用 -基于描述性统计分析识别优质股票 内容导入: 大家好,这里是每天分析一点点. 上期给大家介绍离散趋势,本期介绍描述性统计分析的基本原理与应用,包括集中趋势.离散趋势.偏度与峰度的 ...
- sas入门-笔记4 描述性统计分析
(三)描述性统计分析 统计学是通过样本数据研究总体数据的一门学科 对数据进行频数统计.计算特征统计量和将数据图形化的过程称为描述统计. 目的:获得对数据的总体感觉以及评估数据质量 实现方式 用表格工具 ...
最新文章
- 路印协议受邀参加澳洲新南威尔士政府孵化器Haymarket HQ分享论坛
- Algs4-2.2.22三向归并排序
- 'telnet' 不是内部或外部命令,也不是可运行的程序
- django 创建mysql失败_创建表时出现Django MySQL错误
- Lnmp环境安装禅道项目管理软件
- SaaS 客户生命周期(逐字稿+PPT)
- 1.4.1用空间向量研究直线、平面的位置关系教学设计
- C语言 Linux版俄罗斯方块,C语言版俄罗斯方块源代码
- netstate 命令归纳
- 1.按钮点击的四种方式
- Hortonworks的开源框架SHC的使用(一)
- 如何 让 Chrome (谷歌)浏览器 自动翻译
- 基于32位版CentOS6配置符合HA模式的CDH5.7.0的Hadoop+Yarn+HBase集群
- background-image
- check_password使用方法
- win10 tensorflow MTCNN Demo
- python遍历是什么意思_在Python中遍历列表的方法有哪些
- 微信小程序案例学习笔记
- 国产开源网络编程框架t-io使用必备:极速开发器Tio.java
- 如何端正的去学好编程
热门文章
- PDF转换器使用方法分享:Word文件怎么转换成PDF格式
- Swift——仿微信发起群聊悬浮框实现
- 国际知名服装品牌网站整理
- mPEG-Epoxide,甲氧基聚乙二醇环氧基,mPEG-EP
- 哪些学校不让用matlab,新一轮制裁?部分高校被禁止使用matlab,科学无国界就是一句笑话...
- IT中小企业的股权激励方案设计
- 开Lotus notes后,单击“邮件”,打不开邮箱,弹出“远程服务器不是已知的TCP/IP”报错
- uniapp实现onShow获取页面传递参数方法
- 实习证明| 大数据在线实习项目意义
- oracle测试主要做什么的,ERP软件测试主要做什么?