统计学 分类数据分析

  • 分类数据和x2x^2x2统计量
  • 拟合优度检验
  • 列联分析: 独立性检验
  • 列联表的相关系(三个系数)

1.分类数据和x2x^2x2统计量

分类数据

x2x^2x2统计量


其中 k为求和的项数, l 为要估计的参数个数
具体的参数含义可以结合下面的案例来理解

2.拟合优度检验

直接进入案例

例1

  • 步骤1:分析 H0与H1
    H0 :观察频数与期望频数一致

  • 步骤2: 构造统计量

    • 1.在本题中不用估计参数,参与求和的项数为2,所以自由度为2-0-1=1
    • 2.根据原来的男女比例估计期望的男女存活 的人数
    • 3.代入计算
  • 步骤3.得出结论

例2

  • 步骤1:分析 H0与H1
    H0 :观察频数与期望频数一致
  • 步骤2: 构造统计量

    • 1.在本题中估计参数为λ,l=1,参与求和的项数为4,所以自由度为2-0-1=1
      注,这里的 k=4是因为手动把 >=3的数据都归为一类
      λ的估计: 因为H0假设服从参数为λ的泊松分布,泊松分布的表达式入下

      因此使用频数分布表计算出期望
      λ=0∗109/200+1∗65/200+2∗22/200+3∗3/200+4∗1/200=0.6100000000000001≈0.61λ = 0*109/200 + 1*65/200+2*22/200+3*3/200+4*1/200=0.6100000000000001 ≈0.61λ=0∗109/200+1∗65/200+2∗22/200+3∗3/200+4∗1/200=0.6100000000000001≈0.61
      根据泊松分布的表达式计算出k为0,1,2,3时的概率,得到下表
      带入公式求得统计量
  • 步骤3: 带入得出结论

3.列联分析: 独立性检验

RT/CT为该行/列的求和


话不多说,看例题来理解

例1



解析
H0:地区和原料等级之间是独立的(不存在依赖关系)
H1:地区和原料等级之间不独立 (存在依赖关系)
计算
其中45.36=140/500∗162/500∗500=140∗162/500=45.36=140/500*162/500*500=140*162/500=45.36=140/500∗162/500∗500=140∗162/500=

统计量
自由度为(3-1)*(3-1)=4
累加(52−45.36)2/45.36以此类推(52-45.36)^2/45.36 以此类推(52−45.36)2/45.36以此类推
得出结论

4.3个相关系数的计算

注,下文中的x2x^2x2均为统计量


统计学 分类数据分析相关推荐

  1. 《统计学》学习笔记之分类数据分析

    鄙人学习笔记 文章目录 分类数据分析 分类数据与卡方统计量 拟合优度检验 独立性检验 列联表中的相关测量 列联分析中应注意的问题 分类数据分析 分类数据与卡方统计量 卡方检验是对分类数据的频数进行分析 ...

  2. [统计学笔记] (八)分类数据分析

    (八)分类数据分析 首先思考问题: 1. 为什么要对数据进行分类?如何对数据分类? 2. 数据分类后,如何对分类数据进行分析? 数据分类 分类变量的结果表现为类别,例如:性别 (男, 女) 各类别用符 ...

  3. NPL基础入门之新闻本分类数据分析Test2

    NPL基础入门之新闻本分类数据分析Test2 数据读取 数据分析 标签分布(基matplitlit画图与Seabron对比) 新闻内容长度分析 数据读取 因电脑内存限制无法一次性读取整个训练集,所以在 ...

  4. 数理统计笔记7:分类数据分析-拟合优度检验和列联分析

    引言 数理统计笔记的第7篇介绍了分类数据分析的方法,包括拟合优度检验和列联分析,给出了两者的卡方检验量的表达式,并且用例子进行了说明,最后谈了列联分析需要注意的问题. 引言 什么是分类型数据 拟合优度 ...

  5. 《统计学》笔记:第9章 分类数据分析

    [批:即定类变量数据分析] 观察值频数 observed frequency 实际观测到的定类变量各类别的频数. 期望值频数 expected frequency 定类变量中各类别的期望频数. 拟合优 ...

  6. 统计学-常用数据分析方法

    01 描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估计和描述的方法.描述统计分为集中趋势分析.离中趋势分析和相关分析三大部分. ...

  7. 统计学中数据分析方法大全

    Part1描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估计和描述的方法.描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分 ...

  8. 统计学中数据分析方法汇总

    Part1 描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估计和描述的方法.描述统计分为集中趋势分析和离中趋势分析和相关分析三大部 ...

  9. 统计学中数据分析方法大全!

    来源:数据派THU 我是小z 之前有断断续续讲过统计学中的数据分析方法,今天分享的这篇更加全面.系统,涉及到18个方面,收藏就完事儿了~ Part1描述统计 描述统计是通过图表或数学方法,对数据资料进 ...

最新文章

  1. 设置为true有什么区别_腻子粉和腻子膏到底有什么区别,腻子粉厂家来为你讲解...
  2. new hashmap 初始大小_害怕面试被问HashMap?这一篇就搞定了
  3. bzoj4429: [Nwerc2015] Elementary Math小学数学
  4. html标签自动对齐,sublime,jsx里的html标签自动缩进对齐的插件或者配置?
  5. 欢迎使用Augury[翻译]
  6. [渝粤教育] 西北大学 仪器分析 参考 资料
  7. pytorch报错RuntimeError: error in LoadLibraryA
  8. 基于图像查询的视频检索,代码已开源!
  9. 301跳转 https_http跳转https和https跳转http的两种301重定向代码
  10. Spring boot的helloword
  11. Foundation框架: 6.NSString的创建和导出
  12. Oracle PLSQL 从入门到精通
  13. 计算机的硬盘e找不到,计算机D驱动器E驱动器突然消失. 小编帮你找回了
  14. 【Ad Hoc】贰 AODV 协议详解
  15. 由浅入深了解统计机器翻译模型
  16. [PAT] PAT注意点
  17. python八段数码管显示小数点_小数点算法处理(数码管显示)
  18. 淘宝订单、API获取订单
  19. 误删了efi分区,怎么样恢复,使电脑开机回到windows
  20. MySQL中的条件判断函数 CASE WHEN、IF、IFNULL你会用吗?

热门文章

  1. 有限空间作业如何预防窒息和中毒
  2. 组合逻辑电路——编码器
  3. sentinel 热点限流
  4. javascript 获取指定国家(时区)的时间 - npm库
  5. [基础]计算机网络的基础梳理
  6. 【海岛奇兵】各个版本的安装包
  7. 【芯片前端】第一次看DC综合报告时看些什么内容
  8. emWin - Movie篇
  9. 【投票】2009年春晚,我最喜爱的节目评选(草根山寨版)
  10. 【爬虫初探】新浪微博搜索爬虫总览