在学习统计学检验时翻到了一个有关气象学统计分析的网站 (http://iridl.ldeo.columbia.edu/dochelp/StatTutorial/Homogeneity/index.html),这里说的数据同质性从来没见过,搜索也只有英语结果。尝试翻译一下加入自己的理解,看看是不是异质性检验之类的东西。提示:原文关于数据的描述是从气象数据的角度来讲的。

Introduction

在使用一组统计数据之前,检验这组数据是否同质 (homogeneous) 十分重要。具有同质性的数据应当来自同一组人群 (?: are drawn from a single population),所有可能影响数据的外部过程必须在样本时间段内保持不变。随时间变化,人为变化会逐步影响数据的统计学性质,导致非同质性 (inhomogeneity)。现实中获得完全同质的数据几乎是不可能的,因为观测站周围区域不可避免的变化往往会影响数据。

Analysis the Homogeneity

检验同质性的方法:

  • 计算中位数。

  • 数据中的每个值减去中位数。

  • 记下数据曲线越过坐标横轴的次数(由正变负记为A,由负变正记为B),得到数据正值或负值的持续性。

  • 用显著性表来确定同质性指标的阈值。

找到数据样本容量一半的那一行,如果 A 与 B 介于 0.1 与 0.9 显著性水平阈值之间(未说明是否包括),则有90%置信度说明这组数据是同质的。

半样本容量 .10 显著性水平 .90 显著性水平
10 8 13
11 9 14
12 9 16
13 10 17
14 11 18
15 12 19
16 13 20
17 14 21
18 15 22
19 16 23
20 16 25
25 22 30
30 26 36
35 31 41
40 35 47
45 40 52
50 45 57

Oliver, John E. Climatology: Selected Applications. p 7.

Example

从 1920 年到 1970 年,舍布鲁克数据有 18 次运行。构成样本的元素总数为 50(每年平均最低温度构成一个元素)。 根据该表,在 0.10 的显着性限制下,应该至少有 22 次runs。 因此,我们可以有 90% 的置信度得出结论,该数据不是同质的。

Conclusion

个人感觉这是一种简单的同分布检验。鉴于这个固定的显著性表,它应该是只适用于气象类数据的,不过这种简单的检验思路还是值得一看的。

内容来自 http://iridl.ldeo.columbia.edu/dochelp/StatTutorial/Homogeneity/index.html

Matnote_2_数据的同质性 Data Homogeneity相关推荐

  1. 数据竞争(data race)问题分析的利器——valgrind的Helgrind

    数据竞争(data race)是指在非线程安全的情况下,多线程对同一个地址空间进行写操作.一般来说,我们都会通过线程同步方法来保证数据的安全,比如采用互斥量或者读写锁.但是由于某些笔误或者设计的缺陷, ...

  2. QIIME 2教程. 12数据筛选Filtering data(2021.2)

    QIIME 2用户文档. 12数据筛选 Filtering data https://docs.qiime2.org/2021.2/tutorials/filtering/ 注:此实例需要完成本系列文 ...

  3. QIIME 2用户文档. 12数据筛选Filtering data(2019.7)

    前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...

  4. QIIME 2教程. 12数据筛选Filtering data(2020.11)

    文章目录 QIIME 2用户文档. 12数据筛选 下载实验相关数据 过滤特征表 按数据量过滤 偶然因素的过滤 基于标识符的过滤 基于元数据的筛选 基于物种过滤表和序列 过滤序列 过滤距离矩阵 译者简介 ...

  5. QIIME 2用户文档. 9数据导入Importing data(2019.7)

    前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...

  6. QIIME 2用户文档. 11数据筛选Filtering data(2018.11)

    文章目录 前情提要 QIIME 2用户文档. 11数据筛选 下载实验相关数据 过滤特征表 按数据量过滤 偶然因素的过滤 基于索引的过滤 基于元数据的筛选 基于物种过滤表和序列 过滤序列 过滤距离矩阵 ...

  7. QIIME 2用户文档. 8数据导入Importing data(2018.11)

    文章目录 前情提要 QIIME 2用户文档. 8数据导入 导入带质量值的FASTQ测序数据 EMP标准混样单端数据 EMP混样双端数据 Casava1.8单端混样数据 Casava 1.8双端拆分后数 ...

  8. QIIME 2教程. 09数据导入Importing data(2020.11)

    文章目录 QIIME 2用户文档. 9数据导入 导入带质量值的FASTQ测序数据 EMP标准混样单端数据 EMP混样双端数据 Casava1.8单端混样数据 Casava 1.8双端拆分后数据 **F ...

  9. R语言data.table导入数据实战:把data.frame数据转化为data.table数据

    R语言data.table导入数据实战:把data.frame数据转化为data.table数据 目录 R语言data.table导入数据实战:把data.frame数据转化为data.table数据 ...

最新文章

  1. 服膺守善 立德立言——院长王建民教授在清华大学软件学院2020届学生毕业典礼上的赠言...
  2. Go 语言编程 — 函数
  3. 面试题php2018,2018php最新面试题之PHP核心技术
  4. linux——管理系统存储之设备分区:MBR分区、GPT分区、swap的分区的设定
  5. 深度学习在美图个性化推荐的应用实践
  6. java.lang.ClassNotFoundException: com.sap.exception.GlobalDefaultExceptionHandler
  7. bean.xml配置数据源和读取配置文件配置数据源
  8. python中delete怎么用_python删除np.deletePython基础教程05 - 缩进和选择
  9. 长途货运4大痛,Uber新上的「自动驾驶卡车」如何改善?
  10. ubuntu之解决挂载NTFS磁盘时出现input/output error
  11. 鸿蒙os系统使用技巧,鸿蒙OS系统的四大技术特性介绍
  12. 计算机硬件 中级证,计算机硬件组装与教学方法计算机应用中级职称论文
  13. Eclipse SVN插件Subclipse和Subversive简介
  14. cad在线转换低版本_资源分享/CAD版本转换器
  15. Java数据结构与算法——哈希表
  16. mikrotikROS路由配置L2TP
  17. 新兴基金经理凯瑟琳·伍德ARKK基金在 2022 年初遭受新的打击
  18. day02 126邮箱注册思维导图 / 城市电话号码/ qq号登录
  19. i排版html居中,i排版-i排版官网:微信公众号文章编辑软件-禾坡网
  20. 费控系统对接用友NC

热门文章

  1. 关于删除文件需要提供管理员权限才能删除此文件的解决方法
  2. Windows7中开启nbsp;Administratornbsp;帐…
  3. 小程序实战--仿bilibil(哔哩哔哩)小程序
  4. 2015年9月30日的作业
  5. Jsp连接数据库大全(ZT)
  6. java app微信支付接口_JAVA微信APP支付接口整合
  7. UE4 Playercontroller和Actor的ower的思考
  8. 【PWN】07.ret2syscall
  9. 用python进行模拟股票交易
  10. 报错:exception is java.io.InvalidClassException