Matnote_2_数据的同质性 Data Homogeneity
在学习统计学检验时翻到了一个有关气象学统计分析的网站 (http://iridl.ldeo.columbia.edu/dochelp/StatTutorial/Homogeneity/index.html),这里说的数据同质性从来没见过,搜索也只有英语结果。尝试翻译一下加入自己的理解,看看是不是异质性检验之类的东西。提示:原文关于数据的描述是从气象数据的角度来讲的。
Introduction
在使用一组统计数据之前,检验这组数据是否同质 (homogeneous) 十分重要。具有同质性的数据应当来自同一组人群 (?: are drawn from a single population),所有可能影响数据的外部过程必须在样本时间段内保持不变。随时间变化,人为变化会逐步影响数据的统计学性质,导致非同质性 (inhomogeneity)。现实中获得完全同质的数据几乎是不可能的,因为观测站周围区域不可避免的变化往往会影响数据。
Analysis the Homogeneity
检验同质性的方法:
计算中位数。
数据中的每个值减去中位数。
记下数据曲线越过坐标横轴的次数(由正变负记为A,由负变正记为B),得到数据正值或负值的持续性。
用显著性表来确定同质性指标的阈值。
找到数据样本容量一半的那一行,如果 A 与 B 介于 0.1 与 0.9 显著性水平阈值之间(未说明是否包括),则有90%置信度说明这组数据是同质的。
半样本容量 | .10 显著性水平 | .90 显著性水平 |
---|---|---|
10 | 8 | 13 |
11 | 9 | 14 |
12 | 9 | 16 |
13 | 10 | 17 |
14 | 11 | 18 |
15 | 12 | 19 |
16 | 13 | 20 |
17 | 14 | 21 |
18 | 15 | 22 |
19 | 16 | 23 |
20 | 16 | 25 |
25 | 22 | 30 |
30 | 26 | 36 |
35 | 31 | 41 |
40 | 35 | 47 |
45 | 40 | 52 |
50 | 45 | 57 |
Oliver, John E. Climatology: Selected Applications. p 7.
Example
从 1920 年到 1970 年,舍布鲁克数据有 18 次运行。构成样本的元素总数为 50(每年平均最低温度构成一个元素)。 根据该表,在 0.10 的显着性限制下,应该至少有 22 次runs。 因此,我们可以有 90% 的置信度得出结论,该数据不是同质的。
Conclusion
个人感觉这是一种简单的同分布检验。鉴于这个固定的显著性表,它应该是只适用于气象类数据的,不过这种简单的检验思路还是值得一看的。
内容来自 http://iridl.ldeo.columbia.edu/dochelp/StatTutorial/Homogeneity/index.html
Matnote_2_数据的同质性 Data Homogeneity相关推荐
- 数据竞争(data race)问题分析的利器——valgrind的Helgrind
数据竞争(data race)是指在非线程安全的情况下,多线程对同一个地址空间进行写操作.一般来说,我们都会通过线程同步方法来保证数据的安全,比如采用互斥量或者读写锁.但是由于某些笔误或者设计的缺陷, ...
- QIIME 2教程. 12数据筛选Filtering data(2021.2)
QIIME 2用户文档. 12数据筛选 Filtering data https://docs.qiime2.org/2021.2/tutorials/filtering/ 注:此实例需要完成本系列文 ...
- QIIME 2用户文档. 12数据筛选Filtering data(2019.7)
前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...
- QIIME 2教程. 12数据筛选Filtering data(2020.11)
文章目录 QIIME 2用户文档. 12数据筛选 下载实验相关数据 过滤特征表 按数据量过滤 偶然因素的过滤 基于标识符的过滤 基于元数据的筛选 基于物种过滤表和序列 过滤序列 过滤距离矩阵 译者简介 ...
- QIIME 2用户文档. 9数据导入Importing data(2019.7)
前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...
- QIIME 2用户文档. 11数据筛选Filtering data(2018.11)
文章目录 前情提要 QIIME 2用户文档. 11数据筛选 下载实验相关数据 过滤特征表 按数据量过滤 偶然因素的过滤 基于索引的过滤 基于元数据的筛选 基于物种过滤表和序列 过滤序列 过滤距离矩阵 ...
- QIIME 2用户文档. 8数据导入Importing data(2018.11)
文章目录 前情提要 QIIME 2用户文档. 8数据导入 导入带质量值的FASTQ测序数据 EMP标准混样单端数据 EMP混样双端数据 Casava1.8单端混样数据 Casava 1.8双端拆分后数 ...
- QIIME 2教程. 09数据导入Importing data(2020.11)
文章目录 QIIME 2用户文档. 9数据导入 导入带质量值的FASTQ测序数据 EMP标准混样单端数据 EMP混样双端数据 Casava1.8单端混样数据 Casava 1.8双端拆分后数据 **F ...
- R语言data.table导入数据实战:把data.frame数据转化为data.table数据
R语言data.table导入数据实战:把data.frame数据转化为data.table数据 目录 R语言data.table导入数据实战:把data.frame数据转化为data.table数据 ...
最新文章
- 服膺守善 立德立言——院长王建民教授在清华大学软件学院2020届学生毕业典礼上的赠言...
- Go 语言编程 — 函数
- 面试题php2018,2018php最新面试题之PHP核心技术
- linux——管理系统存储之设备分区:MBR分区、GPT分区、swap的分区的设定
- 深度学习在美图个性化推荐的应用实践
- java.lang.ClassNotFoundException: com.sap.exception.GlobalDefaultExceptionHandler
- bean.xml配置数据源和读取配置文件配置数据源
- python中delete怎么用_python删除np.deletePython基础教程05 - 缩进和选择
- 长途货运4大痛,Uber新上的「自动驾驶卡车」如何改善?
- ubuntu之解决挂载NTFS磁盘时出现input/output error
- 鸿蒙os系统使用技巧,鸿蒙OS系统的四大技术特性介绍
- 计算机硬件 中级证,计算机硬件组装与教学方法计算机应用中级职称论文
- Eclipse SVN插件Subclipse和Subversive简介
- cad在线转换低版本_资源分享/CAD版本转换器
- Java数据结构与算法——哈希表
- mikrotikROS路由配置L2TP
- 新兴基金经理凯瑟琳·伍德ARKK基金在 2022 年初遭受新的打击
- day02 126邮箱注册思维导图 / 城市电话号码/ qq号登录
- i排版html居中,i排版-i排版官网:微信公众号文章编辑软件-禾坡网
- 费控系统对接用友NC
热门文章
- 关于删除文件需要提供管理员权限才能删除此文件的解决方法
- Windows7中开启nbsp;Administratornbsp;帐…
- 小程序实战--仿bilibil(哔哩哔哩)小程序
- 2015年9月30日的作业
- Jsp连接数据库大全(ZT)
- java app微信支付接口_JAVA微信APP支付接口整合
- UE4 Playercontroller和Actor的ower的思考
- 【PWN】07.ret2syscall
- 用python进行模拟股票交易
- 报错:exception is java.io.InvalidClassException