新版白话空间统计(13):随机的力量
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D
转发、转载和爬虫,请主动保留此声明。
前文再续,书接上一回,先请出本节镇文神图:
看到这张图,可能很多同学会问,随机不是没有分析的意义么?你这里的完美的是啥意思捏?难道说要让我们的数据都表现成随机才好么?
那么我们今天来好好聊聊随机的力量。
首先,校正一个观念——啥叫随机?
有的同学看见随机,第一反应就是随机不就是乱么,乱的没有任何规律,乱得没有办法分析和预测?
好吧,如果你是这样认为的,也不能说全是错的,但是没有认识到随机的核心含义。
随机的核心是什么呢?
随机代表的不是乱,指的是不预先设定任何立场,不代表任何特定情况。它表示了所有的情况出现的概率是均等的,无法通过常识和经验进行预测。
其疾如风,其徐如林,侵掠如火,不动如山,难知如阴,动如雷震。
——孙子兵法,军争篇
最著名的随机,就是所谓的素数——它随机的出现在数轴的位置上,没有任何规律,无法预测。
在空间统计学上,我们的随机指的有两个含义:
1、是在空间上,某个要素出现的位置没有规律,在整个研究区域内所有位置出现的概率都是均等的。
2、在属性上,空间位置不发生变化的情况下,某个特定要素的值(可以分为高值以及低值)出现的在任何空间位置上的概率是均等的。
所以,空间统计学上,空间位置和要素属性,二者共同作用,所形成的规律才是空间分布规律,任何一方的特性都不能判定为随机分布,如下图所示:
如果不看属性,那么妥妥的是随机分布(废话,虾神我就是用创建随机数工具生成的)。
那么,如果给上这样的属性值呢:
那么我们发现,就是妥妥的聚集分布了——每个要素旁边,大概率出现的都是类似(同一类)的要素。
或者下面这样的分布:
从空间上看,绝对的聚集分布——在四个角上的聚集区,数据的密度远高于平均值。但是如果在属性上这样:
那么就又变成随机的分布了。
从上面这个例子,我们可以简单的做出如下在总结(划重点,要考):
1、在空间统计里面,判断空间分布(聚集、离散、随机)的关键,在于空间关系与属性信息的共同作用。
2、空间关系决定了分布的判定基础,它定义两个要素之间是否存在相邻关系
3、属性信息决定了空间分布的判定结果,它决定了最终样本之间的分布模式。
看到这里,不知道有没有同学会想到这样一个问题,比如我们要计算某个种群,比如就是某个树种的空间分布吧:
因为同一个树种,可以视他们的值都是一样的,那么你怎么算,都有可能是不正确的,比如你用距离计算,指定一个比较小的距离,得到的结果可能就是离散,而用比较大的距离,得到的结果可能就是聚集。用一个中等距离,那么得到的就是随机。(虽然有三种不同的可能,但是从理论上说都是正确的,因为不同的空间关系定义,肯定会带来不同的结果。)——这里下挖个坑,等我们讲空间关系矩阵的时候,会详细说明,当然,如果等不及新版,可以看旧版文章:
那么有没有一个比较客观的分析思路,来判断这个树种到底呈现什么分布呢?还是一样,所谓“抛开计量谈毒性就是耍流氓”,抛开空间尺度谈空间关系也是耍流氓……
所以我们可以先定义一个固定的空间尺度,比如我下面所示的,我设置1.5*1.5公里为一个格网,然后按照该格网里面,是否有该树种,把数据转换了这种二值化的格网数据:
之后我们就可以用这种格网数据来做空间自相关来判断数据的分布情况了,这种方法也被叫做joinCount算法,等不及看新版的,也可以看以前我写过的旧版文章:
当然,我们在做这种种群类分析的时候,肯定不能只有一个种群的,所以我们可以把其他的数据也给加上来,比如下面这种:
绿色代表我们需要分析的种群,水红色代表其他的种群,这样就可以很轻易的分析出结果来了。
好吧,说到这里我突然发现我跑题了……后面这两种分析分析应该在其他的章节里面讲,所以我们继续回归正题。
我们继续说随机的力量。
刚才说到了某个树种的空间分布,那么我们想,怎么样的分布,才是健康的呢?聚集?离散?还是随机?我们把这三种模式对比做成下面的表格:
特征描述优点缺点聚集该树种分布呈现聚集模式,表示有群居性特征,可能是因为对某些生在条件具有比较苛刻的需求因为大部分树种都会集中在某个区域内,所以比较容易寻找、管理、保护。对生存条件比较苛刻,也容易遭受各种灾害的侵袭。随机分布呈现随机模式,表示该树种对生存环境无特殊要求,在任何地方都有被发现的可能树种的生存能力强,没有特别的条件需求。不容易集中进行保护和管理。离散分布呈现离散模式,表示该树种有比较强烈的生存竞争性。另外可能与其他树种有比较好的相生性。适合于其他树种(物种)搭配种植,形成良好的生态圈。物种本身可能比较稀少,且不容易保护。
从一个物种的生存能力上看,最健壮的肯定是随机——到处都有。但是一般来说,随机分布的物种,都具有很强的生存能力——比如野草、灌木。
自然界是这样,那么社会学研究中呢?也是一样,如下面这个例子:
我们在研究教育公平性的时候,通常会用学校同年级之间的平均分来进行研究,假设在一个城市中,我们所有学区的生源质量、教育水平和师资力量都是均等的话,那么理论上应该是呈现随机分布,也就是所有区域出现高分学生和低分学生的概率都是均等。
这是比较合理的分布,学霸区和学渣区呈现随机分布。
但是实际上我们发现,会呈现这两类状态的会比较多:
第一种就是学霸区打堆,其他都是学渣区……
以上的分布是妥妥的聚集分布,学渣和学渣打堆,学霸和学霸打堆,酱油和酱油扎堆。那么这种分布确实,实际上也是一种教育资源不均衡的体现了,但是还有更夸张的,比如这样的分布:
典型的大树底下不长草,所有的资源都被几个所谓的学霸区给吸取过了,实际上这也是近些年,我国的教育呈现的趋势,好的学校,到处去挖人(挖学生,挖老师)导致强者越强,而弱者越弱。
老子在几千年前就说过:天之道损有余而补不足。人道则不然,损不足,奉有余。资源、机会这种东西,最自然完美的实际上就是所谓的随机,大家机会均等,如天道一般,损有余,以补不足。但是现实中,也恰恰印证了人道的发展,损不足,奉有余。
所以理想中政府的一个重要职责,就是调节社会资源,所谓:天心不足,我心补之。
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D
转发、转载和爬虫,请主动保留此声明。
新版白话空间统计(13):随机的力量相关推荐
- 新版白话空间统计(21)平均最近邻
前面的章节里面,我们看了很多关于空间分布模式的基本原理,从这一章节开始,我们讲一些具体的工具和算法的使用. 前面我们用莫兰指数.P值.Z得分啥的,可以得出一份数据是属于离散.随机还是聚集,并且通过各种 ...
- 新版白话空间统计(1):前言与地理学第一定律
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 前言 2015年7月27日,虾神在csdn博客频道,首次放出第一篇白话空间统计,到今天已经4年多了. ...
- arcgis设置nodata值_新版白话空间统计(6):在ArcGIS中实现莫兰指数计算
上一篇简单说了一下莫兰指数的计算原理和计算公式,如果是学生或者基础研究者,鼓励好好的学习一下手算或者编程计算,所谓的基础不牢,地动山摇--但是对于工程界和应用人士,特别是非基础学,重复造轮子是没有啥意 ...
- 新版白话空间统计(12):P值的表达以及空间统计上的特性
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 上篇文章简单介绍了P值与Z得分的一些基本概念,大家其实也都知道,P值和Z得分其实是有一定的相应关系的, ...
- 新版白话空间统计(6):在ArcGIS中实现莫兰指数计算
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 上一篇简单说了一下莫兰指数的计算原理和计算公式,如果是学生或者基础研究者,鼓励好好的学习一下手算或者编 ...
- 新版白话空间统计(25):方向分布(标准差椭圆)
方向分布是虾神最喜欢的一个空间统计工具,也是最简单明了,但是用处很广的一个 点模式的分析中,一般会考察如下五种内容: 1.点的疏密,包括点数据的分布探索,是否一致.均匀或者不均匀. 2.点的方位,包括 ...
- 新版白话空间统计(22):中心要素
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 美国著名统计学家,统计学史专家,芝加哥大学统计学院教授Stephen M. Stigler(斯蒂芬.斯 ...
- 新版白话空间统计(15)空间关系概念化之距离
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 首先祭出镇文神图: 空间统计学最核心的,就是对空间区域分布特性进行研究,所以要做任何空间分布分析,就需 ...
- 新版白话空间统计(16)空间关系概念化之固定距离
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 镇文神图: 中学物理第一课就是参照物的说明,空间统计里面的各种分析,有着天然的参照物,也就是物理存在的 ...
最新文章
- 学习Kotlin(二)基本语法
- java跳转_java 跳转语句
- jax-rs jax-ws_极端懒惰:使用Spring Boot开发JAX-RS服务
- [css] css的加载会阻塞js运行吗?为什么?
- 软件测试为什么要学python_第一章 为什么要学习软件测试
- NYOJ599 - 奋斗的小蜗牛
- redis - 00 在centos安装
- CAD导出JPG如何控制转换质量?
- HTML学生个人网站作业设计:动漫网站设计——哆啦A梦(5页) HTML+CSS+JavaScript 简单DIV布局个人介绍网页模板代码 DW学生个人网站制作成品下载
- EXCEL的各种“空”的区别:blank,““ , 0 ,以及 VBA里的各种空值:empty,null,nothing 等
- ZZNUOJ_用C语言编写程序实现1236:数的逆转(附完整源码)
- python中range函数是什么意思_python中range什么意思
- 【软考 系统架构设计师】计算机组成与体系结构⑥ 流水线
- VS配色方案你值得拥有
- rqt teb参数动态调试工具_teb
- ubuntu20.04安装PX4固件错误总结
- php微信消息管理接口_PHP微信接口 公共平台消息回复类库
- python本科生就业_准备报学习机构学习大数据、Java或者python,是计算机专业的本科生,请问选择哪种就业发展比较好?...
- 动态分析和静态分析最主要的区别是什么?
- Fluent的入门、边界条件设置、求解器(Solver)设置、湍流模型(Models)设置、UDF、物理模型等