人类动力学发展史

长久以来,对人类行为的研究吸引了包括心理学、社会学、社会心理学、人类学在内的众多学科的共同关注,得到了大量的定性研究成果。这些研究成果有助于揭示人类行为的普遍规律,以便对其进行有效控制和预测,使人按照一定的社会生产和生活的需要来行动,既能维持社会生活的正常秩序,又能更好地促进社会和人类自身的发展。
由于人是一个系统的存在,而这个系统又可以继续划分为人的个体性和社会性两个子系统,而“整个世界是相互联系的”正是系统理论的一个核心观点,因此利用系统理论和复杂性科学解释人类行为成了一个新兴的研究热点。
过去,当通信运营商需要估计移动通信中占线的电话数量并优化资源配置、交通部门想要模拟交通流量的模式或事故发生频率、以及网络和街区零售业意欲改进仓储和服务设置时,人们往往用齐次泊松过程来描述这些问题。而2005年Barabasi发表在Nature上的一篇文章却显示人类行为的时间规律具有高度的非均匀性:在非常长的时间内可能了无一事,而这些长长的空白与空白之间则被阵发的密集活动所填充。
Barabasi等人的工作开创了“人类动力学”的新研究方向。尽管这个方向问世时间很短,但是由于其理论和应用上的双重价值,很快就吸引了数学、系统科学、统计物理和非线性科学等领域科学家的大量关注,对现实生活、工作中人类活动的大量定量研究成果不断面世,如商业交易、网页浏览、电影点播、在线游戏、手机短信、邮件通信等,均得到了人类行为发生的间隔时间服从幂律分布的结论,且幂指数大多分布在1至3之间。
随着时间的推进,人类动力学研究不断向着多元化方向发展。各个领域学者关注的方向不再仅仅局限在人类行为的时间规律上,而是扩展到了空间规律,特别是人类的迁移规律上;研究的角度也从个体行为层面扩展到了宏观的组织行为层面微观的生理现象层面,更加关注人作为一个复杂系统其内部各个要素之间的联系以及系统与外部环境的相互作用和影响。更重要的是,在实证研究的基础上进行了大量的理论分析,提出了多种模型来解释这种非泊松统计特征出现的原因。

人类动力学的基本概念

人类动力学是一门新兴的交叉学科,综合借鉴了数学的原理、物理的方法、系统的思想来对人类行为进行研究,在发现人类行为的统计规律的同时力求寻找表明现象下的深层机制。

人类动力学基础知识

长久以来,由于缺乏现代化的统计工具和方法,出于对问题的简化,人们认为人类行为的发生是均匀的长时间的静默短时间的爆发可被忽略。也就是说人类行为可由泊松过程刻画,即行为发生的时间间隔服从负指数分布事件发生的数量服从泊松分布
随着数据存储能力、数据挖掘算法和分析处理技术的长足发展和广泛应用,人们得以从海量数据中挖掘有用信息。Barabasi在对电子邮件和传统信件的研究中发现人类行为的时间间隔分布并不都是均匀的,而是具有阵发重尾的特征。所谓“阵发(burst)”,是指某一事件常常在短期内频繁出现,尔后又在很长的一段时间里销声匿迹。而“重尾分布(heavy-tailed distribution)”是指一类不存在指数阶矩的分布函数,即

较为直观的定义是:如果密度函数是以幂指数衰减至0的,则称该分布函数为重尾的。也有将长尾分布称为重尾分布的文献。

如下图(左图为泊松分布,右图为重尾分布)所示,与泊松分布相比,重尾分布的衰减速度较慢且拖着长长的尾巴,使得出现较大观测值的概率远远高于基于泊松分布的预测,反应在时间间隔的分布规律上即“阵发”特征。

在人类动力学的实证分析中普遍存在的分布形式是幂律分布及其各种扩展形式。数学上,如果一个随机变量X的密度函数为

则称X服从幂律分布。其中α是一个常量,称为幂律分布的幂指数或标度参数。幂律分布是一类特殊的重尾分布。现实情况中很少有分布能在整个取值范围内服从幂律分布,并且幂律分布不存在峰值,在幂指数为正值的情况下,概率分布会随x→0并在某最小值xmin以下偏离幂律,而这个最小值不一定那么明显,所以我们常说某分布的尾部服从幂律,或者某变量具有“幂律尾巴”。
幂律分布具有多种多样的表现形式,广泛存在于众多学科领域中。由下图(泊松分布和重尾分布的人类动力学行为模式)可以看出,
幂律分布
表现出很强的非均匀性,这种非均匀性说明不能用一个统一的“标度(scale)”来表征幂律分布所描述的数据集。事实上,幂律分布是唯一具有无标度性质(scale-free)的分布,当密度函数为f(X)=Cx时:

也就是说,当度量变量x的单位或“标度”变化常数b倍时,分布f(x)的形式不变。

(a.泊松过程给出的1000个连续事件的序列,每一条竖线代表一个事件发生。b.连续事件的时间间隔,线段在垂直方向的长度对应a中连续竖线间的空白长度。c.给出图a、b的泊松过程中两个连续事件的时间间隔分布,服从指数规律,在半对数坐标下表现为一条直线。d.具有重尾分布的1000个连续事件。e.连续事件的时间间隔,均值与图a中泊松过程的均值相同。f.给出图d、e中具有重尾的时间间隔分布,服从幂律,在双对数坐标下表现为斜率为幂指数相反数的一条直线。)
对式f(X)=Cx两边取对数可以发现InyInx满足线性关系,即在双对数坐标下表现为一条斜率为-α的直线。因此,在实证研究中利用一元线性回归模型和最小二乘法得到二者的经验回归直线方程成为获得yx之间幂律关系的简便方法。但是越来越多的研究发现该方法得到的幂指数与真实值之间可能存在较大差异。对此,可以采用极大似然估计法并按照公式

来分别计算幂指数及其标准差,并对幂指数进行Kolmogorov-Smirnov检验。
由于统计误差的存在,数据的尾部可能出现较大的波动,我们既可以用“装箱(bining)”的方法来消除这种波动,也可以计算数据的累计分布函数。若原分布f(X)=Cx满足幂律,则其累计分布

也服从幂律分布,且幂指数比原分布的幂指数小1。使用累计分布不仅可以消除尾部波动,还可以避免难以准确确定装箱宽度的问题,并且对所有数据有较好的使用效果,不丢失任何信息。
对重尾分布研究做出重要贡献的科学家有Zipf和Pareto。1932年,语言学专家Zipf发现如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率与它的名次的常数次幂存在如同式f(X)=Cx的反比关系,这种分布就称为Zipf定律。而经济学家Pareto在研究了个人收入X的统计分布后发现大多数的社会财富掌握在少数人手中,个人收入不小于某个特定值x的概率与x的常数次幂存在简单的反比关系:P(X≥x)~x-k,即为Pareto定律。实际上,二者都是简单的幂律函数,Zipf定律是幂律分布在有限值域上的离散形式,而Pareto定律是幂律分布的一种累积形式。
另外,很多分布并不能由单一的幂律分布刻画,而是呈现出分段的形式,需要多个甚至多种分布共同刻画。并且具有宽广尾部的分布不只有幂律分布,还有对数正态分布、广延指数分布和带有指数截断的幂律分布等形式,有些文献还用“漂移幂率(shifted power-law)”来刻画重尾,密度函数为f(x)=C(x+θ),其中参数θ可以控制分布在幂律(θ=0)与指数(θ→无穷)之间自由转换。
需要特别注意的是,目前人类动力学领域的文献中对于“重尾分布”这一概念的使用非常宽泛,也不严格区分重尾分布和幂律分布。一般情况下,那些明显偏离泊松形态、具有宽广尾部的分布都被归为重尾分布,既包括如幂律分布这样的单一分布形式,也包括了如幂律和指数相结合的各种混合分布形式,尽管后者并不严格满足重尾定义中不存在指数阶矩的要求。
由于人类动力学中涉及到的间隔时间、等待时间和逗留时间等主要指标是连续型随机变量,因此上述主要论述的是连续型随机变量的重尾分布和幂律分布。对于复杂网络和人类动力学中涉及到的离散型随机变量的幂律分布的定义可参考最近的文献。

人类(行为)动力学模型简介

在众多领域发现重尾特征的人类行为时空标度律后,这样的重尾特征是如何产生的成为一个亟待解决的重要课题,众多学者从不同角度进行了尝试。Barabasi率先提出了基于优先权的排队模型并引起了广泛的关注和讨论,随后可能产生重尾的其它机制不断被提出,如兴趣、记忆、截止时间、人与人之间的相互作用和影响、不同的任务类型和排队规则等。

基于优先权决策的排队模型

Barabasi将人每天要做的事情看作一个有L个任务的优先权列表,认为绝大多数由人发起的事件都需要个体评定和区分各项活动的优先顺序,即为每一项任务确定一个优先权x,表示每个任务的紧急程度。给定的任务在列表中的等待时间取决于主体的优先权选择策略,常用的协议先进先出(FCFS)随机选择(RS)和最高优先权优先(HPF)三种,Barabasi认为第三种协议是最重要的,并由此建立人类动力学模型如下:

  • 1)每个个体有一个包含L个任务的列表,每个任务都赋予一个优先权参数xi,其中i=1,2,……,L,优先权参数由均匀分布ρ(x)生成;
  • 2)每个时间步,个体以p的概率选择一个优先权最高的任务执行,以1-p的概率随机选择一个任务执行,一个任务完成之后将从任务列表中删除并加入一个新的任务。这样,模型在p→1时相当于确定型的先进先出协议,而当p→0时相当于随机型的随机选择协议。

随后该模型得到了精确解析,模拟显示,当队长不可变或可变时,该模型可以产生幂律的等待时间分布(指数分别为1和1.5),且所得分布与ρ(x)无关。实际上,ρ(x)在任务到达时分配完毕后就不再变化,因此那些具有较小优先权的任务会长时间停留在任务列表中久久得不到服务从而产生等待时间的重尾。
以上模型只考虑了产生重尾的最基本的条件,即具有优先权决策的任务队列,我们可以通过添加新的条件或者改变模型参数的取值使其适应不同的实际情况。例如,现实中人们的许多任务即便优先权再低也是不可能无限期的等待的,随着时间的推移必定进入一种“不能在拖”的状态,这种情况可以通过引入一种优先权指数随着时间t单调增加的老龄化机制来解决。这种情况下低优先权的任务会在长时间等待后具有较高的优先权,同时系统服务率也是关于优先权指数的单调递增函数,从而解析得到了系统中等待任务数量的幂律分布。另外,任务执行的截止时间和等待成本也是十分贴近实际的改进,关于前者将在下一小节中专门介绍。
另外,鉴于人能够记住的优先权数目以及优先权列表的长度是有限的,因此原始模型假设任务的到达率λ和服务率μ相等,从而任务列表长度L为常数,此时的幂律分布的指数为1,而在队长可变的情况下可以产生指数为1.5的间隔时间的幂律分布。后一种情况下,任务的等待时间分布P(τ)随λ和μ的取值不同而有所差别:λ≥μ时,P(τ)——τ-3/2;而λ<μ时,P(τ)——τ-5/2e-τ/τ0(其中τ0是一个特征时间长度)。说明复杂系统在服务强度为1的临界值两侧表现出不同的标度特征。

人类(行为)动力学(1)——初步了解相关推荐

  1. 大脑-计算机界面(bci,BrainOS人类大脑智能操作系统初步成果被展出

    美国东部时间8月26日晚上10点,北京时间8月27日早上10点,哈佛创新实验室的华人脑机接口创业企业BrainCo在位于美国波士顿的哈佛大学展示了BrainOS人类大脑智能操作系统的初步成果. 据了解 ...

  2. 人类(行为)动力学(3)——分布规律

    人类行为动力学分布规律 随着数据存储能力.数据挖掘算法和分析处理技术的长期发展和广泛应用,人们从大量数据中总结出不同的分布规律. 1.正态/高斯分布 正态分布(Normal distribution) ...

  3. 人类(行为)动力学(2)——主要分析指标

    人类动力学主要分析指标 人类动力学主要分析指标有:时间间隔.阵发性.记忆性.活跃度和波动性. 时间间隔 时间间隔是连续发生的两次行为之间的时间差. 阵发性 阵发性是指某一事件常常在短期内频繁出现,然后 ...

  4. Cell Reports : 人脑中的湍流状动力学

    <本文同步发布于"脑之说"微信公众号,欢迎搜索关注~~> 1.总结 湍流促进了物理系统中跨尺度的能量/信息快速传输.这些特性对大脑功能很重要,但目前尚不清楚大脑内部的动 ...

  5. 用计算机创造一个虚拟世界,人类世界是不是一个虚拟程序?一起来探索

    佛日:"色即是空,空即是色""凡所有相,皆是虚妄". 一切皆在总共33层的"三界六道"中轮回,大千世界皆是虚妄,只有经过"涅槃&q ...

  6. 《Photoshop Lab修色圣典(修订版)》目录—导读

    版权声明 Photoshop Lab修色圣典(修订版) Dan Margulis: Photoshop Lab Color: The Canyon Conundrum and Other Advent ...

  7. 马斯克脑机接口、BrainOS相继发布,不努力也能有出路了

    作者 | 马超 责编 | Carol 封图 | CSDN 下载自视觉中国 在北京时间的8月29日凌晨,钢铁侠埃隆·马斯克投资1亿多美元的脑机接口初创公司公司Neuralink(http://www.n ...

  8. 三个简单的问题,让你顺势而为

    成为啊噗星人 搜索微信号:apu_app.订阅啊噗微信公众号,不定期有惊喜,要关注起来哦! 在这个充满不确定性的时代,你或许会被不再奏效的旧习惯和老思路缚住手脚,寸步难行.提出三个简单的问题,能够帮助 ...

  9. 马斯克脑机接口、BrainOS 相继发布,未来已来?

    作者 | 马超 责编 | Carol 封图 | CSDN 下载自视觉中国 在北京时间的8月29日凌晨,钢铁侠埃隆·马斯克投资1亿多美元的脑机接口初创公司公司Neuralink进行现场发布会,展示新一代 ...

  10. scdl matlab,5自由度移动机器人的建模与仿真-硕士论文

    <5自由度移动机器人的建模与仿真-硕士论文.pdf>由会员分享,可在线阅读全文,更多相关<5自由度移动机器人的建模与仿真-硕士论文>请在www.woc88.com上搜索. 1. ...

最新文章

  1. python查找文件夹下的文件,python 查找文件夹下所有文件 实现代码 -电脑资料
  2. jQuery属性操作
  3. [codevs 1227] 方格取数2
  4. JFFS2文件系统挂载过程优化的分析报告
  5. Linux的ftp设置
  6. 傻瓜攻略(二)——MATLAB数据挖掘之Apriori算法实现
  7. UVA 10131 Is Bigger Smarter? (DP,最长条件子序列)
  8. BZOJ1864: [Zjoi2006]三色二叉树
  9. 激光投影仪和大屏液晶电视有哪些优缺点?二者应该怎么选?
  10. 黑客如何用线程注射技术隐藏自己的病毒
  11. allegro 移动元件时飞线隐藏或者拖动元件时飞线不显示?
  12. android 自定view 网状结构图
  13. 阿里云服务器开发实践:使用云服务器ECS搭建DoH服务
  14. java实习报告范文
  15. 跑步适合戴哪种耳机不掉?专业跑步耳机推荐
  16. 【全网力荐】堪称最易学的Python基础入门教程
  17. NLP-Task1:基于机器学习的文本分类
  18. 笔记本电脑计算机恢复出厂设置密码,如何恢复笔记本计算机的出厂设置以恢复初始设置方法...
  19. 判断苹果黑条_Clover 引导界面分辨率完美了,但苹果进度条快加载完毕时会花屏一下。...
  20. 案例 | 光大银行如何解决传统监控痛点,打造一体化监控平台?

热门文章

  1. 平时常见的音频文件格式有哪些呢?
  2. python爬取高德poi数据_高德地图之python爬取POI数据及其边界经纬度
  3. 信号与系统——初识信号的原理与分类
  4. windows mobile进程查看器开发(二)—— 停止进程
  5. 洛谷OJ:P3811 【模板】乘法逆元(线性递推求逆元)
  6. 菜鸟教程(Java)笔记——Java教程
  7. 批处理通过bat文件定时调起本地的计算器或者画图工具并关闭
  8. SQL Server 2019 软件安装包免费下载以及安装教程
  9. visio图片插入word,Acrobat导出pdf格式错乱
  10. 解决visio图片生成PDF有留白的问题