关于本福特定律的简单解释和推导,参见:
https://zhuanlan.zhihu.com/p/440462854

思考本福特定律,与齐夫定律对照,它们之间似乎可以相互推导,是真的吗?

本福特定律说首数为nnn的概率:P(n)=log⁡10n+1n=log⁡10(n+1)−log⁡10nP(n)=\log_{10}\dfrac{n+1}{n}=\log_{10}(n+1)-\log_{10}nP(n)=log10​nn+1​=log10​(n+1)−log10​n

写成连续的形式:P(x)=log⁡10(x+1)−log⁡10xP(x)=\log_{10}(x+1)-\log_{10}xP(x)=log10​(x+1)−log10​x

从这个形式上看,它是一个定积分∫xx+1log⁡10endn\displaystyle\int_x^{x+1}\dfrac{\log_{10}e}{n}dn∫xx+1​nlog10​e​dn 。设不定积分式为F(x)F(x)F(x),则:

F(x)=∫log⁡10exdxF(x)=\displaystyle\int\dfrac{\log_{10}e}{x}dxF(x)=∫xlog10​e​dx

积分F(x)F(x)F(x)实际上就是所有首数字概率的积累分布函数,其概率密度函数为一个反比例函数:

f(x)=log⁡10exf(x)=\dfrac{\log_{10}e}{x}f(x)=xlog10​e​

从本福特定律的概念上讲,首数字为nnn的概率可以写成两种形式:

  • 定积分的形式:Pint(n)=F(x)∣nn+1P_{int}(n)=F(x)|_n^{n+1}Pint​(n)=F(x)∣nn+1​
  • 概率密度的形式:Pprob(n)=f(n)P_{prob}(n)=f(n)Pprob​(n)=f(n)

连续化是为了拟合微积分计算,回到离散的形式:

Pprob(n)=f(n)=log⁡10enP_{prob}(n)=f(n)=\dfrac{\log_{10}e}{n}Pprob​(n)=f(n)=nlog10​e​

换一种写法:

Pprob(n)×n=log⁡10eP_{prob}(n)\times n=\log_{10}ePprob​(n)×n=log10​e

这看起来符合齐夫定律。来看下是不是。

经过了连续~离散变换,连续情况下的反比例形式不能用于离散情况的计算,只能直观理解P(n)×n=常数CP(n)\times n=常数CP(n)×n=常数C。现在直接从本福特定律的结论入手,实际计算一下:

P(n)×n=n×log⁡10n+1n=log⁡10(n+1n)nP(n)\times n=n\times \log_{10}\dfrac{n+1}{n}=\log_{10}(\dfrac{n+1}{n})^nP(n)×n=n×log10​nn+1​=log10​(nn+1​)n

设:

g(n)=(n+1n)ng(n)=(\dfrac{n+1}{n})^ng(n)=(nn+1​)n

g(n)g(n)g(n)快速逼近eee,但仅在nnn取1~9时,g(x)g(x)g(x)有意义,分别为:

g(1)=2,g(2)=2.25,g(3)=2.37,g(4)=2.44,g(5)=2.48,g(6)=2.52,g(7)=2.54,g(8)=2.56,g(9)=2.58g(1)=2, g(2)=2.25,g(3)=2.37,g(4)=2.44,g(5)=2.48,g(6)=2.52,g(7)=2.54,g(8)=2.56,g(9)=2.58g(1)=2,g(2)=2.25,g(3)=2.37,g(4)=2.44,g(5)=2.48,g(6)=2.52,g(7)=2.54,g(8)=2.56,g(9)=2.58

log⁡10x\log_{10}xlog10​x单调递增,计算log⁡10g(1)\log_{10}g(1)log10​g(1)和log⁡10g(9)\log_{10}g(9)log10​g(9)的值,分别为:

log⁡10g(1)=0.301\log_{10}g(1)=0.301log10​g(1)=0.301
log⁡10g(9)=0.411\log_{10}g(9)=0.411log10​g(9)=0.411

它们相差非常小,可近似为符合齐夫定律。

这是为什么?

通过上述推导,PintP_{int}Pint​和PprobP_{prob}Pprob​是可以相互转换的,只要可以将事情抽象成PintP_{int}Pint​的定积分形式,结合概率密度函数和积累分布函数的概念,一定可以通过求导换算成PprobP_{prob}Pprob​,后者正好是一个反比例函数。这意味着位标xxx与函数值f(x)f(x)f(x)的乘积是一个常数,这是满足齐夫定律的条件。

那么齐夫定律的典型case,城市人口问题是否可以写成类似P(n)=log⁡10n+1nP(n)=\log_{10}\dfrac{n+1}{n}P(n)=log10​nn+1​的形式呢?是可以的。

城市人口来自于外来者的定居(城市没有土著,土著是乡村的概念),一个人选择哪个城市定居取决于多个维度,列如下:

D1=生活环境D_1=生活环境D1​=生活环境
D2=工作机会D_2=工作机会D2​=工作机会
D3=子女教育D_3=子女教育D3​=子女教育
D4=生活设施D_4=生活设施D4​=生活设施
D5=医疗资源D_5=医疗资源D5​=医疗资源

设人们有NNN个城市CiC_iCi​可选,它们综合排名如下:C1>C2>C3...CNC_1>C_2>C_3...C_NC1​>C2​>C3​...CN​,人们选择定居地时,会在这NNN个城市中考虑DiD_iDi​:

  • 若i<ji<ji<j,则优先考虑CiC_iCi​

若问是什么初始因素导致了城市规模的初始差异,就要涉及优先依附原则了,这又要牵扯到无标度网络的生长动力学,本文不谈这些,所以直接假设了排名。

DiD_iDi​几乎每人都会考虑,但D2D_2D2​,D3D_3D3​可能有人不关心。终于,可以将所有人按照下列方式分类:

  • 只考虑D1D_1D1​的人。
  • 同时考虑D1,D2D_1,D_2D1​,D2​的人。
  • 同时考虑D1,D2,D3D_1,D_2,D_3D1​,D2​,D3​的人。
  • 同时考虑D1,D2,D3,D4D_1,D_2,D_3,D_4D1​,D2​,D3​,D4​的人。
  • 同时考虑D1,D2,D3,D4,D5D_1,D_2,D_3,D_4,D_5D1​,D2​,D3​,D4​,D5​的人。

无论如何,对于任何维度,排名靠前的城市一定被优先考虑。

进行下面的类比:

  • 把上述考虑维度D1,D2,D3,...D_1,D_2,D_3,...D1​,D2​,D3​,...看作自然数集首数概率问题中的个位,十位,百位…
  • 把上述待考虑城市C1,C2,C3,...C_1,C_2,C_3,...C1​,C2​,C3​,...看作自然数集首数概率问题中的1,2,3,...1,2,3,...1,2,3,...
  • 把上述待定居人们的分类看作自然数集首数概率问题的个位数,十位数,百位数…

显然可以导出遵循齐夫定律的城市规模分布同样也遵循本福特定律:

  • 第nnn大城市的人口占比:P=log⁡Nn+1nP=\log_N\dfrac{n+1}{n}P=logN​nn+1​

浙江温州皮鞋湿,下雨进水不会胖。

本福特定律和齐夫定律是一回事吗相关推荐

  1. 齐夫定律, Zipf's law,Zipfian distribution

    齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律. 它可以表述为: 在 ...

  2. python作业|齐夫定律、平均多义性

    题目(1):P82.第23题. 齐夫定律:f(w)是自由文本中词w的频率.假设一个文本中的所有词都按照它们的频率排名,频率最高的排在最前面.齐夫定律指出一个词类型的频率与它的排名成反比(即f*r=k, ...

  3. 计算机科学三大定律和网络三大定律

    计算机科学三大定律 一.摩尔定律 摩尔定律是由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的.其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月 ...

  4. 计算机科学三大定律和网络三大定律 1

    计算机科学三大定律 一.摩尔定律 摩尔定律是由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的.其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月 ...

  5. [电路]3-基尔霍夫定律

    [电路]系列文章目录 1-发出功率和吸收功率关系 2-独立源和受控源 3-基尔霍夫定律 文章目录 [电路]系列文章目录 一.基尔霍夫定律 1.基尔霍夫电流定律(KCL) 2.基尔霍夫电压定律(KVL) ...

  6. 每天一个---- 吉尔德定律和迈特卡尔定律

    吉尔德定律 即主干网带宽的增长速度至少是运算性能增长速度的三倍.因为运算性能增长速度主要是由摩尔定律决定的,所以根据每18个月运算性能提高一倍计算,主干网的网络带宽的增长速度大概是每6个月增长一倍.而 ...

  7. 布尔定律---布尔代数的基本定律

    一.单变量布尔定律 1.0-1定律 2.互补定律 3.重叠定律 4.还原定律 小结:或运算和与运算定律的差别在于:所有的"|"运算符换成"&",运算结果 ...

  8. 管理学定律四:手表定律与破窗理论

    1.手表定律 1.1 来源 手表定律是指一个人有一只表时,可以知道现在是几点钟,而当他同时拥有两只表时却无法确定.两只表并不能告诉一个人更准确的时间,反而会使看表的人失去对准确时间的信心.它的提出者是 ...

  9. atitit.管理学三大定律:彼得原理、墨菲定律、帕金森定律

    atitit.管理学三大定律:彼得原理.墨菲定律.帕金森定律 彼得原理(The Peter Principle) 1 彼得原理解决方案1 帕金森定律 2 如何理解墨菲定律2 彼得原理(The Pete ...

最新文章

  1. java、intellij idea、groovy
  2. 初学C++正则表达式(regex)
  3. Cnblogs美化总结
  4. 【python 3.6】python读取json数据存入MySQL(一)
  5. c语言实验报告熟悉vc,C语言实验报告源代码
  6. python ide是什么意思_初学Python使用什么IDE会更好?
  7. ubuntu 安装vnc_vnc4server arm架构
  8. Java之数据库基础理论
  9. 新编C语言习题与解析,新编C语言习题与解析
  10. [置顶] 龙芯2f笔记本- openbsd5.4安装手记
  11. “特困生”卷出睡眠市场,疯狂氪金能不能氪出“好故事”?
  12. 世界上最简单的会计书(先进先出法VS后进先出法)
  13. 刚入职的程序员小白你该如何提升自己?(新手看)
  14. 互联网日报 | 华为鸿蒙OS 2.0正式发布;微信小程序日活用户超4亿;百胜中国回港上市首日破发...
  15. 替代SSD?Crossbar进军中国存储市场
  16. 5G已开始商用 目前提供5G商用服务的国家有哪些
  17. 用示波器调出李萨如图形
  18. Exception in thread “Thread-2“ java.util.ConcurrentModificationException异常的解决方案
  19. [C++11]_[初级]_[十六进制字符串转换为字节数组]
  20. .3000米长的绳子,每天减一半。问多少天这个绳子会小于5米?不考虑小数。

热门文章

  1. SAP:远程调用RFC,SM59配置
  2. Spring中用到了哪些设计模式?
  3. MFC 给对话框添加图片背景
  4. 【机器学习】了解这12个机器学习核心知识点,轻松玩转机器学习项目。
  5. python安装报错2503_关于windows安装python过程中出现error 2503 2502错误的解决方法
  6. 互联网舆情监测系统困境及措施,TOOM舆情监控平台应对及处置?
  7. CAD梦想画图2023.02.26更新
  8. 建立用户信息类UserInfo,要求如下:
  9. PEX远程安装服务器
  10. RN设置statusBar