本福特定律和齐夫定律是一回事吗
关于本福特定律的简单解释和推导,参见:
https://zhuanlan.zhihu.com/p/440462854
思考本福特定律,与齐夫定律对照,它们之间似乎可以相互推导,是真的吗?
本福特定律说首数为nnn的概率:P(n)=log10n+1n=log10(n+1)−log10nP(n)=\log_{10}\dfrac{n+1}{n}=\log_{10}(n+1)-\log_{10}nP(n)=log10nn+1=log10(n+1)−log10n
写成连续的形式:P(x)=log10(x+1)−log10xP(x)=\log_{10}(x+1)-\log_{10}xP(x)=log10(x+1)−log10x
从这个形式上看,它是一个定积分∫xx+1log10endn\displaystyle\int_x^{x+1}\dfrac{\log_{10}e}{n}dn∫xx+1nlog10edn 。设不定积分式为F(x)F(x)F(x),则:
F(x)=∫log10exdxF(x)=\displaystyle\int\dfrac{\log_{10}e}{x}dxF(x)=∫xlog10edx
积分F(x)F(x)F(x)实际上就是所有首数字概率的积累分布函数,其概率密度函数为一个反比例函数:
f(x)=log10exf(x)=\dfrac{\log_{10}e}{x}f(x)=xlog10e
从本福特定律的概念上讲,首数字为nnn的概率可以写成两种形式:
- 定积分的形式:Pint(n)=F(x)∣nn+1P_{int}(n)=F(x)|_n^{n+1}Pint(n)=F(x)∣nn+1
- 概率密度的形式:Pprob(n)=f(n)P_{prob}(n)=f(n)Pprob(n)=f(n)
连续化是为了拟合微积分计算,回到离散的形式:
Pprob(n)=f(n)=log10enP_{prob}(n)=f(n)=\dfrac{\log_{10}e}{n}Pprob(n)=f(n)=nlog10e
换一种写法:
Pprob(n)×n=log10eP_{prob}(n)\times n=\log_{10}ePprob(n)×n=log10e
这看起来符合齐夫定律。来看下是不是。
经过了连续~离散变换,连续情况下的反比例形式不能用于离散情况的计算,只能直观理解P(n)×n=常数CP(n)\times n=常数CP(n)×n=常数C。现在直接从本福特定律的结论入手,实际计算一下:
P(n)×n=n×log10n+1n=log10(n+1n)nP(n)\times n=n\times \log_{10}\dfrac{n+1}{n}=\log_{10}(\dfrac{n+1}{n})^nP(n)×n=n×log10nn+1=log10(nn+1)n
设:
g(n)=(n+1n)ng(n)=(\dfrac{n+1}{n})^ng(n)=(nn+1)n
g(n)g(n)g(n)快速逼近eee,但仅在nnn取1~9时,g(x)g(x)g(x)有意义,分别为:
g(1)=2,g(2)=2.25,g(3)=2.37,g(4)=2.44,g(5)=2.48,g(6)=2.52,g(7)=2.54,g(8)=2.56,g(9)=2.58g(1)=2, g(2)=2.25,g(3)=2.37,g(4)=2.44,g(5)=2.48,g(6)=2.52,g(7)=2.54,g(8)=2.56,g(9)=2.58g(1)=2,g(2)=2.25,g(3)=2.37,g(4)=2.44,g(5)=2.48,g(6)=2.52,g(7)=2.54,g(8)=2.56,g(9)=2.58
log10x\log_{10}xlog10x单调递增,计算log10g(1)\log_{10}g(1)log10g(1)和log10g(9)\log_{10}g(9)log10g(9)的值,分别为:
log10g(1)=0.301\log_{10}g(1)=0.301log10g(1)=0.301
log10g(9)=0.411\log_{10}g(9)=0.411log10g(9)=0.411
它们相差非常小,可近似为符合齐夫定律。
这是为什么?
通过上述推导,PintP_{int}Pint和PprobP_{prob}Pprob是可以相互转换的,只要可以将事情抽象成PintP_{int}Pint的定积分形式,结合概率密度函数和积累分布函数的概念,一定可以通过求导换算成PprobP_{prob}Pprob,后者正好是一个反比例函数。这意味着位标xxx与函数值f(x)f(x)f(x)的乘积是一个常数,这是满足齐夫定律的条件。
那么齐夫定律的典型case,城市人口问题是否可以写成类似P(n)=log10n+1nP(n)=\log_{10}\dfrac{n+1}{n}P(n)=log10nn+1的形式呢?是可以的。
城市人口来自于外来者的定居(城市没有土著,土著是乡村的概念),一个人选择哪个城市定居取决于多个维度,列如下:
D1=生活环境D_1=生活环境D1=生活环境
D2=工作机会D_2=工作机会D2=工作机会
D3=子女教育D_3=子女教育D3=子女教育
D4=生活设施D_4=生活设施D4=生活设施
D5=医疗资源D_5=医疗资源D5=医疗资源
…
设人们有NNN个城市CiC_iCi可选,它们综合排名如下:C1>C2>C3...CNC_1>C_2>C_3...C_NC1>C2>C3...CN,人们选择定居地时,会在这NNN个城市中考虑DiD_iDi:
- 若i<ji<ji<j,则优先考虑CiC_iCi
若问是什么初始因素导致了城市规模的初始差异,就要涉及优先依附原则了,这又要牵扯到无标度网络的生长动力学,本文不谈这些,所以直接假设了排名。
DiD_iDi几乎每人都会考虑,但D2D_2D2,D3D_3D3可能有人不关心。终于,可以将所有人按照下列方式分类:
- 只考虑D1D_1D1的人。
- 同时考虑D1,D2D_1,D_2D1,D2的人。
- 同时考虑D1,D2,D3D_1,D_2,D_3D1,D2,D3的人。
- 同时考虑D1,D2,D3,D4D_1,D_2,D_3,D_4D1,D2,D3,D4的人。
- 同时考虑D1,D2,D3,D4,D5D_1,D_2,D_3,D_4,D_5D1,D2,D3,D4,D5的人。
- …
无论如何,对于任何维度,排名靠前的城市一定被优先考虑。
进行下面的类比:
- 把上述考虑维度D1,D2,D3,...D_1,D_2,D_3,...D1,D2,D3,...看作自然数集首数概率问题中的个位,十位,百位…
- 把上述待考虑城市C1,C2,C3,...C_1,C_2,C_3,...C1,C2,C3,...看作自然数集首数概率问题中的1,2,3,...1,2,3,...1,2,3,...
- 把上述待定居人们的分类看作自然数集首数概率问题的个位数,十位数,百位数…
显然可以导出遵循齐夫定律的城市规模分布同样也遵循本福特定律:
- 第nnn大城市的人口占比:P=logNn+1nP=\log_N\dfrac{n+1}{n}P=logNnn+1
浙江温州皮鞋湿,下雨进水不会胖。
本福特定律和齐夫定律是一回事吗相关推荐
- 齐夫定律, Zipf's law,Zipfian distribution
齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律. 它可以表述为: 在 ...
- python作业|齐夫定律、平均多义性
题目(1):P82.第23题. 齐夫定律:f(w)是自由文本中词w的频率.假设一个文本中的所有词都按照它们的频率排名,频率最高的排在最前面.齐夫定律指出一个词类型的频率与它的排名成反比(即f*r=k, ...
- 计算机科学三大定律和网络三大定律
计算机科学三大定律 一.摩尔定律 摩尔定律是由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的.其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月 ...
- 计算机科学三大定律和网络三大定律 1
计算机科学三大定律 一.摩尔定律 摩尔定律是由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的.其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月 ...
- [电路]3-基尔霍夫定律
[电路]系列文章目录 1-发出功率和吸收功率关系 2-独立源和受控源 3-基尔霍夫定律 文章目录 [电路]系列文章目录 一.基尔霍夫定律 1.基尔霍夫电流定律(KCL) 2.基尔霍夫电压定律(KVL) ...
- 每天一个---- 吉尔德定律和迈特卡尔定律
吉尔德定律 即主干网带宽的增长速度至少是运算性能增长速度的三倍.因为运算性能增长速度主要是由摩尔定律决定的,所以根据每18个月运算性能提高一倍计算,主干网的网络带宽的增长速度大概是每6个月增长一倍.而 ...
- 布尔定律---布尔代数的基本定律
一.单变量布尔定律 1.0-1定律 2.互补定律 3.重叠定律 4.还原定律 小结:或运算和与运算定律的差别在于:所有的"|"运算符换成"&",运算结果 ...
- 管理学定律四:手表定律与破窗理论
1.手表定律 1.1 来源 手表定律是指一个人有一只表时,可以知道现在是几点钟,而当他同时拥有两只表时却无法确定.两只表并不能告诉一个人更准确的时间,反而会使看表的人失去对准确时间的信心.它的提出者是 ...
- atitit.管理学三大定律:彼得原理、墨菲定律、帕金森定律
atitit.管理学三大定律:彼得原理.墨菲定律.帕金森定律 彼得原理(The Peter Principle) 1 彼得原理解决方案1 帕金森定律 2 如何理解墨菲定律2 彼得原理(The Pete ...
最新文章
- java、intellij idea、groovy
- 初学C++正则表达式(regex)
- Cnblogs美化总结
- 【python 3.6】python读取json数据存入MySQL(一)
- c语言实验报告熟悉vc,C语言实验报告源代码
- python ide是什么意思_初学Python使用什么IDE会更好?
- ubuntu 安装vnc_vnc4server arm架构
- Java之数据库基础理论
- 新编C语言习题与解析,新编C语言习题与解析
- [置顶] 龙芯2f笔记本- openbsd5.4安装手记
- “特困生”卷出睡眠市场,疯狂氪金能不能氪出“好故事”?
- 世界上最简单的会计书(先进先出法VS后进先出法)
- 刚入职的程序员小白你该如何提升自己?(新手看)
- 互联网日报 | 华为鸿蒙OS 2.0正式发布;微信小程序日活用户超4亿;百胜中国回港上市首日破发...
- 替代SSD?Crossbar进军中国存储市场
- 5G已开始商用 目前提供5G商用服务的国家有哪些
- 用示波器调出李萨如图形
- Exception in thread “Thread-2“ java.util.ConcurrentModificationException异常的解决方案
- [C++11]_[初级]_[十六进制字符串转换为字节数组]
- .3000米长的绳子,每天减一半。问多少天这个绳子会小于5米?不考虑小数。