1 引言

统计力学的主题围绕对大系统宏观平衡态性质的形式化研究,而系统的每个基本元素遵循力学的微观定律。统计力学的主要目标是从微观元素推导出宏观物体的热力学性质。

系统越有序或者它的概率分布越集中,则熵越小。

2 统计力学

考虑具有许多自由度的物理系统,它可以驻留在大量可能状态中的任何一个。例如,用pip_ipi​表示一个随机系统中状态iii发生的概率:
(式1)pi≥0,对于所有ip_i \geq0,对于所有i \tag{式1}pi​≥0,对于所有i(式1)

(式2)∑ipi=1\sum _i p_i = 1 \tag{式2}i∑​pi​=1(式2)
用EiE_iEi​表示系统在状态iii时的能量,统计热力学基本结论告诉我们,当系统和它周围的环境处于热平衡时,一个基本的结果是状态iii发生的概率如下:
(式3)pi=1Zexp(−EikBT)p_i = \frac{1}{Z} exp(-\frac{E_i}{k_B T}) \tag{式3}pi​=Z1​exp(−kB​TEi​​)(式3)
其中TTT为开尔文绝对温度,kBk_BkB​为Boltzmann常数,Z为与状态无关的常数,将式2的定义代入式3中得到
(式4)Z=∑iexp(−EikBT)Z = \sum _i exp(-\frac{E_i}{k_B T}) \tag{式4}Z=i∑​exp(−kB​TEi​​)(式4)
规范化量Z称为状态或者剖分函数。式3的概率分布称为典型分布或者Gibbs分布;指数因子(−Ei/kBT-E_i/k_B T−Ei​/kB​T)称为Boltzmann因子。
对于Gibbs分布:
(1)能量低的状态比能量高的状态发生的概率高;
(2)随着温度T降低,概率集中在低能状态的一个更小的子集上。
温度T可以视为一种伪温度,它控制神经元"突触噪声"的热波动。将常数KBK_BKB​为单位1而重新度量之,因此可以重新定义概率pip_ipi​和剖分函数Z如下:
(式5)pi=1Zexp(−EiT)p_i = \frac{1}{Z} exp(- \frac{E_i}{T} ) \tag{式5}pi​=Z1​exp(−TEi​​)(式5)

(式6)Z=∑exp(−EiT)Z = \sum exp(- \frac{E_i}{T}) \tag{式6}Z=∑exp(−TEi​​)(式6)
T可以简单称为系统温度,
自由能量和熵
物理系统的Helmholtz自由能量记为F,由剖分函数定义如下:
(式7)F=−Tlog⁡ZF = - T\log Z \tag{式7}F=−TlogZ(式7)
系统的平均能量定义为:
(式8)&lt;E&gt;=∑ipiEi&lt;E&gt; = \sum_i p_i E_i \tag{式8}<E>=i∑​pi​Ei​(式8)
&lt;.&gt;&lt;.&gt;<.>表示总体平均运算,可以看出平均能量和自由能量之差为:
(式9)&lt;E&gt;−F=−T∑ipilog⁡pi&lt;E&gt; - F=-T \sum_i p_i \log p_i \tag{式9}<E>−F=−Ti∑​pi​logpi​(式9)
式子右边忽略温度T,称为系统的熵,表示为:
(式10)H=−∑ipilog⁡piH = - \sum_i p_i \log p_i \tag{式10}H=−i∑​pi​logpi​(式10)
因此式9可以重写为
&lt;E&gt;−F=TH&lt;E&gt; -F = TH<E>−F=TH
或等价于
(式11)F=&lt;E&gt;−THF = &lt;E&gt; - TH \tag{式11}F=<E>−TH(式11)
若两个系统AAA和A′A 'A′彼此热接触,假设系统AAA比系统A′A'A′更小,这样A′A'A′可以看作具有恒温T的热存储器,两个系统的总熵趋于依照关系式:
ΔH+ΔH′≥0\Delta H + \Delta H'\geq 0ΔH+ΔH′≥0
指系统FFF的自由能量逐渐降低至平衡态时变为最小。即为最小自由能量原则:
随机系统变元的自由能量的最小值在热平衡时达到,此时系统服从Gibbs分布,自然偏爱具有最小自由能量的物理系统。

3 马尔可夫链

考虑由多个随机变量组成的系统,其演化可由一个随机过程描述,随机变量XnX_nXn​在时刻n取值xnx_nxn​称为系统在n时刻的状态。随机变量所有可能的值构成的空间称为系统的状态空间。如果随机过程{Xn,n=1,2,...}\lbrace X_n,n =1,2,... \rbrace{Xn​,n=1,2,...}的构造使得Xn+1X_{n+1}Xn+1​的条件概率分布仅依靠于XnX_nXn​的值而与其他以前的值无关,称这个过程为马尔可夫链。更准确地说,我们有
(式12)P(Xn+1=xn+1∣Xn=xn,...,X1=x1)=P(Xn+1∣Xn=xn)P(X_{n+1} = x_{n+1}|X_n = x_n,...,X_1 = x_1)= P(X_{n+1}|X_n = x_n) \tag{式12}P(Xn+1​=xn+1​∣Xn​=xn​,...,X1​=x1​)=P(Xn+1​∣Xn​=xn​)(式12)
这称之为马尔可夫特性。换句话说:
如果系统在n+1n+1n+1时刻出现状态xn+1x_{n+1}xn+1​的概率仅依赖于系统在n时刻出现状态xnx_nxn​的概率,则随机变量序列X1,X2,X3...,Xn,Xn+1X_1,X_2,X_3...,X_n,X_{n+1}X1​,X2​,X3​...,Xn​,Xn+1​称为马尔可夫链。
转移概率
在马尔可夫链中,从一个状态到另一个状态的转移是随机的,但输出符合却是确定的。令
(式13)pij=P(Xn+1=j∣Xn=i)p_{ij} = P(X_{n+1} = j|X_n = i) \tag{式13}pij​=P(Xn+1​=j∣Xn​=i)(式13)
表示在n时刻状态iii转移到n+1n+1n+1时刻状态j的转移概率。既然pijp_{ij}pij​为条件概率,所有的转移概率必须满足两个条件:
(式14)pij≥0,对于所有的i,jp_{ij} \geq 0, 对于所有的i,j \tag{式14}pij​≥0,对于所有的i,j(式14)
(式15)∑jpij=1,对于所有的i\sum_j p_{ij } = 1,对于所有的i \tag{式15}j∑​pij​=1,对于所有的i(式15)
将假定转移是固定的,不随时间改变,即式13所有时间n成立,在这种情况下,马尔可夫链称为关于时间是齐次的。
若系统具有有限数目的可能状态,例如K个状态,则转移概率构成一个KXKK X KKXK的矩阵
(式16)P=∣p11p12...p1kp21p22...p2k....pk1pk2...pkk∣P = \begin{vmatrix} p_{11} &amp;p_{12} &amp; ... &amp;&amp;p_{1k} \\p_{21} &amp;p_{22} &amp; ... &amp;&amp;p_{2k} \\ &amp;....\\\\ p_{k1} &amp;p_{k2} &amp; ... &amp;&amp;p_{kk} \\ \end{vmatrix} \tag{式16}P=∣∣∣∣∣∣∣∣∣∣​p11​p21​pk1​​p12​p22​....pk2​​.........​​p1k​p2k​pkk​​∣∣∣∣∣∣∣∣∣∣​(式16)
它的元素满足式14和式15所述的条件。而后一条件就是P的每行的和为1.这种类型的矩阵称为随机矩阵。任何随机矩阵可以作为转移概率矩阵。
令pij(m)p_{ij}^{(m)}pij(m)​表示从状态iii到状态jjj的m步转移概率:
(式17)pij(m)=P(Xn+m=xj∣Xn=xi),m=1,2,...p_{ij}^{(m)} = P(X_{n+m} = x_j|X_n = x_i),m=1,2,... \tag{式17} pij(m)​=P(Xn+m​=xj​∣Xn​=xi​),m=1,2,...(式17)
(式18)pij(m+1)=∑kpik(m)pkj,m=1,2,...p_{ij}^{(m+1)} = \sum_k p_{ik}^{(m)}p_{kj},m =1,2,... \tag{式18}pij(m+1)​=k∑​pik(m)​pkj​,m=1,2,...(式18)
(式19)pij(m+m)=∑kpik(m)pkj(n),m=1,2,...p_{ij}^{(m+m)} = \sum_k p_{ik}^{(m)}p_{kj}^{(n)},m =1,2,... \tag{式19}pij(m+m)​=k∑​pik(m)​pkj(n)​,m=1,2,...(式19)

马尔可夫链的详细说明

(1) 一个由如下项目定义的随机模型:
有限K可能状态,表示为S={1,2,…K}。
一些列相应的概率{pijp_{ij}pij​},其中pijp_{ij}pij​为从状态iii到jjj的状态转移概率,并且满足
pij≥0p_{ij} \geq 0pij​≥0
∑jpij=1,对于所有的i\sum_j p_{ij } = 1,对于所有的i j∑​pij​=1,对于所有的i
(2) 给定已描述的随机模型,马尔可夫链是由下列一系列的随机变量X0,X1,X2,....X_0,X_1,X_2,....X0​,X1​,X2​,....所给定,其中他们的值根据相应的马尔可夫特征取值于状态S:
P(Xn+1=j∣Xn=i,Xn−1,....,X0=i0)=P(Xn+1=j∣Xn=i)P(X_{n+1} = j|X_n=i,X_{n-1},....,X_0=i_0) =P(X_{n+1} = j|X_n = i)P(Xn+1​=j∣Xn​=i,Xn−1​,....,X0​=i0​)=P(Xn+1​=j∣Xn​=i)

常返性

假设一个马尔可夫链从状态iii开始,它以概率1返回状态i,则称状态i为常返的,也就是说
pi=P(状态i的每一个返回)=1p_i = P(状态i的每一个返回)=1pi​=P(状态i的每一个返回)=1
若状态pi&lt;1p_i&lt;1pi​<1,则称状态iii为瞬态。
如果马尔可夫链从一常态开始,则该状态在时间上将无穷次重现,如果从一瞬态开始,它将只能有限次重现

周期性


上图显示一个具有常返态的马尔可夫链,此链经过一系列子态,经过三倍次移动后以相同子态结束。图示说明这个常返的马尔可夫链具有周期性。

不可约马尔可夫链

遍历马尔可夫链

4 Metroplis算法

5 模拟退火

6 Gibbs抽样

7 Boltzmann机

根植于统计力学的随机方法相关推荐

  1. 经典故障:四个雷,3*2*2*3种随机方法的特殊恢复案例

    墨墨导读:恢复专家前辈给我们精心准备了个故障,埋了四个雷,整个恢复过程感觉像是过山车,整理分享至此,希望对大家有帮助. 恢复文件 就给一个压缩的system,起库. 恢复过程 首先,获取system文 ...

  2. 小分子构象搜索:随机方法和系统方法

    随机方法和系统方法,还有关注一下 Comformator 微信公众号文章: 小分子构象搜索 Conformator使用-小分子构象生成工具 RDKit分子构象搜索工具使用方法

  3. 实战: 对GBDT(lightGBM)分类任务进行贝叶斯优化, 并与随机方法对比

    目录: 一. 数据预处理 1.1 读取&清理&切割数据 1.2 标签的分布 二. 基础模型建立 2.1 LightGBM建模 2.2 默认参数的效果 三. 设置参数空间 3.* 参数空 ...

  4. 利用随机方法得到一个随机验证码 #java

    随机验证码的核心实现逻辑是如何进行的? ①5定义一个String类型的变量存储验证码字符. ②定义一个for循环,循环5次. 随机生成0|1|2的数据, ③依次代表当前位置要生成数字|大写字母|小写字 ...

  5. 基于随机方法的新型肺炎病毒传播模型

    原来这篇文章我写在知乎上,但不知为什么,在搜索引擎上搜索不到,再搬回来. https://zhuanlan.zhihu.com/p/104332809 以前并没有接触过传染病模型,所以根据自己的理解, ...

  6. js 排序,push,pop,shit,unshit(),splice(),随机打乱数组,随机方法总结

    前言 sort(a,b)对象用法 , 1.从数组中取出两个值 2.进行运算 3.>=0位置不变 <0交换位置 1.输出数组从大到小输出/2.从小到大同理,return b-a; var a ...

  7. 大话深度信念网络(DBN)

    -- 原文发布于本人的微信公众号"大数据与人工智能Lab"(BigdataAILab),欢迎关注. 让我们把时间拨回到2006年以前,神经网络自20世纪50年代发展起来后,因其良好 ...

  8. 深度学习 --- 受限玻尔兹曼机详解(RBM)

    本节终于来到了重头戏受限玻尔兹曼机,为了能深入理解本节,我们深入讲了很多基础知识,这些基础知识很重要,是理解本节的基础,同时也是你学习其他算法的基础如强化学习.自然语言处理等.本节的安排是先对比一下受 ...

  9. 深度学习 --- 受限玻尔兹曼机RBM(MCMC接受率详解)

    上节我们提到了,MCMC的接受率问题,在<LDA数学八卦>中作者直接给出了接受率的问题,没讲明原因,感觉很突兀,我彻底搞明白了,只是这个体系比较庞大,说来话长,需要和前面讲过的内容串在一起 ...

最新文章

  1. ASP.NET BookMark
  2. iPhone 6c配置和5s相近 4寸屏基本确定
  3. Oracle执行SQL语句的过程
  4. c#知识点——数据库
  5. C# 委托(Delegate) 事件(Event)应用详解
  6. Linux下的进程相关编程
  7. 《网易编程题》分苹果
  8. Flowable 数据库表结构 ACT_HI_PROCINST
  9. 第三部分 Calendar函数接口
  10. bzoj2503poj3387[NEERC2006]IdealFrame
  11. 盘点2019年5G:商用大戏开唱 三大问题亟待解决
  12. java编程实现食堂饭卡刷卡_食堂饭卡管理系统设计方案报告.docx
  13. 数字人民币APP(试点版)上线引关注 | 产业区块链发展周报
  14. 递归解决字符串逆序输出
  15. 计算机公式与函数有何区别,Excel中公式和函数的区别/excle中的函数公式
  16. 【操作系统】系统中断技术
  17. SQL Server上月同期 日期的计算
  18. 深度学习--Inception-ResNet-v1网络结构
  19. win7 开机加速系列-下篇
  20. Apriori(关联分析算法)

热门文章

  1. python金融数据分析单元测试答案_智慧树知到Python金融数据分析答案_完整章节答案...
  2. 操作系统(一)储存系统——基本概念和硬盘
  3. spring.factories的理解
  4. android仿华为的闹钟,仿华为太空人表盘闹钟
  5. 第十四届光学与光电子国际学术会议(SOPO 2022)
  6. 生物力学仿真软件Anybody
  7. Matlab实现神经网络算法
  8. mysql++裸盘_记一次裸迁 MySQL 经历
  9. 巨头新贵为何都爱「低代码」?一头数字化现金牛!
  10. 浪潮至强D服务器解析:实现更精细的数据分级存储