借鉴了借鉴他人博客的博客

问题:
对于随机过程{A0,A1...At}\{A_0,A_1...A_t\}{A0​,A1​...At​},有TTT为关于这个过程停止时间的随机变量,求E(T)E(T)E(T)

势函数:一个关于状态的函数ϕ(A)\phi(A)ϕ(A),其中AAA是一个状态。
对于随机过程中的任意连续两个状态At,At+1A_t,A_{t+1}At​,At+1​
如果我们让E(ϕ(At+1)−ϕ(At))=−1E(\phi(A_{t+1}) - \phi(A_t)) = -1E(ϕ(At+1​)−ϕ(At​))=−1
(注意到因为势函数和随机无关,有E(ϕ(A))=ϕ(A)E(\phi(A)) = \phi(A)E(ϕ(A))=ϕ(A),这里的形式只是为了套用停时定理,因此可以直接理解为ϕ(At+1)+1=ϕ(At)\phi(A_{t+1}) + 1 = \phi(A_t)ϕ(At+1​)+1=ϕ(At​))。
并且对于初始状态ϕ(A0)\phi(A_0)ϕ(A0​)为常数。
令Xt=At+tX_t = A_t + tXt​=At​+t,则可以得到E(Xt)=E(X0),∀t≥0E(X_t) = E(X_0) , \forall t \geq 0E(Xt​)=E(X0​),∀t≥0
可以发现TTT也是{X0,X1,X2...}\{X_0,X_1,X_2...\}{X0​,X1​,X2​...}的停时,

如果有E(XT)=E(X0)E(X_T) = E(X_0)E(XT​)=E(X0​),则可以得到E(XT)−E(X0)=E(ϕ(AT)+T)−E(ϕ(A0))E(X_T) - E(X_0) = E(\phi(A_T)+T) - E(\phi(A_0))E(XT​)−E(X0​)=E(ϕ(AT​)+T)−E(ϕ(A0​))
从而得到E(T)=ϕ(A0)−ϕ(AT)E(T) = \phi(A_0) - \phi(A_T)E(T)=ϕ(A0​)−ϕ(AT​),也就是我们只需要初始状态和结束状态的停时即可得到停时的期望。

但是E(XT)E(X_T)E(XT​)不一定=E(X0)=E(X_0)=E(X0​),实际上E(XT)=E(X0)E(X_T) = E(X_0)E(XT​)=E(X0​)需要满足三个条件之一,这也就是停时定理的内容

从OIOIOI做题的角度来看题目是可解的所以一定有E(XT)=E(X0)E(X_T) = E(X_0)E(XT​)=E(X0​)。
当然知道一下证明也可以防止自己出题出锅被大佬喷。

停时定理是对于鞅成立的。
鞅:
随机过程{X0,X1...}\{X_0,X_1...\}{X0​,X1​...}
满足E[Xt+1−Xt∣Xt,Xt−1...X0]=0E[X_{t+1} - X_t|X_t,X_{t-1}...X_0]=0E[Xt+1​−Xt​∣Xt​,Xt−1​...X0​]=0
(这句话的意思是在经历了X0,X1...XtX_0,X_1...X_tX0​,X1​...Xt​的随机过程后,下一步的Xt+1−XtX_{t+1} - X_tXt+1​−Xt​的期望值为000)
可以根据这句话推出E(Xt)=E(X0),∀t≥0E(X_t) = E(X_0) , \forall t \geq 0E(Xt​)=E(X0​),∀t≥0,但是不能反着推。

停时定理:
当满足下列三个条件之一时,E(XT)=E(X0)E(X_T) = E(X_0)E(XT​)=E(X0​),其中TTT是停止时间。
这三个条件按顺序是对于TTT的限制逐渐变松而对于XXX的限制逐渐变紧。

1.TTT几乎一定有界。
几乎一定的意思是概率为111,也就是说像是在[0,1][0,1][0,1]中随机取一个实数不等于xxx的概率也为111,但是你不能说取不到。

该情况的证明:(很伪)
TTT有界,则可以取t=Tt = Tt=T,使得E(XT)=E(Xt)=E(X0)E(X_T) = E(X_t) = E(X_0)E(XT​)=E(Xt​)=E(X0​)
T几乎一定有界,所以该定理几乎一定成立。
因为TTT无界的情况概率为000,所以无法对E(XT)E(X_T)E(XT​)造成贡献。

至于TTT什么时候才会不一定有界还几乎一定有界这就是我的知识盲区了。

2.E(T)E(T)E(T)有限,∣Xt+1−Xt∣|X_{t+1} - X_t|∣Xt+1​−Xt​∣一致有界或者线性增长。
有限的意思是…
算了给你们看文档 吧

3.TTT几乎一定有限,XtX_tXt​一致有界。

例题:CF 1025 G. Company Acquisitions
每个人可以有个上司,保证一个人的上司没有上司,每次随机选两个没有上司的人xxx,yyy,将xxx的上司变成yyy,并且对于以xxx为上司的人vvv,vvv将会变成没有上司的状态,求不能操作时的停时的期望。
(显然终止情况是有一个人没有上司,其他人的上司都是他。)

考虑到直接构造势函数是十分困难的,我们考虑用状态转移方程求出每个状态的势函数。
首先显然可以让终止状态的势函数=0=0=0,然后我们状压转移。
。。。
。。。
等等,那不就是在状压DP吗?
是的,在大多数情况下我们的势函数完全可以看做我们的dpdpdp状态。。。(期望dpdpdp)
但是函数毕竟是函数,我们可以利用函数的性质进行一些变形。
比如说如果我们把每个没有上司的人和他的下属看做一个块,有mmm个块,大小分别为a1,a2...ama_1,a_2...a_ma1​,a2​...am​
那么我们可以构造势函数为ϕ(a)=∑i=1mf(ai)\phi(a) = \sum_{i=1}^m f(a_i)ϕ(a)=∑i=1m​f(ai​),因为aia_iai​之间的顺序不重要,那么我们这下就能够减少一些不必要的信息。
之后的推式子就看这篇博客的第三个例题把

感觉你让我构造,那这方法还是没有啥优越感啊

势函数和鞅的停时定理相关推荐

  1. 1.1 鞅、停时和域流-随机过程的可测性(布朗运动与随机计算【习题解答】)

    1.1 鞅.停时和域流-随机过程的可测性(布朗运动与随机计算[习题解答]) 1.5 Problem. Let Y be a modification of X, and suppose that bo ...

  2. 4.8 鞅-最优停时定理(Durrett)答案

    4.8 Optional Stopping Theorems Exercise 4.8.1-The generalization of Theorem 4.8.2 ( X N , F n X_N,\m ...

  3. 1.2 鞅、停时和域流-停时(布朗运动与随机计算【习题解答】)

    Proposition 11 If E \mathcal{E} E is a non-empty class of sets containing ∅ \varnothing ∅, write E

  4. 4. 连续时间鞅(REN)

    4. 连续时间鞅(REN) 前情提要 闭区间上的鞅(终端值必然存在) 鞅的定义 鞅与停时(Doob停止定理) 下鞅极值的终值控制不等式(Doob极大值不等式) 左闭右开区间的鞅(终端值未必存在) 鞅的 ...

  5. 3. 离散时间鞅(REN)

    3. 离散时间鞅(REN) 前情提要 鞅的定义及例子 Doob下鞅分解:下鞅=鞅+可料增过程 鞅与停时(Doob停止定理,鞅的离散停时序列是鞅→\rightarrow→鞅有关停时的等价命题) 鞅的矩估 ...

  6. 随机微分方程学习笔记02 Doob鞅不等式

    文章目录 条件期望下的Jensen不等式(一维) 选择停时定理(optional stopping theorem) Doob鞅不等式(Doob's martingale inequality) 条件 ...

  7. 【课程整理】随机系统期末整理

    文章目录 1 概率论部分 (1-4) 概率空间 随机变量 概率分布 随机变量的函数仍然是随机变量 条件期望 2 随机过程 (5-7) 随机过程 Martingale 停时 马尔科夫链 3 参数估计 ( ...

  8. 马尔可夫过程2 | 状态空间

    文章目录 6.4 状态空间的分解 6.5 极限特性与平稳分布 6.5.1 极限特性 6.5.2 平稳分布 6.6 转移矩阵的平均极限 6.4 状态空间的分解 定义:设 A⊂SA\subset SA⊂S ...

  9. 随机过程2 平稳过程与二阶矩

    文章目录 1. 相关函数 2. 功率谱 2.1 定义 2.2 功率谱与时域平均 3. 线性系统 4. 随机连续性与随机微积分 4.1 随机连续性 4.2 随机微分(均方意义) 4.3 Taylor 级 ...

最新文章

  1. HDU4920 Matrix multiplication 矩阵
  2. MS UC 2013-0-虚拟机-标准化-部署-2-模板机-制作-2-设置-虚拟机
  3. bind函数作用、应用场景以及模拟实现
  4. POJ 327820493083
  5. 关于mobiscroll插件的使用
  6. 用MXNet实现mnist的生成对抗网络(GAN)
  7. linux安装python3.7的步骤_Linux 安装python3.7.3
  8. 演示和解析Flex布局中的各种属性
  9. 提交代码到远程GIT仓库,代码自动同步到远程服务器上。
  10. Java 的强引用、弱引用、软引用、虚引用
  11. ps人像精修照片步骤_PS人像精修
  12. (转)UIWebView的基本用法,适合新手
  13. ai带来的革命_Covid-19将加速AI医疗保健革命
  14. VSCode配置java代码运行环境
  15. java数组三种排序方式
  16. SQL 基础教程:SQL 通配符
  17. NOBOOK物理化学生物实验虚拟平台
  18. Google AdSense注册流程
  19. 沈阳农业大学计算机专业排名,2019沈阳农业大学专业排名
  20. 【Android Studio】在Mac中更换JDK Location

热门文章

  1. 【BZOJ 4070】 [Apio2015]雅加达的摩天楼
  2. 大数据知识面试题-通用(2022版)
  3. 封装uniapp-uni-table组件,获取点击行事件,可传入自定义表头,传入后端数据,获取多选数据(其中行点击事件只有H5端可以用)附有完整代码
  4. 面试宝典带你走向人生巅峰
  5. 探讨GB51309-2018实施后对消防应急照明和疏散指示系统在城市隧道应用中的影响-安科瑞 蒋静
  6. 【python 类和对象实例】
  7. python实例:模拟超市收银抹零行为
  8. Ubuntu16.04LST 校园网不能正常使用ipv6上网
  9. 下载好的vue项目如何在自己电脑环境上运行,步骤!!
  10. 明宇商旅两家酒店落地乌兹别克斯坦,将于2022年年初开业迎客