Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。

文章梗概

马尔科夫是何人?

马尔科夫性质是什么?

马尔科夫模型是什么?

是什么让马尔科夫模型成为隐性的?

一种能够用于条件检测的马尔科夫模型

结论

参考文献

马尔科夫是何人?

马尔科夫是一位俄国的数学家,他最为人所知的是他在随机过程方面的研究。他早期研究的重点是数论而在1900年之后他所研究的重点转向了概率论。他研究的成果颇丰以至于在他1905年正式退休之后他仍然在教授课程直至去世。在他的研究中,马尔科夫成功地拓展了大数定理以及中心极限定理,并将其应用于由独立随机变量组成的特定序列中,如今这也被称为马尔可夫链。马尔可夫链被广泛的运用于物理学,经济学,统计学,生物学等方面。两个最著名的应用是布朗运动以及随机漫步。

什么是马尔科夫性质?

一类随机过程:在给定当前状态的条件下,将来的状态独立于过去的状态。

假定我们用一枚正反面概率一样的硬币玩一个简单的抛硬币的游戏。抛去质疑,假设马尔科夫性质不是已知的,并且我们希望去预测在十次抛掷以后,第11次正面朝上的概率。在条件依赖的假设之下(硬币对于过去的状态有记忆特性并且未来的状态也依赖于过去状态的序列),我们必须记录导致第11次结果的前十次结果的特定序列,并计算它们的联合概率。这个序列的联合概率就是0.5^10 = 0.0009765625。在条件依赖下,第十一次抛掷正面朝上的概率就是0.0009765625 * 0.5 = 0.00048828125。

这真的是第十一次抛掷正面朝上的概率吗?当然不是!

我们知道硬币抛掷这一事件并不依赖于先前抛掷的结果。这枚硬币并没有记忆特性。这个连续抛掷的过程并没有编码先前的结果。每个抛掷都是独立事件并且是正反面概率一致的,又叫做与过去状态的条件独立。这就是马尔科夫性质。

什么是马尔科夫模型?

马尔科夫链(模型)描述了一类随机过程,假定未来状态的概率仅仅依赖于当前状态,不依赖于先前的状态。

让我们以一个简单的例子开始。假设你的小狗处于三类状态之一,在给定当前状态的条件下,你想要模拟出未来状态的可能性。为此我们需要去指定状态空间,初始概率和转移概率。

想象一下你有一只非常懒的胖狗,所以我们定义了状态空间为:睡觉,吃饭,赖皮。我们设置对应的初始概率为 35%, 35%,和 30% 。

下一步就是定义转移概率。在给定当前状态的条件下,他们就是保持相同状态的概率或者转移到不同状态的概率。

既然我们有了初始概率和转移概率,我们就能用Networkx包来创建马尔科夫图表了。

要做到这一点需要一点点灵活思考。Networkx创造了包含很多节点和边的图形。

在我们这个小例子中,小狗可能的状态是这些节点,而边则是连接各个节点的连线。而转移概率则是权重。它们代表了在当前状态已知的情况下转移至下一状态的概率。

有一点需要指出的是networkx主要是用来处理字典对象的。也就是说,我们需要去创建一个包含边以及对应权重的字典对象。

现在我们能够创建这个图表。为了能够使得马尔科夫模型可视化需要使用nx.MultiDiGraph()。一个多有向图简单来说就是有方向的图表,能够拥有多条弧,同时单个节点既可以是起始点也可以是终点。

在接下来的代码中,我们将创建图标对象,添加我们的节点,边和标签,接着画一个大致的netwokx图线,并且将其输出为dot文件。

现在让我们看看这个dot文件。

还可以吧。如果你想从任意节点开始沿着某一条边,他会告诉你这条小狗从一个状态转化为另一个状态的概率。举个例子来说吧,如果这条狗正在睡觉,我们能够发现有40%几率这条狗会继续睡觉,40%的几率狗会醒来并且耍赖皮,还有20%的概率狗会醒过来吃饭。

什么使得马尔科夫模型成为隐性的?

假设这样一种情况:你的狗突然举止怪异,你想要去模拟出狗是由于生病而有怪异行为的概率或者是在健康状态下纯粹地搞怪的概率。

在这一情形下,狗的真正状态是未知的,并且你也是不知晓的。一条可行的方法就是假设狗有一些可被观察的行为,这些行为能够代表正确而隐性的状态。让我们通过一个例子来了解。

首先我们创建状态空间,健康或生病。我们假设它们是等概的。

现在我们为隐藏状态创建转移矩阵。

这就让它变得更有趣一点了。现在我们创建发射或者观察概率矩阵。这个矩阵的大小是M x O 的,并且M是隐藏状态的个数,而O则是可能观察到的状态的个数。

这个发射矩阵告诉我们,在可能当前以及可观察的状态条件下,狗处于其中一个隐藏状态的概率。

让我们保留前一个例子中的可观察状态。这条狗能够睡觉,吃饭或者耍赖皮。这样我们就能根据这些概率做出最准确的猜测。

现在我们创建图表的边和图表对象。

这个隐性的马尔科夫的图表有一些复杂但其原理是一样。举个例子来说,你能够预测到,如果你的小狗在吃饭,那它有极高的可能是健康的(60%),而有非常低的可能是生病的(10%)。

现在,给定一组你的小狗的行为序列,如果你需要识别出小狗随着时间变化的健康状态又该怎么办呢?

使用维特比算法我们可以在给定行为序列的条件下,求出其最可能的对应的隐藏状态的序列。

高水平下,这个维特比算法增量随着每个时间的步进,找到所有路径中能够以最大可能性到达时间t下的状态i的路径,这条路径也是到达时间t的正确观察行为序列。

这个算法也能够保存在每一个阶段下有最高概率的状态的踪迹。在序列的结尾,这一算法将会向后迭代计算出在每一个时间步长中“胜利”的状态,并建立最有可能的路径,或者最有可能的隐藏状态的序列,这些都与已知的行为序列相对应。

让我们看一下结果吧。

一种可用于条件检测的隐性马尔科夫模型

到现在,你可能想知道我们怎么样去将我们所学的马尔科夫模型应用在定量金融中。

但考虑到当我们想要尝试在资产收益率中应用预测技术时,所面临最大的困难就是资产收益率是非平稳时间序列。简单来说,这就是意味着资产收益率的预期均值以及波动性都会随着时间而变化。

大多数时间序列的模型都是假设数据是平稳的。这就是这些模型主要的缺陷。

但是,让我们从问题的另外一面思考。我们知道这个时间序列其实表明了当前的时间点下预期均值以及波动性是固定不变的。而这些时间点或者说是条件就可以比喻为隐性状态。

如果是这样的话,我们就只需要得到这些拥有与隐性状态对应特征的观察变量就可以了。如果我们能够更好地预估出资产所处在的最可能的环境,包括它的联合均值和方差,那么我们的预测模型就能变得更加灵活,并且能够提高准确度。当然如果给定的这些条件预估参数能够组成更有利于情景分析的框架,我们也能够成为更优秀的风险管理人员。

在这个例子中,我使用的观测变量有:潜在的资产回报,泰德价差,10年- 2年连续成熟的范围,和10年-3个月的连续成熟的范围。

我们能从雅虎财经上采集这些数据。

下面我们将会用到sklearn的高斯混合模型来组成一个能够预测这些条件的模型。我们将会在这个系列的第二部分深度探讨混合模型这个版块。而最重要的特点是,混合模型应用一种密度估算中无人监测的形式来进行实现。他利用最大化均值算法来估算隐性状态的的均值和协方差。现在,就可以按下这个按钮,来猜猜转移和发射概率以及最可能的路径。

我们必须选定混合模型中组件的数量来和时间序列相拟合。在这个例子中这些组件就被当作隐性状态。我们将这些状态任意划分为高,中和低波动性并且将组件部分设置为3。

在上面的图片中,我圈出了每个条件下所对应的每日收入的预期均值和方差。我们的低波动性环境就是我们序号为1的隐性状态。我们也能发现序号为1的隐性状态下有最高额的收入均值和最小的方差。而序号为0的隐性状态即为中性的波动性环境,对应的是第二高的回报和方差。最后的序号为2的隐性状态即为高的波动性环境,对应的是负的回报以及最大的方差。

下面的图是用颜色代表各个隐性状态的美容价格走势。

总结:

这篇文章中我们讨论了马尔科夫性质的概念,马尔可夫模型和隐性的马尔可夫模型。我们使用NetworkX包创建马尔科夫链图,并用sklearn的高斯混合模型预测以往各个节点的状态。在第2部分,我们将深入讨论混合模型。为了了解更详细的信息,我建议你多看看参考文献中的内容。特别是Setosa.io这个网站由于其有极好的交互式的视觉体验,有助于你更好地理解这篇文章。

英文原文:http://www.blackarbs.com/blog/introduction-hidden-markov-models-python-networkx-sklearn/2/9/2017

译者:铁柱哥爱33

Python隐形马尔科夫实战_通过Python的Networkx和Sklearn来介绍隐性马尔科夫模型相关推荐

  1. python做马尔科夫模型预测法_通过Python的Networkx和Sklearn来介绍隐性马尔科夫模型...

    Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发. 文章梗概 马尔科夫是何人? 马尔科夫性质是什么? 马尔科夫模型是什么? 是什么让马尔科夫模型成为隐性的? ...

  2. python数据可视化从入门到实战_《Python编程从入门到实践》json数据可视化练习详解...

    <Python编程从入门到实践>16.2中,计算收盘价均值的程序有些不易看懂,结合我自己的理解进行一些说明. 使用的数据集:join格式的数据, 数据集是由多个字典为元素组成的列表.每个字 ...

  3. 亚马逊 aws 指南 实战_减少您的AWS成本完整指南

    亚马逊 aws 指南 实战 Do you think your cloud costs are too high? I think most businesses can find savings i ...

  4. python二手交易平台代码_PYTHON爬虫实战_垃圾佬闲鱼爬虫转转爬虫数据整合自用二手急速响应捡垃圾平台_3(附源码持续更新)...

    说明 文章首发于HURUWO的博客小站,本平台做同步备份发布. 如有浏览或访问异常图片加载失败或者相关疑问可前往原博客下评论浏览. 原文链接 PYTHON爬虫实战_垃圾佬闲鱼爬虫转转爬虫数据整合自用二 ...

  5. Python和Java结合的项目实战_[项目实战] Python高级教程项目实战篇 Python和Java结合的项目实战 视频教程 [...

    资源介绍 课程简介:xa0xa0 Python高级教程项目实战篇 Python和Java结合的项目实战 视频教程 教学视频 ----------------------课程目录 Python项目实战篇 ...

  6. python django web典型模块开发实战_带你读《Python Django Web典型模块 开发实战》之一:从新浪微博聊起多端应用-阿里云开发者社区...

    Python Django Web典型模块 开发实战 点击查看第二章 点击查看第三章 寇雪松 编著 第1章 从新浪微博聊起多端应用 当人们听到"新浪",脑海里第一个浮现的关联词是& ...

  7. python信息管理系统实战_最新python入门+进阶+实战课堂教学管理系统开发全套完整版...

    Python+pillow图像编程1:pillow扩展库安装与基础用法.avi Python+pillow图像编程2:Image子模块用法1.avi Python+pillow图像编程3:Image子 ...

  8. python linux系统管理与自动化运维_《Python Linux系统管理与自动化运维》赖明星著【摘要 书评 在线阅读】-苏宁易购图书...

    商品参数 作者: 赖明星著 出版社:机械工业出版社 出版时间:2017-09-01 版次:1 开本:16开 装帧:平装 ISBN:9787111578659 版权提供:机械工业出版社 基本信息 商品名 ...

  9. python程序设计课后答案第三单元_最新Python程序设计课后习题答案-第一单元

    精品文档 精品文档习题1 一.选择题 1.Python语言属于().C A.机器语言 B.汇编语言 C.高级语言 D.科学计算语言2.下列选项中,不属于Python特点的是().B A.面向对象 B. ...

  10. python中format函数用法简书_从Python安装到语法基础,这才是初学者都能懂的爬虫教程...

    Python和PyCharm的安装:学会Python和PyCharm的安装方法 变量和字符串:学会使用变量和字符串的基本用法 函数与控制语句:学会Python循环.判断语句.循环语句和函数的使用 Py ...

最新文章

  1. 解决SecureCRT中文显示乱码
  2. 系统访问慢的几个原因
  3. SQL注入攻击实现原理与攻击过程详解
  4. 如何在SAP里创建configurable material物料主数据
  5. 比尔盖茨 27 年婚姻破裂,8000 亿财产咋分配?
  6. iOS及Android 启动页面(即欢迎页面),引导页面,及广告页面的加载
  7. v$session,v$session_wait,v$session_wait_history,v$active_session_history
  8. windows10程序员计算机,Win10计算器程序员模式如何移位?
  9. AWD简单介绍和搭建AWD平台
  10. 如何在html中加入背景,html中如何加入背景图片
  11. Scheme语言入门
  12. 【数据结构基础_有[*pHead]和[*pEnd]的单向链表_(C++实现)】
  13. ubuntu 改屏幕分辨率命令_ubuntu下修改分辨率
  14. 华文行楷字帖欣赏_任政书法:行楷字帖《二十四孝组诗》集字版,美不胜收!...
  15. 上板子在线抓波发现app_rdy一直为低
  16. 人狗鸡米安全过河matlab程序,人狗鸡米过河
  17. Prolog不是hentai
  18. Poc/Exp漏洞验证利用脚本编写
  19. .NET Core----Docker The type initializer for 'Gdip' threw an exception异常
  20. VideoCapture通用属性标识符

热门文章

  1. vue element web 表单设计工具
  2. java jpg转png 模糊_Java JPG转换为Png
  3. 微信小程序 input输入事件
  4. 2013年04月12日 JavaEE+物联云计算就业班-上海
  5. Renascence架构简介
  6. xp系统进不去2008服务器共享,xp系统设置访问Server 2008R2的共享不输入密码的方法...
  7. uniapp微信授权登录
  8. 电脑删除的文件如何找回?找回删除的文件有3个方法…
  9. 兴业银行研发中心笔试题_2019兴业银行笔试真题汇编(一)_考生回忆版
  10. 积分商城使用教程之优惠券