0 动态博弈

动态博弈:行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择。例如下棋、消费者和商家讨价还价、谈婚论嫁、企业之间的价格战等等。

因此,为了做出最优的行动选择,每个参与人都应该思考:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?

动态博弈中的战略:在博弈开始之前就规定出每一个决策点熵的选择,即使这个决策点实际上不会出现。

考虑老师与学生之间考试之后的一个博弈:老师先行动(判分),学生后行动(在不同分数下如何应对)。假定学生的实际成绩是不及格。

这个博弈共有三个纳什均衡:(及格;A,F),(不及格;F,A),(不及格;A,A),学生“报复(F)”的威胁是不可信的:无论老师判“及格”还是“不及格”,“报复”不是学生的最优选择;

事前和事后:一种战略所规定的行动在事前看来是最优的,但事后看并不是当事人的最优选择,这种行动就不可置信,该战略就不是一个合理的战略。

1 序贯理性

序贯理性:在一个动态博弈中,参与人如果是理性的,他应该往前看,即不管事前制定的计划如何,他在新的时点上做决策都应该根据当前的情形选择最优行动。

序贯理性要求参与人在一个接一个的决策点上都要选择最优行动。这和静态博弈中仅要求参与人在事前一次性选择最优行动相比,要求就更高了。如果一个参与人总是序贯理性的,那么他所使用的战略将是由他在每一个时点上的最优行动组成的。换句话说,该战略将不仅是事前最优的,也会是事后最优的,将满足动态一致性的要求,从而不会包含不可置信的威胁。

精炼纳什均衡(也被称为序贯均衡):我们把所有不包含不可置信的行动的战略组成的纳什均衡称为精炼纳什均衡。精炼纳什均衡要求博弈的参与人必须是序贯理性的;在原博弈是一个纳什均衡;在每一个子博弈上都是纳什均衡。

那么怎样求解精炼纳什均衡呢?

逆向归纳法:从最后一个决策点开始找出该子博弈的纳什均衡;然后再倒回到倒数第二个决策点,找出决策者的最优决策;如此一直到初始决策点所有子博弈上的最优选择就是精炼纳什均衡。

逆向归纳的合理性在于我们假定参与人满足博弈论入门笔记二讲的理性共识的要求,即每个人都是理性的,而且每个人都知道其他人是理性的。

均衡路径:精炼纳什均衡在博弈树上所经过的决策点和最优选择构成一个路径,称为均衡路径。均衡路径的构成依赖于参与人在非均衡路径上的选择。

精炼纳什均衡战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优的。也就是说,参与人在不可能事件发生时,也应该按照理性的原则选择最优行动。这就出现了一个悖论:

反事实悖论:最优战略是基于理性假设做出的,但满足理性假设意味着不可能事件不会发生,如果不可能事件发生了,说明理性假设不成立,在采取下一步的行动时为什么还要假定对方是理性的呢?

反事实悖论是博弈论至今没有解决的难题。泽尔腾的“颤抖手均衡”理论将不可能事件的出现解释为理性的参与人不经意间犯的一个错误(Selten,1975),试图解决这一难题,但并不能完全让人信服。

3 承诺

承诺:在博弈论中,如果某个参与人采取某种行动,使得一个原来事后不可置信的威胁变成一个事后可以置信的威胁,事前最优和事后最优相一致,则这种行动被称为承诺

“许诺”和“威胁”都可以看成一种言辞上的表示;而“承诺”指的是一种行动,言而有信。这表明承诺比许诺重要,只有通过承诺,才能使得原本不能实现的帕累托最优成为均衡结果。

让承诺能够发挥作用的关键是承诺需要花费成本。承诺行动的实质是限制自己的选择范围,即放弃某些选择,或使得如果不选择许诺行为而是选择其他行为的话,就要付出更高的代价。比如“信用保证金”,“置之死地而后生”,“破釜沉舟”等等。

“反承诺”策略:通过限制己方的选择可以让己方的许诺或威胁变得可信。同样,增加对方的选择也可以让对方的许诺和威胁变得不可信。这就是“反承诺”策略。

比如《孙子兵法》第七篇“军争篇”中提到“围师必阙,穷寇勿迫”的说法,前者说的是包围敌军时,并不是要四面围住,而是围三面放一面,这样敌军就会从未包围的城门逃跑,己方可以轻松占领城池。后者是说,对于没有战斗能力、限于绝境的敌人不要过于逼迫他,否则有可能让其“狗急跳墙”、“鱼死网破”。这两句话的共同含义都是通过给敌人提供更多的选择而消磨对方的抵抗意志,让对方无法进行血战到底的承诺。

现代战争中“缴枪不杀”、“优待俘虏”的政策也是起到相似的作用。生活中,“得饶人处且饶人”也是这一“反承诺”策略的体现。

最惠条款:生产耐用品的企业经常被“降价预期”所困扰:如果消费者预期企业将降价,他们将会等待,结果,企业只能降价。如汽车行业面临的问题。最惠条款可以起到承诺的作用:企业不会降价了。

大学改革博弈:“不升即走”是学校的一个承诺:不会亏待优秀人才。在“不升即走”制度下,如果学校对教员不公正,优秀教员也有更高的市场价码,优秀人才流失以后,真正损失的是学校,学校就不敢对教员不公正,也就是说,正因为“不升即走”,学校就必须公正。

画家和政府的苦恼

名画的价值取决于数量,画家常常为无法承诺而苦恼:谁相信他不会再画呢?这可能是为什么画家死了之后他的画变值钱。

政府也有类似的问题。政府经常缺乏承诺:给定投资者进入的情况下,多征税是最优的;但投资者预期到这一点,将不愿意进入。

作为承诺的法律

法律改变事后的选择空间或选择成本,所以可以起到承诺的作用;

合同的承诺作用(违约的成本增加,使得遵守合同更可能是事后最优的选择);

“法治”是政府的承诺。

4 宪政与民主

有限政府:老百姓与政府之间的博弈

市场要求有限政府:政府不仅要保护个人的基本权利不受其他人的侵犯,而且要把尊重这些权利作为对政府行为的限制。如果政府的自由裁量权过大,政府官员为所欲为,政府本身会收到损害。

主权债务博弈:政府首先决定是否发行公债以及发行多少,老百姓决定是否购买;债务到期时,政府决定赖账还是偿还;如果政府赖账,老百姓决定如何惩罚政府。一般来说,政府只有在预期赖账后受到的惩罚不小于偿还的情况下,才愿意购买公债。

宪政和法治可以理解为政府对老百姓做出的承诺:政府依法行事,接受老百姓的监督;政府要保护个人的基本权利不受其他人的侵犯,而且要把尊重这些权利作为对政府行为的限制。在宪政体制下,政府更受到老百姓的信任,所以政府的力量反倒更强大。

法律有民法和刑法之分。刑法作为一种承诺,对潜在的犯罪行为具有更大威慑力。

如同宪政一样,民主也可以理解为一种承诺。民主制度倾向于照顾普通大众的利益,而非民主制度更倾向于维护少数特权阶层的利益。在非民主制度下,“为人民服务”是一个不可信的许诺。只有在民主制度下,“为人民服务”才可能是一个可信的承诺。

社会动乱的威胁是英国建立民主制度的主要驱动力。也正因为如此,英国的民主化是一个渐进的过程,每一次的让步只是满足当时的“威胁者”的要求——如1832年的时候,只要“买通”中产阶级就可以换得和平,所以投票权只扩大到中产阶级;待新的威胁者出现后,再做出进一步的让步,直到全面普选权的实现。

当然,并不是所有非民主社会的政府都像英国政府那样识时务并能与时俱进。有些非民主社会的政府习惯于用武力镇压的方式应对老百姓的民主化要求,或者一开始得过且过,敷衍了事,最后实在没有办法时,才开始改革(如清朝政府),但往往为时已晚,等待他们的只能是革命。

动态博弈、威胁与承诺(博弈论入门学习笔记四)相关推荐

  1. ROS中的roslaunch命令和launch文件(ROS入门学习笔记四)

    ROS中的基本对象和概念学习笔记(ROS入门学习笔记一) ROS中创建工作区和包(ROS入门学习笔记二) ROS功能包中CMakeLists.txt的说明(ROS入门学习笔记三) 1.roslaunc ...

  2. 斋藤康毅-深度学习入门 学习笔记四

    ch 神经网络的学习 损失函数 1.1 均方误差 import numpy as npdef mean_squared_error(y, t):return 0.5 * np.sum((y - t) ...

  3. 代理重加密-入门学习笔记(四)

    代理重加密(PRE)(重密码学!) 原文: https://blog.csdn.net/Black_BearB/article/details/81228030 1.基本思想-流程结算 在云计算中,云 ...

  4. RT-Thread 入门学习笔记 - 解决RT_ASSERT失效的问题

    RT-Thread 入门学习笔记 - menuconfig Kconfig的使用 RT-Thread 入门学习笔记 - 熟悉动态内存申请与释放 RT-Thread 入门学习笔记 - 查看线程栈的地址 ...

  5. MOOC-浙江大学-博弈论基础-学习笔记(一)

    MOOC-浙江大学-博弈论基础-学习笔记(一) 老师:蒋文华 知人者智,自知者明: 胜人者力,自胜者强: 小胜者术,大胜者德. 第一讲 概论 1.何为博弈? 博-博览全局, 奕-对弈棋局, 谋定而动! ...

  6. Crypto++入门学习笔记(DES、AES、RSA、SHA-256)

    Crypto++入门学习笔记(DES.AES.RSA.SHA-256) 背景(只是个人感想,技术上不对后面的内容构成知识性障碍,可以skip): 最近,基于某些原因和需要,笔者需要去了解一下Crypt ...

  7. node入门-学习笔记

    文章目录 node入门-学习笔记 node 启动node服务 重构express-run node入门-学习笔记 node 为什么后端要用node, 因为它是js js运行时环境 主要使用expres ...

  8. 【带着canvas去流浪(11)】Three.js入门学习笔记

    [摘要] three.js 入门学习笔记 示例代码托管在:http://www.github.com/dashnowords/blogs 一. 资料推荐及建议 1.官方文档 很详细,但是API部分单独 ...

  9. RT-Thread Nano入门学习笔记(2)

    RT-Thread系列 Keil模拟器 STM32F103上手指南学习笔记 RT-Thread Studio快速上手 RT-Thread Nano入门学习笔记(1) 项目实战:快速打造一个桌面mini ...

最新文章

  1. 调试JavaScript/VB Script脚本程序(IE篇)
  2. python加密执行_如何在Python中执行PGP(生成密钥,加密/解密)
  3. 分库分表的事务处理机制
  4. centos 6.5网卡dhcp不能获得网关
  5. 2016年光伏电站交易和融资的十大猜想
  6. zabbix-server无法启动
  7. python 网易_python发送网易邮件
  8. 如何设置电脑自动锁屏_MIUI第415期:新增智能显示锁屏通知、状态栏数字电量外显...
  9. JAVA_观察者模式例子
  10. 17家IT创业公司的血泪史(3)
  11. 37_Flutter之Sliver组件扩展
  12. html5 等比压缩图片,图片上传裁剪amp;等比缩放处理(html5+Canvas)
  13. 利用CSS改变图片颜色的100种方法!
  14. 误删excel表格数据都没了怎么恢复
  15. CREAL CEO:AR/VR动态变焦有哪几种解决方案?
  16. Android Instant Apps
  17. 男人最渴望拥有的十类妻子
  18. 审计需要掌握的计算机语言,审计人员应该具备的素质
  19. 四轮移动机器人(阿克曼底盘)数学建模
  20. c语言冒泡排序详解(分析每一步,附代码)

热门文章

  1. 合并多个excel表中相同sheet的数据
  2. Android之50个你不知道的使用窍门
  3. 下载工具 qBittorrent 使用
  4. Unity3D如何开发最简单的VR游戏 vrPlus(神之眼)
  5. linux命令 mv -v,linux中的mv命令
  6. Nature neuroscience:大鼠功能连接分析的共识方案
  7. 如何进入BAT等IT名企
  8. keil5 stm32f03c8t6 printf重定向到串口和TFT 1.44 LCD屏
  9. 查看oracle数据库的启动时间
  10. 富贵论坛的发展大事记