博弈论与共享经济——囚徒困境与配对理论分析

1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Flbert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:

若对方沉默、我背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低。这就是“困境”所在。例子有效地证明了:非零和博弈中,帕累托最优和纳什均衡是互相冲突的。

在博弈论中,是不存在边际的,即可选择的点是不连续的,不可导。我们来构建函数,使博弈论的函数可导。假设甲合作的可能性为x,认罪的可能性为1-x,其中0≤x≤1;设乙合作的可能性为y,认罪的可能性为1-y,其中0≤y≤1。假设x,y大于等于0.5时表示合作,小于0.5时表示认罪,并且二人被判刑的总年限为z。则得到如下分段函数

在MATLAB中输入如下函数,可以得到对应的囚徒困境的三维图形

[x,y]=meshgrid(0:0.1:1,0:0.1:1);

z=0.5*x.*y.*(x>=0.5&y>=0.5)+0.5*x.*y.*(x>=0.5&y>=0.5)+0*(1-x).*y.*(x<0.5&y>=0.5)+10*(1-x).*y.*(x<0.5&y>=0.5)+10*x.*(1-y).*(x>=0.5&y<0.5)+0*x.*(1-y).*(x>=0.5&y<0.5)+2*(1-x).*(1-y).*(x<0.5&y<0.5)+2*(1-x).*(1-y).*(x<0.5&y<0.5);

surf(x,y,z),shading flat,hold on

title('囚徒困境')

xlabel('x轴 囚徒甲合作')

ylabel('y轴 囚徒乙合作')

zlabel('z轴 二人总支付')

当x和y分别合作和认罪时,即当x和y分别等于1,0时,得到三维坐标系内的4个极值点(1,1,1),(1,0,10),(0,1,10)和(0,0,4)。

当x和y分别取0,1时,得到了囚徒困境的4个极值点,构建的函数符合囚徒困境。当甲、乙两人均合作(1,1)时,总的支付为最小的1。但是由于二者均处于自身利益最大化的考虑,二者均选择了认罪(0,0),二者均被判刑2年,二者并没有达到系统的最优值1年,即每人0.5年。

其中甲x对应自己的被判年数的函数为

其中乙y对应自己的被判年数的函数为

继续在MATLAB中输入如何程序,得到甲的利益函数。甲利益函数对应的4个极值分别为(1,1,0.5),(0,1,0),(1,0,10)和(1,1,2)。

[x,y]=meshgrid(0:0.1:1,0:0.1:1);

z=0.5*x.*y.*(x>=1&y>=1)+0*(1-x).*y.*(x<=0&y>=1)+10*x.*(1-y).*(x>=1&y<=0)+2*(1-x).*(1-y).*(x<=0&y<=0);

surf(x,y,z),shading flat,hold on

如果限定x和y只能等于0或1,则可以得到无边际的囚徒困境,输入如下程序得到无边际的囚徒困境图形。

[x,y]=meshgrid(0:0.1:1,0:0.1:1);

z=0.5*x.*y.*(x>=1&y>=1)+0.5*x.*y.*(x>=1&y>=1)+0*(1-x).*y.*(x<=0&y>=1)+10*(1-x).*y.*(x<=0&y>=1)+10*x.*(1-y).*(x>=1&y<=0)+0*x.*(1-y).*(x>=1&y<=0)+2*(1-x).*(1-y).*(x<=0&y<=0)+2*(1-x).*(1-y).*(x<=0&y<=0);

surf(x,y,z),shading flat,hold on

title('无边际的囚徒困境')

xlabel('x轴 囚徒甲合作')

ylabel('y轴 囚徒乙合作')

zlabel('z轴 二人总支付')

在囚徒困境中,一个人的选择不仅影响自己的利益,也会影响对方的利益,而二者处于自己利益最大化的考虑,最终的结果却不是自己的利益最大化。

在后边共享经济学中我们会介绍配对理论,此处通过配对理论来解释囚徒困境。

诺贝尔经济学奖获得者埃尔文•罗斯在《共享经济:市场设计及其应用》中写到:“配对在经济学术语中可以解释为,我们如何从生活中得到既是我们所选择的,同时也是选择我们的事物。”而博弈就是选择我们想要选择的,而不让对方选择他们想要选择的。在囚徒困境中,甲和以均有4种选择,最好的是自己选择认罪,对方选择合作,自己被判0年,对方被判10年;第2种的是自己和对方均合作,每人被判0.5年;第3种是双方都认罪,均被判2年;最差的一种是自己合作,对方认罪,自己被判10年,对方释放。

在博弈论中推理中,如果对方选择认罪时,自己选择合作会被判10年,而选择认罪会被判2年,所以在对方认罪的前提下,自己选择认罪是最好的策略。当对方选择合作时,如果自己选择合作,会被判0.5年,而选择认罪会被释放,所以在对方选择合作时,自己选择认罪是最好的策略。对方的推理相同,最后两人都选择了认罪,均被判两年。他们的选择没有达到系统的最优值,因为如果二者都选择合作,他们均被判0.5年,比2年少。

在4个配对当中,第1种配对对自己是最有利的,但是对对方是最不利的。当自己选择认罪时,给对方的选择是合作或认罪,而认罪要比合作获得的利益多。这个配对是不稳定的,因为对方会因为自己选择认罪而选择认罪,所以第1种配对达不到自己认罪,对方合作的配对组合。在第1种配对中,不仅为自己选择了最大的利益,也为对方选择了最大的损失。

在第2种配对中,甲不仅为自己选择了合适的利益,也为对方选择了合适的利益。但是这种配对也是不稳定的,对于甲来说,如果对方选择了合作,而自己认罪,自己将获得更大的利益,从而达到第1种配对的状态。但是自己获得的利益是以对方更大的损失换来的,所以总的利益会减少。自己增加的利益为少被判刑2年,而对方的损失是多被判刑8年,自己的自利使两人的配对相比之前多被判刑6年。

第3种配对中,双方都选择了认罪,任何单方面的改变,都不会使自己的境遇变得更好,是一个稳定的配对。如果一方选择合作,那么相应的给对方选择了更好的配对,对方将被释放,而自己的损失增加。在第3种配对中,单方面的改变会变为第1种或第4种配对,都是不稳定的配对。

第4种配对中,自己选择了最大的损失,对方选择了最大的利益,在理智的情况之下,只有利他的精神会导致此种配对的发生。

在囚徒困境的假设中,博弈的双方都是理性利己的,追求自身利益的最大化,而第2种配对则是二人博弈的结果。除了自利,还有两种美德影响着人类的选择。亚当•斯密在《道德情操论》中论述了三种美德,分别为审慎(利己),合宜(克己)和慈善(利他),而三种美德分别为心理的自爱,同情和理性三种机能推荐给我们。如果博弈双方存在着一方的利他美德,那么第1种或者第4种配对就会发生,利他的一方以对方利益最大化为出发点,自己选择了合作。而如果双方都是利他的话,第2种配对就会发生,均以对方利益最大化为出发点,而达到二人博弈的整体最优点。在存在利他美德的博弈中,第1种,第2种和第4种配对都是稳定的配对。如果博弈中存在克己的情感,即不伤害他人。当对方选择合作时,如果自己选择认罪,将会使对方遭受更大的损失,自己会选择合作;如果对方选择认罪,自己选择合作会使自己遭受更大的损失,所以自己也会选择认罪。如果双方都是克己的,那么第2种配对就是稳定的配对。如果一方是克己的,一方是利己的,那么第3种配对就是稳定的配对。


在一个利己的环境中,很难达到个人利益和整体的利益最大化,而在克己或利他的环境中,就可以达到整体的利益和个人的最大化。在哲学部分我们论述过亚当•斯密的哲学。他在《国富论》中论述了自利可以使自己的利益增加,进而使整体的利益增加,而在《道德情操论》论述了审慎(利己),合宜(克己)和慈善(利他)这三种美德中,推崇克己这种美德。亚当•斯密的完整论述是在遵守克己原则下的利己行为,即不伤害他人的行为,既可以达到个人利益最大化,也可以达到整体利益的最大化。

博弈论与共享经济——囚徒困境与配对…相关推荐

  1. 博弈论的经典案例:囚徒困境

    作者: 孔祥云 王玉荣   学习管理学或经济学的人一定都了解一些博弈论方面的知识.在博弈论中有一个经典案例--囚徒困境,非常耐人回味.  ----"囚徒困境"说的是 ...

  2. 博弈论笔记1:囚徒困境与纳什均衡

    1 个体最优与社会最优 1.1 社会基本问题 社会:个体之间有互动行为&相互依赖的群体 羊群效应:大家做什么,我就跟着做什么,不管对错和原因 协调问题:两人迎面走来,谁左谁右?(核心:人们如何 ...

  3. 活捉那只抢算力的谷歌员工!挤占计算资源?博弈论或可破解数据中心“囚徒困境”

    大数据文摘出品 来源:IEEE 编译:赵吉克.武帅.钱天培 把"数据中心"和"博弈游戏"两个词放在一起,你会想到什么?经济学家们研究的"囚徒困境&qu ...

  4. 活捉那只抢算力的谷歌员工!挤占计算资源?博弈论或可破解数据中心“囚徒困境”...

    大数据文摘出品 来源:IEEE 编译:赵吉克.武帅.钱天培 把"数据中心"和"博弈游戏"两个词放在一起,你会想到什么?经济学家们研究的"囚徒困境&qu ...

  5. 博弈论 纳什均衡 囚徒困境 智猪博弈

    项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1.博弈论是什么 博弈论(game t ...

  6. 【科普】博弈论之胆小鬼博弈、囚徒困境、智猪博弈与纳什均衡

    目录 一.前言 1.1 博弈论 1.2 纳什 1.3 胆小鬼博弈 1.4 囚徒困境 1.5 智猪博弈 二.纳什均衡 2.1 纳什均衡定义 2.2 悖论 结语 一.前言 在博弈论中,纳什均衡(Nash ...

  7. 博弈论-囚徒困境与重复囚徒困境的启示

    博弈论-囚徒困境与重复囚徒困境的启示 "囚徒困境" 囚徒困境(prisoner's dilemma):讨论的是两个被捕的囚徒之间的一种博弈,它阐明了为什么"在合作对双方都 ...

  8. 人质困境:多个人的囚徒困境(博弈论的诡计)

    囚犯困境作为博弈论中的一个基本的模型,可以解释很多与此类似的杜会现象,如寡头竞争.军备竞赛等.但是社会中的博弈往往并不止有两个参与者,这时的博弈还会出现囚徒困境吗? 答案是肯定的,在多个参与者之间形成 ...

  9. ​复盘共享经济2020:陷入艰难求生困境,转型能否拯救亏损怪圈

    2020年对于共享经济而言,不啻于一场灾难. 从诞生至今,短短几年间,共享经济已经走过了初兴.热潮.乱象与复归平稳,唯一不变的对于这种模式能否走得通的质疑声从未间断.进入2020年因黑天鹅事件,对共享 ...

最新文章

  1. 六年级小学python第四讲_python第四讲
  2. 易百教程人工智能python修正-人工智能无监督学习(聚类)
  3. Python-OpenCV 处理视频(三): 标记运动轨迹
  4. matlab中随机函数的具体使用方法
  5. python 赋值重置_Python所有赋值语句快速预览
  6. oracle恢复drop建的表首次,案例:Oracle dul数据挖掘 没有备份情况下非常规恢复drop删除的数据表...
  7. html开发文档工具栏,添加应用栏和工具栏 (HTML)
  8. 矩阵位移法matlab编程,矩阵位移法_MATLAB_GUI.doc
  9. 数据分析师 需求分析师_是什么让分析师出色?
  10. 完全搞定iframe(框架)里的滚动条
  11. Maven系列(一):Maven简介
  12. 12v直流电机并联多大电容_对电容的理解
  13. 蓝桥杯2019c语言b组试题,2020年7月B组C++蓝桥杯真题试水
  14. 齿轮刚度计算 matlab,数值积分求解齿轮刚度
  15. 网页视频无法快进播放时(刷网课)
  16. 旅游景区如何利用优惠券提高客单价?
  17. UML建模工具最近更新汇总(-2022年7月)共16款:Visual State、UML Diagrammer……
  18. spss如何调用已经训练好的神经网络模型
  19. 力扣-多线程专项(一)(按序打印、交替打印、打印零与奇偶数)
  20. ASP.NET——使用FileUpLoad服务器控件实现文件上传

热门文章

  1. 剑指 Offer 07. 重建二叉树
  2. ttf字体库裁剪工具制作与使用
  3. mysql数据库特殊字符_MySQL创建带特殊字符的数据库名称方法示例
  4. DNS污染的问题解决
  5. 搜索不包含关键词_秘迹搜索——不记录关键词、不追踪、过滤广告的搜索引擎...
  6. vue2 使用 oninput onChange报错Uncaught ReferenceError: oninputHandler is not defined
  7. 计算机音乐谱大全桥边姑娘,桥边姑娘-总谱完整版
  8. NGFW的protal认证实验
  9. 第二部分 单机以及编队控制实验—初级教程之安卓APP使用教程(13)
  10. 会议类新闻稿怎么写?附200字优秀范文案例,直接套用即可