徐州师范大学 管理学院 博弈论第12章 演进博弈与自发秩序.pptx
《徐州师范大学 管理学院 博弈论第12章 演进博弈与自发秩序.pptx》由会员分享,可在线阅读,更多相关《徐州师范大学 管理学院 博弈论第12章 演进博弈与自发秩序.pptx(57页珍藏版)》请在文库网上搜索。
1、第12章演进博弈与自发秩序刘永新徐州师范大学管理学院理性与经验 传统博弈理论:每个人都是理性的,并且理性和博弈结构的共同知识;每个人都在选择战略最大化自己的利益;只要知道博弈的结构,就可以预测均衡结果; 但其他社会科学家一直对理性人假设抱有怀疑.进化博弈 John Maynard Smith and G Price, 1973; Maynard Smith, 1982, Evolution and the Theory of Games, CUP; 生物博弈是基因之间的博弈; 生物行为(战略)是由基因(genes)决定的;基因的生存和繁殖由自然选择决定;最适合生存的基因不断繁衍,而不适合生存的
2、基因被淘汰;生物进化是一个自然选择的过程;最后可能导致一个稳定状态.演化稳定战略 ESS: evolutionary stable strategies: 种群中可以持续存在的行为方式; 静态: 一个特定的行为方式被称为是演化稳定的,如果它的种群不能被变异所成功侵入;或者说,任何偏离行为的个体具有更低的生存能力,种群将会恢复到原来的状态; 动态: 假定初始状态存在多样的行为方式, 随着时间的推移,如果某个特定的行为方式能逐步主导整个种群, 这个特定的行为方式就是ESS; ESS与纳什均衡 ESS一定是纳什均衡,但并非所有的纳什均衡都是ESS; 演化过程可以帮助选择特定的纳什均衡;生物进化与社会
3、演进 战略: 生物行为是基因决定的,个人没有选择性; 社会行为并不完全取决于基因,而是与社会环境、文化、教育、以及个体的经验等因素等有关;个体有选择性 适应性(fitness):基因的繁殖能力;总的或平均的报酬(payoff); 传递:基因遗传;成功的人将信息传输给朋友、同事;好的行为方式会被学习、模仿;人们也会有意识地通过“试错”的办法寻找好的战略;所以社会和教育机制更为重要;单元均衡与多元均衡 演化稳定状态可能只有一个战略(行为方式),也可能包含多个具有同样适应性的行为方式; 前者称为单元均衡(monomorphic equilibrium); 后者称为多元均衡(polymorphic e
4、quilibrium).协调博弈:左撇子与右撇子 设想总人口中有两类人:一类人是左撇子;另一类人是右撇子; 任意挑选其中的一对进行博弈; 支付矩阵如下图所示; 注意:战略是先天决定的,参与者并不在两种战略之间选择。左撇子与右撇子左撇子右撇子左撇子右撇子1,10,00,01,1谁最适合生存? 答案依赖与初始的人口分布。直观。 假定总人口中有x的比例是左撇子,1-x的比例是右撇子。那么,左撇子的预期支付为:x1+(1-x)0=x; 右撇子的预期支付:x0+(1-x)1=1-x; x(1-x) x1/2 三个均衡 如果x1/2,左撇子更具生存能力,他们的比例将增加,直到100%;单元均衡; 如果x2
5、/3, 物质型更适合生存,将演化成稳定均衡; 如果x6x x1/3均衡 如果x/1/3, TFT生存;稳定均衡; 如果x6x (4n-5)x1 x1/(4n-5)X与N的关系1/3xnn=2TFT均衡ALL-均衡Robert Axelrod Axelrod(1981,1984)著名的实验证明,在14种战略中,TFT是最成功的; 在第2个实验中,在62个战略中,TFT是最成功的。弱稳定与强稳定 稳定性依赖于变异战略(mutant)的种类; 假定原来的人口全由TFT组成。如果变异是ALL-C,合作继续维持,但比例不会变化: 强稳定(strong stable):变异入侵之后,元战略比例会增加直到把
6、变异者消灭为止; 若弱稳定weak stable):变异入侵后,比例不会变化。“中性变异”TFT,TF2T,STFT ALL-C和TF2T是TFT的中性变异; 如果初始人口由TFT和TFT2T组成,STFT入侵后,TFT将消失; 所以,TFT甚至不是弱稳定战略。人们将模仿成功者。合作社会会被破坏吗? 假定TFT长时间维持了社会的合作;人们可能变成ALL-C类型;此时,ALL-D入侵后,将可能蔓延很长时间,甚至导致整个社会进入非合作社会; 中国人在西方为什么容易行骗?TFT:动物界的合作 Manfred Milinski (1987): among certain small fish that
7、 face an iterated PD; 当一条大鱼进入一群小鱼的池塘时,一条或更多的小鱼将接近它侦探它有危险。这种掠夺侦察活动对这些侦探者是有风险的,但整个鱼群是有好处的:如果侵入者不是掠夺者或者不是特别饥饿,小鱼无须疏散。PD:每个个体都有很强的动机背叛,让其他鱼完成侦察;但是如果所有的鱼都背叛,就不可能获得侵入者的信息。而完全的合作可以最小化总的风险,因为如果不能集中与单个目标,入侵者将被迷惑。(续) Milinski 和Dugatkin独立地发现,鱼类确实在使用TFT:当一对鱼接近入侵者时,如果一条想尾随在后,走在前面的鱼转身向后,等待另一条跟上,然后再并行前进。日复一日,Guppi
8、es甚至可以记住其他同伙过去的表现。如果一次试验中一方背叛,另一方在第二天的试验中也会背叛。 Guppies倾向于与过去表现出更具合作精神的鱼结伴而行。鹰-鸽博弈HAWKDOVEHAWKDOVE-1,-11,00,10.5,0.5生存能力 假定鹰派的比例是x,鸽派的比例是1-x; 鹰派的支付:-x+(1-x)=1-2x; 鸽派的支付: 0 x+0.5(1-x)=0.5(1-x); 1-2x0.5(1-x); x1/3均衡 如果x1/3, 鸽派占优势;不稳定 如果x=1/3,同样的适应性;稳定; 稳定均衡是POLYMORPHIC;图示180 x=11/3生存能力-1鹰派:1-2x鸽派:0.5(1
9、-X)二元均衡 鹰派和鸽派同时并存; 如果初始人口由单一类型构成,另一类型可以成功入侵,直到均衡; 少数派占优势; “男人不坏,女人不爱”?自发秩序与产权制度 人类的行为并非完全有基因唯一决定;即使并非总是完全理性地计算,人们也必然要在不同的战略之间选择; 社会秩序是所有人行为选择的结果,但不是集中设计的,而是自发演化的结果; 产权制度:先占原则(possession rule); 教室占座位: ROBERT SUGDEN, JEP, 1989.鹰-鸽博弈HAWKDOVEHAWKDOVE-1,-11,00,10.5,0.5AB三个纳什均衡 两个纯战略均衡: (A-鹰,B-鸽); (A-鸽,B-
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
3 文币 0人已下载
下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 徐州师范大学 管理学院 博弈论第12章 演进博弈与自发秩序 徐州 师范大学 博弈论 12 演进 博弈 自发 秩序