文档详情

jx重复博弈.ppt

发布:2018-06-20约4.51千字共42页下载文档
文本预览下载声明
博弈论与信息经济学 重复博弈 无名氏定理 信誉 序惯博弈与重复博弈 序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次。如:房地产开发博弈 重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” (stage game)。如:囚徒困境 重复博弈的三个特征 阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构; 所有参与人观察到博弈过去的历史; 参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和或者加权平均值; 重复博弈和信誉问题 如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。 影响重复博弈主要因素 博弈的次数 重复次数的重要性来自参与人短期利益与长远利益之间的权衡 信息的完备性 不完全信息重复博弈KMRW模型 有限次重复博弈 连锁店悖论(chainstore paradox;Selten,1978) 在完全信息博弈中,只要博弈的次数是有限的,合作就不会出现。但如果参与人的类型是不完全信息,只要博弈进行的足够长,合作仍然可能出现。 囚徒困境博弈 重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例: All-D: 不论过去发生什么,总是选择不合作; All-C: 不论过去发生什么,总是选择合作; 合作-不合作交替进行; tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动; trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。 支付函数 双方都不合作: 对 的解释: 贴现率; 博弈继续的概率; 二者的结合; 一般化:未来收益的重要程度 无名氏定理(Folk Theorem) 在无限次重复博弈中,如果参与人对未来足够重视( 足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到。 这里“合作程度”定义为整个博弈中合作出现的频率。 50年代就人所共知,但无人有发明权。 Tit-for-tat 纳什均衡,但不是精炼纳什均衡: Why Not A Perfect NE 假定A在t=5的时候,没有合作。根据TFT战略,在t=6,B应该选择惩罚(不合作)。B会这样吗? 如果B相信A采取的是TFT战略,那么:如果B对A实施惩罚,预期的收入流为: 反之,如果B原谅A, Trigger strategies 如果未来足够重要,精炼纳什均衡: 合作的条件 如果下列条件满足,合作就是均衡结果: 解释 R-T可以理解为不合作的诱惑; R-P是合作的剩余(利益); 条件说明: 给定未来的重要程度,不合作的一次性诱惑(R-T)相对于合作带来的利益(R-P)越小,合作的可能性越大; 给定不合作的诱惑和合作带来的利益,未来越重要,合作的可能性越大; 行为的信息传递 假如欺骗两次才被发现: 含义 欺骗行为越难以被发现,欺骗发生的可能性越大;或者说,合作越困难; 例如,R=4, T=3, P=0. 如果欺骗一次就被发现,只要 合作就会出现;而如果欺骗两次才被发现,只有当 时,合作才可能出现; 一般地,欺骗行为越不容易被发现,合作越困难。 惩罚与合作 Abreu(1986):最大合作战略是使用最严厉的可信惩罚(the strongest credible punishment); 维护合作并不需要无限期的惩罚;只要惩罚期足够长就可以了; 萝卜加大棒(stick and carrot) 从合作开始,一直合作直到:如果有任何一方在t期不合作,在t+1期,前期合作者选择“不合作”来实施惩罚,前期不合作者选择合作;如果该合作的没有合作或者该惩罚的没有惩罚,在t+2期继续按照上述t+1期的战略规定博弈;否则,合作恢复。 解释 在合作子博弈,合作的条件是: 在非惩罚子博弈,合作的条件是: 不确定性下的最优处罚 在确定的情况下,惩罚越严厉,越有助于合作。因为均衡情况下,欺骗从来不会发生,所以惩罚实际上是没有成本的。 但在不确定的情况下,即使每个人都选择合作,“坏结果”也会出现。如果坏结果总是触发惩罚,就会冤
显示全部
相似文档