博弈论第五章 重复搏弈(Repeated Games).ppt
文本预览下载声明
第五章 重复搏弈(Repeated Games) 信息集 挺好用 见下图 重复博弈 重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如囚徒困境。 重复博弈类型: 有限次重复博弈 无限次重复博弈 随机结束的重复博弈 重复博弈 重复博弈的特征: 1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构 ; 2、所有参与人都观测到博弈过去的历史; 3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。 贴现因子:下一期的一单位支付在这一期的价值。 注意:在每个阶段,参与人可同时行动,也可不同时行动。 重复博弈 因为其他参与人过去的历史总是可以观测到的,因此,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果。 影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。 博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。 信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。 重复博弈的要素 策略、子博弈、均衡路径 支付(得益) 贴现系数 有限次重复博弈 无限次重复博弈 重复博弈 随机停止与贴现率: 设停止重复的概率为p,继续重复的概率为1-p。 定义:令G={A1, A2,…,An; u1, u2,…,un)表示n个局中人的完全信息博弈,对G重复若干次,称G为阶段博弈。 给定阶段博弈G,令G(T)表示G 实施T(T为大于1的整数)次的重复博弈。在某次阶段博弈开始之前,所有已采取过的前面阶段的行动都可以观察到。局中人在G(T)的盈利函数或效用简单的为来自T个阶段博弈盈利现时值之和。 当阶段博弈具有唯一的Nash均衡时 定理:如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。 注1:定理中要求的唯一Nash均衡可以是混合策略均衡。如猜谜游戏。 注2:阶段博弈G可以不是静态的,假如阶段博弈G是完全且完美信息动态博弈时,且具有唯一的“逆向归纳”结局,那么G(T)有唯一的子博弈完美结局。 举例 有限次重复博弈:寡头市场的削价竞争 连锁店悖论: 寡头市场的削价竞争 这个博弈的纳什均衡是什么? 假定博弈共进行10次,结果会如何? 为什么会出现这个结果? 逆向归纳法 假定现在是第十次,结果和一次博弈一样。第九次,即倒数第二次,局中人已经很清楚,最后一次博弈对方肯定要实行低价,因此,现在如何对他施行好心都不会在下一次得到好报,所以,理性人的“我”没有理由实施高价使对方获益。依次类推。 连锁店悖论 结论:不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。 多个纯战略纳什均衡博弈的有限次重复博弈 考虑下面的三价博弈: 该博弈存在两个纯战略纳什均衡(M,M)和(L,L)。显然一次博弈的结果效率不是最高的,因此有帕雷托改进的余地。 多个纯战略纳什均衡博弈的有限次重复博弈 现在考虑该博弈重复进行的情况。如果这个博弈重复进行两次: 两次重复博弈的纯战略路径:9×9=81 子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。 多个纯战略纳什均衡博弈的有限次重复博弈 在这些子博弈完美纳什均衡路径中,确实存在第一阶段采用(H,H)的子博弈完美纳什均衡。 双方的战略是: 局中人1:第一次选H;如第一次结果为(H,H),则第二次选M,如第一次结果为任何其它战略组合,则第二次选L。 局中人2:同局中人1。 多个纯战略纳什均衡博弈的有限次重复博弈 此战略组合的两次重复博弈的路径:第一阶段(H,H),第二阶段(M,M),此为一个子博弈完美纳什均衡路径。 证明: 第二阶段是一个原博弈的纳什均衡,因此不可能有哪一方会愿意单独偏离; 第一阶段的(H,H)虽然不是原博弈的纳什均衡,一方单独偏离,采用M能增加1单位得益,但这样的话,在第二阶段至少要损失2单位得益,因为对方采用的“有报复机制”的战略。偏离(H,H)得不偿失,合理的选择是坚持H。 多个纯战略纳什均衡博弈的有限次重复博弈 总结: 触发战略(Trigger Strategy),首先试探合作,一旦发现对方不合作,则
显示全部