ch3--完全且完美信息动态博弈.ppt
文本预览下载声明
* * 顺推归纳法 0,0 1,3 0,0 3,1 s w w s R D (2, 2) 2 1 Van Damme 博弈 3,1 0,0 2,2 2,2 0,0 1,3 Ds R w s Dw 博 弈 方 1 博弈方2 Van Damme 博弈策略形 * * 3.6.3 蜈蚣博弈问题 该博弈是说明逆推归纳法和博弈分析困难的经典博弈 1 2 1 1 2 1 2 R (98,98) (97,100) d r (99,99) D R r d (98,101) (100,100) D R r d (0,3) D (2,2) R (1,1) D * * * * * * * * * * * 3.2.3 逆推归纳法 逆推归纳法是动态博弈分析最重要、基本的方法。 乙 不借 借 (1,0) 甲 不分 分 (0,4) (2,2) 乙 甲 乙 打 (2,2) 不分 分 不借 借 (0,4) (-1,0) 不打 (1,0) 法律保障不足 的开金矿博弈 乙 不借 借 (1,0) (0,4) * * 3.3 子博弈和子博弈完美纳什均衡 3.3.1 子博弈 3.3.2 子博弈完美纳什均衡 * * 3.3.1 动态博弈中的子博弈 定义: 子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段,它必须有一个初始信息集,且具备进行博弈所需的各种信息。 (1,0) 乙 甲 乙 借 不借 分 不分 (2,2) 不打 打 (0,4) (1,0) 开金矿(信守)--子博弈 * * 3.3.1 动态博弈中的子博弈 注意: 原博弈的初始节点开始的博弈为原博弈本身,不称它为原博弈的子博弈; 第五章将说明在不完美信息博弈中有其它的不作为子博弈的起始信息集的 节点。 * * 3.3.2 子博弈完美纳什均衡 在动态博弈中由于博弈过程是逐步深入的,这一过程由每个阶段所采取的策略构成,由此引出“路径”的概念。 路径:从第一阶段开始通过每阶段一个行为,最后达到博弈结束的一个终端各博弈方的行为组合。 找到了路径也就找到了一个分阶段的策略组合,这一策略组合恰似一个完整的计划,计划的最终实现取决于过程中各阶段的实现。 * * 3.3.2 子博弈完美纳什均衡 在开金矿案例中,策 略组合(借,分)是 一个稳定的策略组合, 因为如果不分,则有 乙打官司的威胁,这 是双方都不愿得到的结果。 “稳定”意味着博弈方都不会单独 改变策略,这恰似纳什均衡的概念。 (1,0) 乙 甲 借 不借 分 不分 (2,2) (1,0) 开金矿(信守) 乙 打 不打 (1,0) (0,4) * * 3.3.2 子博弈完美纳什均衡 由于动态博弈与静态博弈有较大的差异,那么如何才能使静态博弈中的纳什均衡在动态博弈中亦有相应的概念发展? 以开金矿为例(注意此例与以前开金矿例子的差异) * * 3.3.2 子博弈完美纳什均衡 此时打官司对乙亦无好处 (此情况在现实中可能出 现)。在此情况中,逆推 可以得出乙不借,原因在 于乙在第三阶段打官司的 威胁是不可信的。由此导 致甲在第二阶段分的许诺也变为不可信。结局 是,甲开不成金矿,乙保本,甲失去挣钱的机 会。 (2,2) (-1,0) (1,0) 乙 甲 乙 借 不借 分 不分 不打 打 (0,4) 开金矿 * * 3.3.2 子博弈完美纳什均衡 如果按照静态博弈的分析方法,则(借,分, 打)的策略组合为一个纳什均衡,因为任何一方 都不会单独改变策略而降低自己的得益。这与逆 推归纳法得到的结论相矛盾,原因在于路径(借,分)的纳什均衡策略组合包含了一个不 可信的威胁,即乙在第三阶段会选择打官司的行 为是不可信的。 * * 3.3.2 子博弈完美纳什均衡 由此需要对静态博弈中的纳什均衡的概念有所调整,即应满足: 是纳什均衡,从而具有策略稳定性 不能包含任何的不会信守的许诺或威胁 这样的动态博弈策略组合称为子博弈纳什均衡。 * * 3.3.2 子博弈完美纳什均衡 定义(Selten塞尔顿):如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡,则称该策略组合为一个“子博弈完美纳什均衡”。 * * 3.3.2 子博弈完美纳什均衡 注意,用逆推归纳法所得到的解应为子博弈完美纳什均衡。 动态博弈所应注意的两点: 要求各博弈方的策略对每阶段每种可能的情况都设定一个行为方案。其意义在于避免出现不会信守的许诺或威胁,从而使子博弈完美纳什均衡可以用。 假定所有博弈方都是理性的且不会犯错误的。 * * 3.3.2 子博弈完美纳什均衡 与实际情况的差异: 后续可能性太多而无法分析,于是考虑仅知道有限后续阶段的情况? 许诺有限非理性,如何考虑?比如假设非理性的次数小于等于k?
显示全部