经济博弈论 重复博弈.ppt
文本预览下载声明
30.03.2020 31 4.3.1 几个概念 ? 无限次重复博弈求解存在的 问题 :( 1 )由于不 存在最后一个阶段,无法运用逆推归纳法求解; ( 2 )如果不考虑时间的价值,在无限次重复加 总过程中,几乎所有子博弈路径的总得益都为无 穷大,因此无法比较不同路径的优劣。 ? 解决方法 :考虑到时间的价值,人们更为注重近 期的得益,引入贴现系数 ,将未来阶段的收益 折算到当期阶段。这样在无限次重复博弈中,总 收益值将是一个有限数,可以加以比较。 ? 30.03.2020 32 ? 贴现系数 :δ= 1/(1+γ),其中γ为以一阶段 为期限的市场利率。 给定贴现系数δ,若无限次重复博弈一路 径的某博弈方各阶段的收益为 , 则该博弈方在该无限次重复博弈中的总收益为 各阶段博弈中得益的“ 现在值 ”: 1 2 3 , , ? ? ? L 2 1 1 2 3 1 t t t ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? L 4.3.1 几个概念 30.03.2020 33 4.3.1 几个概念 ? 定义 :给定一博弈 G ,无限次重复进行 G 博弈的 过 程 称 为 G 的 “ 无 限 次 重 复 博 弈 ” , 记 为 G(∞,δ),其中δ是各博弈方得益共同的贴现 系数。并且,对任意的 t ,在进行第 t 阶段(第 t 次重复)博弈之前,所有博弈方都能看到前 (t - 1) 阶段博弈的结果。各博弈方在G(∞,δ) 中的“得益”等于各阶段得益的现在值。 30.03.2020 34 4.3.2 无限次重复的囚徒困境博弈 ? 在有限次重复囚徒困境博弈中, 双方采取背叛策略( L,L )将是 唯一的子博弈完美均衡路径。 现在分析无限次重复博弈中, 触发策略是否会带来更好的结局? ? 触发策略 :双方在第一阶段采取合作的策略 R , 如果前( t - 1 )都是合作,那么继续合作;否则, 如果对方背叛,则在后续阶段一直采取背叛策略 L 作为惩罚。 1 , 1 5 , 0 0 , 5 4 , 4 L R L R 图 4 - 6 30.03.2020 35 ? 策略分析 : 如果一方背叛,那么其路径 (L,R),(L,L),(L,L)….的总收益为: 如果一方一直采取合作策略,那么总收益为: 当满足条件 时,博弈方采取合作 策略将获得更大的总收益,求解可得: 2 5 1 1 5 / ( 1 ) ? ? ? ?? ? ? ? ? ? ? ? ? ? L 2 4 4 4 4 / ( 1 ) ? ? ? ? ? ? ? ? ? ? ? L ? ? ? ? 1/4 ? ? 4.3.2 无限次重复的囚徒困境博弈 30.03.2020 36 4.3.2 无限次重复的囚徒困境博弈 ? 结论 :在原博弈具有唯一纳什均衡的无限次重 复博弈中,在满足一定条件下 ,采取 触发策略可以摆脱囚徒困境。这个条件表明贴 现系数较大,博弈方比较看重未来阶段的收益。 直观上看,当博弈方注重长期利益时,通过采 取触发策略可以实现长期合作的圆满结局。 1/4 ? ? 30.03.2020 37 4.3.3 无限次重复博弈的民间定理 本节介绍无限次重复博弈的一个基本结论, 为此先介绍“ 无限次重复博弈的平均得益 ”概念, “可实现得益”概念已经在 4.2.4 节加以介绍。 可实现得益 :阶段博弈各种纯策略组合得益 的加权平均所构成的得益数组,其中权数非负且 总合为 1 ,记为 。 1 ( , , ) n x x L 30.03.2020 38 在图 4 - 6 的囚徒困境例子中,图 4 - 7 阴影部 分即为可实现得益。 图 4 - 7 可实现得益 4.3.3 无限次重复博弈的民间定理 (0,5) (1,1) (4,4) (5,0) 博 弈 方 2 博弈方 1 30.03.2020 39 ? 无限次重复博弈平均得益的 定义 :如果有一常 数π,它作为一无限次重复博弈每个阶段的得 益能产生与该博弈无限次重复中某博弈方的无 穷得益数列π 1 ,π 2 ,……相同的贴现值,则称 π为π 1 ,π 2 ,……的 平均得益 。 4.3.3 无限次重复博弈的民间定理 30.03.2020 40 4.3.3 无限次重复博弈的民间定理 ? 平均得益的计算 : 给定贴现系数δ,每阶段得益都为π时, 无限次重复博弈的贴现值为: 如果每阶段的得益为π 1 ,π 2 ,……,无限 次重复博弈的贴现值为: 两式联立,可以解得: 2 / ( 1 ) ? ? ? ? ? ?? ? ?? ? ? L 2 1 1 2 3 1 t t t ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? L 1 1 ( 1 ) t
显示全部