金融数学博弈论第一章3.ppt
文本预览下载声明
* * 纳什均衡的思想 设想在博弈论预测的博弈结果中, 给每个参 与者选定各自的战略, 为使该预测是正确的,必须 使参与者自愿选择理论给它推导出的战略.这样, 每一个参与者要选择的战略必须是针对其他参与 者选择战略的最优反应, 这种理论推测的结果可以 叫做“战略稳定”或“自动实施”的, 因为没有参与者 愿意独自离弃他所选定的战略, 这一状态称做纳 什均衡(Nash Equilibrium). 定义:在n 个参与者的标准式博弈 中,如果战略组合 满足对每一个参 与者i , 是(至少不劣于)他针对其他(n-1)个参与 者所选战略 的最优反应战 略,则称战略组合 是该博弈的一个 纳什均衡(纯战略).即: 对所有 中的 都成立, ( NE ) 亦即 是以下最优化问题 的解: 反之, 不是针对其他参与人战略选 不是博弈 Si中存在另外一个战略 使得 如果战略组合 G 的纳什均衡, 就意味着至少存在一个参与人 i, 参与人 i 的战略选择 的最优反应战略, 即在 择 如果博弈论提供的战略组合解 不是纳什均衡的解, 离理论的预测, 则至少有一个参与者有动因偏 使得博弈进行和理论预测不一致. 和纳什均衡推导密切相关的是协议的理念: 如果参与者之间要商定一个协议决定博弈如何 进行, 那么一个有效的协议中的战略组合必须是纳 议. 什均衡的略组合, 否则至少有一个参与者不遵守协 看下面几个例子: 例一 “囚徒困境” -6, -6 0, -9 -9, 0 -1, -1 囚徒2 沉默 招认 囚徒1 沉默 招认 对于囚徒1来讲,如果囚徒2选择战略“沉默”, 那么,囚徒1选择“沉默”的收益为-1,选择“招认” 的收益为0, 当然选择“招认”.同理可得囚徒2的战 略选择也是“招认”.因此,此博弈的纳什均衡解为 (招认,招认). 此时双方的收益为 (-6, -6), 很明显(-1, -1) 的收益好于(-6, -6). 但纳什均衡 的结果是达不到的,此所谓的“囚徒困境”. 这也正是博弈论的有趣之处, 均衡的结果告诉我们一个很重要的结论: “囚徒困境”纳什 个体理性和集体理性的矛盾, 每个个体都追求个体收益最优, 其结果可能是 都达不到最优, 相反, 集体利益可能也受到损害. 注:亚当.斯密: 每个个体追求最优,结果集体最优. 影响. 纳什认为亚当. 斯密忽略了个体选择时的相互 6 ,6 3 ,5 3 ,5 5 ,3 0 ,4 4 ,0 5 ,3 4 ,0 0 ,4 左 中 右 上 中 下 例2 对于参与者1,如果参与者2选择左,则参与者1选择 中(4>3>0),此时参与者1的收益为4,在4下面划 一横线, 同理可以求出参与者2选择中、右时, 1的 选择和收益. 对于参与者2可用同样的方法求解. 格 子内数字都划线的对应的双方的战略组合(下,中) 即为博弈的纳什均衡解. 1, 2 0 , 0 0 ,0 2 , 1 帕特 歌剧 拳击 克里斯 歌剧 拳击 例3—性别战博弈 易知此博弈有两个纳什均衡,(歌剧, 歌剧); (拳击, 拳击)结果到底是那一个呢? 不得而知.此 为纳什均衡解的多重性,是纳什均衡的缺陷之一, 也是博弈论的一大难题. 此博弈无纳什均衡(纯战略). 例4 —猜硬币博弈 -1 , 1 1 ,-1 1 , -1 -1 ,1 参与人2 正面 反面 参与人1 正面 反面 例5 博弈双方1和2就如何分100元钱进行讨价 还价. 假设确定了以下规则: 双方同时提出自己的要求的数额 和 如果 , 则博弈双方的 要求都能得到满足, 即分别得到 和 但如果 则该笔钱就被没收. 求该博弈的纳什 为什么? 均衡,若你是其中一个博弈方, 你会选择什么数额, 解 参与者1的效用函数为 因此,参与者1的最优选择是 最优反应函数. 由对称性2的最优反应函数为 由于双方的反应函数完全相同,方程 此为1的 有无数解,所以该博弈有无数个纳什 均衡解 其中 为 的解. 如果我是其中的一个参与者, 我会选择得到50 . 因为在该博弈的无穷个纳什均衡中,(50, 50)是比较 (50, 50) 这个均衡称为“聚点”均衡. 公平容易被双方接受的. 例6 考虑一个有 N 个人参加的游戏:每个人可 以放最多1
显示全部