博弈论概述概要.ppt
文本预览下载声明
由参与者1的三种策略的期望值相等得到联立方程组: 类似的,得到联立方程组: 得到 “小偷和守卫”博弈 “小偷和守卫”博弈是一个存在混合策略纳什均衡的经典博弈。 守卫负责在夜间看守一个仓库,小偷试图在夜间去偷窃这个仓库的物品。 守卫有两个策略:睡觉、不睡觉。 小偷也有两个策略:偷、不偷。 小偷 偷 不偷 守卫 睡觉 (-5,5) (0,0) 不睡觉 (10,-10) (-2,0) 根据“划横线法”,“小偷和守卫”博弈没有纯策略均衡(Pure Strategy Equilibrium),但“小偷和守卫”博弈存在一个混合策略纳什均衡。 假设守卫选择“睡觉”的概率为 ,选择“不睡觉”的概率为 得到: 求解联立方程组,得到: 假设小偷选择“偷”的概率为 ,选择“不偷”的概率为 小偷通过选择自己的策略使得守卫在选择“睡觉”和“不睡觉”两种策略之间无差异。 得到: 求解联立方程组,得到: 博弈论概述 博弈的定义 博弈论译自英文Game Theory。 朱熹《论语集注》:“博,局戏也。弈,围棋也。” 博弈论的定义 属应用数学的一个分支, 表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。 博弈实例1:锤头、剪刀、布 博弈参与者:两名同学 博弈过程: 两人在“锤子、剪刀、布”三种策略中选择一种。 如果两人的策略一样,则平局。 出“锤子”一方胜过出“剪刀”一方。 出“剪刀”一方胜过出“布”一方 出“布”一方胜过出“锤子”一方 博弈双方策略相互依赖,不独立。 博弈实例2:聚会 博弈参与者:两个人 博弈过程: 两人在校门口集合,一起逛博物馆 博弈策略和结果 两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过 博弈双方策略相互依赖,不独立。 博弈经典案例:囚徒困境(Prisoners Dilemma) 警方逮捕了甲、乙两名犯罪嫌疑人 警方分开审讯两人 根据“坦白从宽、抗拒从严”的原则: 如甲、乙均坦白,则两人将分别被判处 5 年有期徒刑 如甲坦白、乙不坦白,则甲被判 1 年、乙被判 10 年徒刑 如甲不坦白、乙坦白,则甲被判 10 年、乙被判 1 年徒刑 如甲、乙均不坦白,则两人将分别被判处 2 年有期徒刑 甲、乙二人独立决策 对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 当个体理性与集体理性的冲突时,如果没有强制性的法律措施,则服从于集体理性的协议规则很难执行 博弈经典案例:囚徒困境(Prisoners Dilemma) 博弈的构成要素 完整的博弈通常包含三个构成要素 博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 一、博弈参与者(Player) 博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人 博弈参与者可能是单个的个人,也可能是组织或集体 企业、社会团体、国家 博弈参与者可能多于两方,三方或多方博弈参与者 二、博弈策略(Strategy) 博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为“坦白”或“不坦白” 三、博弈的收益(Payoff) 博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是 如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑 博弈的分类 合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games) 完全信息静态博弈(Static Game with Complete Information) 完全信息动态博弈( Dynamic Game with C
显示全部