混合策略纳什均衡.ppt
3混合策略纳什均衡3.1混合策略纳什均衡3.2多重纳什均衡博弈3.3多重纳什均衡博弈的分析主要内容
猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面〔1〕不存在前面定义的纳什均衡策略组合〔2〕关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念3.1混合策略纳什均衡
行参与人列参与人混合策略:在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且
混合策略扩展博弈:博弈方在混合策略的策略空间〔概率分布空间〕的选择看作一个博弈,就是原博弈的“混合策略扩展博弈。设行参与人的策略选择概率为,列参与人的策略选择概率为则参与人1的期望支付为则参与人2的期望支付为
混合策略纳什均衡设是人策略式博弈的一个混合策略组合,如果对于所有的,对于每一个都成立,则称混合策略组合是这个博弈的一个纳什均衡。注意:在纳什均衡下,没有参与人有积极性单独偏离或改变该策略或策略组合。
例1流浪汉找工作游荡0,0-1,1-1,33,2政府救济不救济假设政府救济的概率为;流浪汉找工作的概率为;则
博弈方1的混合策略博弈方2的混合策略2,35,23,11,5CDAB博弈方2博弈方1策略得益博弈方1〔0.8,0.2〕2.6博弈方2〔0.8,0.2〕2.6例2
例3扑克牌对色游戏B红黑-1,11,-11,-1-1,1A红黑假设A出红牌的概率为;B出红牌的概率为;那么因此A的最正确反响函数为
因此A的最正确反响函数为同理纳什均衡是:A和B出红牌还是出黑牌的概率都是1/2.反响函数法
练习1:利用反响函数法找出政府与流浪汉博弈的纳什均衡流浪汉找工作游荡0,0-1,1-1,33,2政府救济不救济假设政府救济的概率为;流浪汉找工作的概率为;则
纳什均衡是:政府以1/2的概率选择救助,流浪汉以1/5的概率选择找工作。练习2:利用反响函数法找出情侣博弈的所有纳什均衡丽娟足球芭蕾1,20,00,02,1大海足球芭蕾
例4〔鼓励的悖论〕有一家公司为了防止盗窃聘请了一名门卫,但是长期以来却发现仍有盗窃案件发生,公司讨论了两种方案,一是只要有失窃案件,那么加重惩罚门卫,另一方案是,只要抓住小偷,那么联合公安机关加重对小偷的惩罚。请分析哪种方法对降低盗窃率有长效作用?V,-D-P,00,S0,0睡不睡偷不偷守卫小偷假设小偷选择偷的概率为;守卫选择睡觉的概率为;那么
V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对守卫的处分:短期中的效果是使守卫尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概率分析得到纳什均衡0-D-D’守卫得益((睡)S小偷偷的概率1
V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对小偷的处分:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉0-P-P’小偷得益(偷)V守卫睡的概率1
监督博弈的纳税检查A为应纳税款,C为检查本钱,F是偷税罚款。假定CA+F。不存在纯战略纳什均衡。请问:如何才能降低纳税人逃税的可能性A-C+F,-A-FA-C,-A0,0A,-A税收机关检查不检查纳税人逃税不逃税
1〕夫妻之争的混合策略纳什均衡妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡