文档详情

博弈论的概述.pptx

发布:2023-11-23约1.62千字共18页下载文档
文本预览下载声明
11.3 博弈论延时符 什么是博弈论?博弈论(game theory):又称对策论,是用于分析,2个或多个参与人之间的,策略互动的一种工具。在博弈中,参与方考虑其他方的预期行为,并认识到彼此影响对方的行为。寡头博弈是研究寡头企业之间相互策略互动关系,是博弈论的一种重要应用。延时符11.3 博弈的定义 01使用博弈论分析企业决策第一步骤是把经济情形提炼为一个简单的博弈。由于现实很复杂,我们需要将策略集简化,只保留几个关键的要素。这一步没有通用的法则,有点像艺术创作,需要大家多学习才能建立好的博弈模型。延时符11.3 博弈论分析工具的步骤 01使用博弈论分析企业决策第二步骤是求出给定的博弈的解,即预测在博弈中会发生何种结果。这要求读者需要了解博弈均衡概念,熟练掌握相关的计算方法。延时符11.3 博弈论分析工具的步骤 11.3 博弈的3个共同要素博弈有3个共同要素:参与者、策略、收益。 参与人是指博弈中的每一个决策者。参与人可以是个人、企业或者整个国家。参与人的特征是有能力在可行的行动集合中进行选择。 延时符 策略是指参与人在博弈过程中各个阶段的行动叫作一个。依据所考察博弈的不同,一个策略可能 仅包含一个简单行动,也可能是一个在博弈开始前制订的视情况而变的复杂行动计划。延时符11.3 博弈的3个共同要素 收益是指在一个博弈结束后各个参与人的最终回报。收益可以是参与人获得的效用水平或货币收益(如经济利润)。延时符11.3 博弈的3个共同要素 囚徒困境的策略思考在求解博弈之前,我们可以预测,在囚徒困境中会发生什么。首先想到的预测结果可能是,在博弈中两个参与人都会选择保持沉默。因为在这种选择下, 两个参与人总的自由时间最多( 4 年),但这可能并不是最好的预测。延时符11.3博弈的矩阵形式延时符 博弈均衡的概念市场供求均衡中市场参与者没有动力去改变自己的行为。约翰纳什借用均衡定义一种博弈均衡,被称为纳什均衡,它是指一组这样的均衡策略,参与者一旦选择这组策略,都不会有激励去改变自己的策略。延时符11.3 博弈均衡的概念 11.3 博弈均衡为了求解纳什均衡,需要定义最优反应。最优反应是指,如果给定对方某个策略,选择对自己收益最大策略。比如,嫌疑犯B选择沉默策略,A的最优反应是选择告发策略;如果B选择告发,A的最优反应是选择告发。延时符 11.3 博弈均衡纳什均衡就是在博弈中,所有参与者都选择自己的最优反应策略。一个纳什均衡是稳定的,因为参与人都选择自己的最优反应策略,都不会有激励背离自己的均衡策略。延时符 寻找参与者最优反应的方法为:对于策略为离散的博弈,使用在最优反应的收益下面划线法;对于策略为连续的博弈,用导数求最优值法。 延时符11.3寻找参与者最优反应的方法 第一步就是对参与人 a 的最优 反应划线。如果参与人 b 选择告发,参与人 a 的最优反应是告发,所以我们在矩阵1下面划一条线。而如果参与人 b 选择保持沉默参与人 a 的最优反应还是告发,所以我们在 3 下面划线。延时符11.3 用划线法求囚徒困境的最优反应和纳什均衡14 再来看参与人 b 的最优反应。如果参与人a选择告发,参与人 b 的最优反应是告发,故在1 下面划线。如果参与人 啊 选择保持沉默,参与人 比 的最优反应是告发,故在3 下面划线。延时符11.3 用划线法求囚徒困境的最优反应和纳什均衡15 纳什均衡就是方格中,每一个参与人的收益,都被划过线的策略组合,(告发,告发)延时符11.3 用划线法求囚徒困境的最优反应和纳什均衡16 可以发现,纳什均衡并不一个最优结果。对于双方来说,沉默,沉默,才是最好的选择。但是,沉默,沉默,不是一个稳定的选择,都有激励改变自己的策略。也就是,均衡时,双方都选择不合作,这就是被囚徒困境的原因。延时符11.3 纳什均衡不是最优结果 延时符11.3 用划线法求囚徒困境的最优反应和纳什均衡18
显示全部
相似文档