博弈论概述完整版本.pdf
博弈论
§1.博弈论概述
§2.完全信息静态博弈
§§3.完完全信息动态博弈
§4.不完全信息静态博弈
§§55.不完全信息动态博弈不完全信息动态博弈
第第一节节博弈论概述博弈论概述
博弈论(theGameTheory)也就是运筹学中的对策
论论,“是关于策略相互作用的理论是关于策略相互作用的理论””,研究两个或两研究两个或两
个以上参加者在对抗性或竞争性局势下如何采取行动,
如何作出有利于己方的决策及其均衡问题如何作出有利于己方的决策及其均衡问题。。
对策思想最早产生于我国古代。
对策思想明确地应用于经济领域对策思想明确地应用于经济领域,始于始于CournotCournot
(1838),Bertrand(1883),Edgeworth(1925)等人
关于寡头竞争、产量与价格垄断、产品交易行为的研
究。
JohnF.NashJr
TheNobelMemorialPrizeinEconomicSciences
2007-LeonidHurwicz,EricS.Maskin,RogerB.Myerson
2005-RobertJ.Aumann,,ThomasC.Schellingg
2001-GeorgeA.Akerlof,A.MichaelSpence,JosephE.
Stigglitz
1996-JamesA.Mirrlees,WilliamVickrey
--JohnJohnCC.HarsanyiHarsanyi,JohnJohnFF.NashNashJrJr.,ReinhardReinhardSeltenSelten
博弈论提供了一种研究人类理性行为的通用方法,
运用这些方法可以更为清晰完整地分析各种社会力量冲
突和合作的形势,具体分析人与人之间在利益相互制约
下理性主体的策略选择行为及相应结局。博弈论强调在
既定定约束条件下追求效用最大化((服从微观经济学的一
般分析方法)。同时,信息和时序问题成为博弈论的两
个重要的分析工具个重要的分析工具。。
一、博弈论的基本概念
博弈论博弈论研究究人与与人之间相之间相互““斗智斗智””的形式和结果的形式和结果。
当经济主体间的利益存在冲突时,一方所获得的利益不仅
取决于自己所采取的行动取决于自己所采取的行动,而且也取决于其他主体采取的而且也取决于其他主体采取的
行动或对自己行动的反应。博弈论就是描述在这种形势下
各方理性地选择自己的行动所实现的结果各方理性地选择自己的行动所实现的结果,分析各决策主分析各决策主
体的行为发生相互作用时的决策以及这种决策的均衡问题。
博弈论的基本概念包括博弈论的基本概念包括::局中人局中人、策略策略、支付支付。
①局中人(Player):局中人是指在博弈中选择行动以
最大化自身效用的决策主体最大化自身效用的决策主体。可能是个人或团体可能是个人或团体((如国家如国家、
企业等)。
②策略或策略空间(Strategy):策略是局中人选
择行动的规则择行动的规则,它规定局中人如何对其他人的行动作它规定局中人如何对其他人的行动作
出反应,即在每种可能的情况下应该如何行动。它与
行动不同行动不同,,行动是局中人的行动是局中人的决策变量策变量。。如如“人不犯我人不犯我,,
我不犯人;人若犯我,我必犯人”是一种策略,而
“犯”与“不犯”是两种不同的行动,策略规定了什
么时候选择择““犯””什什么时候选择择““不犯””。局中中人可
选择的策略的全体构成了策略空间(或策略集)。
③③支付支付((PayoffPayoff)()(支付函数与支付矩阵支付函数与支付矩阵):):博弈博弈
论中,可用数值表示各局中人从博弈中所获得的收益
或效用水平,该数值称为支付。支付依赖于各个局中
人所作出的策略,这种收益与策略的依赖关系构成了
支付函数。参与博弈的多个局中人的收益可用一个矩
阵或框图表示阵或框图表示,这种矩阵或框图叫做收益矩阵这种矩阵或框图叫做收益矩阵。
除此之外,博弈论中的基本概念还包括:行动、信息、
结果和均衡。它们关系是:行动是局中人的决策变量;信息
是局中人在