生活中的博弈论论文.pdf
生活中的博弈论
这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。
本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣
的。其中含有很浓的智慧气息,趣味横生。下面就是我关于这门课的
小论文。
我们首先就会问,什么是博弈论?其实就是研究个体如何在错综
复杂的相互影响中得出最合理的策略。生活中每个人,其每一个行为
如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、
相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论
是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化
为一门科学。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、
扑克等。数学家们将具体的问题抽象化,通过建立完备的逻辑框架、
体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对
弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己
和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢
棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还
得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学
问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈
理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944
年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济
行为》,标志着现代系统博弈理论的初步形成。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的
规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选
择并加以实施,并从各自取得相应结果或收益的过程,博弈论经过了
这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管
是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其
对于理性人来说懂得如何博弈就显得越发重要。
下面我说一下我个人的想法。博弈其实就是一种游戏,是如何做
出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打
牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,
都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏
者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通
的游戏是一样的,其实这并不奇怪,其实博弈本身的含义就是博弈参
与者在一定的规则条件下选择相应的策略以期获得足够的利益的过
程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规
则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及
出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个
三方博弈的过程。
为了能够了解博弈的含义,那么下面我们来看一下经典的博弈模
型。
需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困
境”。
囚徒困境的博弈的基本模型是这样的:警察抓了两个合伙犯罪的
罪犯,但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一
个供认犯罪就能确认罪名成立。为了得到所需的口供,警察将这两名
罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择
机会:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各
判一年徒刑;如果两人中有一人坦白认罪,则坦白者从轻处理,立即
释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们
将被各判5年监禁。
如果分别用-1,-5和-8表示判刑1年、5年、8年的得益,用0
表示被立即释放的得益,则我们可以用一个特殊的矩阵将这个博弈表
示出来,这种矩阵是表示博弈问题的一种常用方法,我们称这种矩阵
为一个博弈的:得益矩阵:
囚徒1、囚徒2代表两个博弈方,他们各自都有“坦白”和“不
坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一个
人在选择策略时都不可能知道另外一个选择什么,因此可能两人做出
选择时间不同,但是在选择时不知道对方的决定,因此我们在理论上
可以看做他们同时做出选择,那么下面我们就来分析一下,他们会如
何选择呢,如果是其中一个是你,你又会如何选择呢?
在分析之前我必须要说明一下,我们这里的博弈方是理性的,即
他总是考虑自身是否能得到最大的利益,而不是集体得到最大的利
益。
例如对于囚徒1来说,囚徒2有坦白和不坦白两种可能的选择,
假设囚徒2选择的是“不坦白”,则对囚徒1来说,“不坦白”的得
益为-1,坦白的得益为0,那么他肯定会选择坦白,假设囚徒2选择
的是“坦白”,那么囚徒1坦白