知讯网-财务分析、股票分析-专注管理、经营、创业、科技等资讯

标题: 博弈论—战略决策 [打印本页]

作者: zhixun    时间: 2012-6-10 21:07
标题: 博弈论—战略决策
小邵时代于2012-06-10 11:56:53翻译

   没有足球选手会在没有守门员的情况下去考虑射向左边球门还是右边球门更容易得分,球门柱并不会移动,因此射向哪边都无伤大雅,而选手与球门柱之间也不会有任何互动。但是实战却不是这样。在点球时,射手会注意守门员一举一动从而决定朝某个方向射门,守门员则会推测来球方向并在主球起飞一瞬间腾身飞扑。如果守门员扑球方向与来求方向一致,那么他将成功扑出点球;反之射手便能射进点球并获得1分。因此,可以说点球大战的胜负取决于射手出球方向射以及守门员的扑球方向。射手与守门员之间存在着互动,这在博弈论中我们称之为“战略情形“。



定义
   博弈论是研究在个体行为对他人行为造成影响的相互依存式的战略情形下决策是如何形成的理论。它的重要特点之一是合理选择策略,即决策者的偏好将被明确定义出来。博弈论的另一个特征便是行为个体会根据对方反应充分考虑后作出决定。这便是战略情形下的决策。

   在现实生活中需要战略思考的时刻数不胜数,博弈无处不在。道路上行驶的汽车在做“驾驶博弈“;网络上为购买低廉商品的买家在做”拍卖博弈”;企业与工会商谈工资、团体协约是在做“谈判博弈“;政党选举中通过党纲争取选民支持是在做“政治博弈”……人们周围存在相互作用就一定存在博弈。

   博弈论由局中人(player)、策略((strategy)、得失((strategy)三要素构成。局中人作为博弈主体可以是个人、企业甚至国家。策略是指局中人能够选择的所有可能行动。得失是指各个局中人在各自选择的策略下得到的结果的数字表现形式。得失可以是实际的金钱报酬,也可以是基数效用

  博弈论于1944年由冯蘒鶋曼和奥斯卡·莫根施特恩合著的《博弈论和经济行为(Theory of Games and Economic Behavior)》出版后正式得到发展。冯蘒鶋曼和奥斯卡·莫根施特恩对双人博弈的“零和游戏”进行了研究,并得出了零和游戏的本质是两名玩家相互博弈导致一方玩家的收入为另一方玩家的损失的敌对式博弈。其中最典型的有纸牌、掷硬币、单双数博弈,当然诸如乒乓、排球等体育项目也可视为敌对式博弈的一种。因此零和游戏曾一度给经济学、军事学带来了巨大的影响。

之后的经济学家与数学家开始对博弈论进行系统研究。很多学者都期待通过这个理论去解决社会上出现的各种问题。他们相信开启这扇大门的钥匙就藏在在冯蘒鶋曼和奥斯卡·莫根施特提出的“敌对式博弈”或者说“零和游戏”的拓展背后。

   如果博弈胜者的利益比败者的损失大,我们称之为“正和博弈(positive-sum game)”。那是否会有这样的可能性?在现实生活中,国家之间通过相互贸易达到盈利,或者在牛市时投资者通过股票投资达到收益都可能是正和博弈。另外,当然也存在着“负和博弈(negative-sum game)”,那可以是暴力的情况。比如所谓的“阿里郎式抢劫”,施害者常常以酒醉者为对象,打晕之后抢走钱包,如此施害者虽然只枪了钱包但是受害者却要承受身体上的额外苦痛。战争也是一种负和博弈,因为两方都将承受生命与财产的损失。


博弈论发展史上的另一个里程碑则由1994年荣获诺贝尔经济学奖的约翰纳什一手缔造的。虽然博弈论当时为应用数学的一个分支,但是已经开始用于经济学领域尤其是寡头垄断问题的研究。之后博弈论逐渐成为微观经济学不可或缺的分析道具。

博弈论里的合作
  博弈论大致可以分为“合作博弈(cooperative game theory)”与“非合作博弈(non-cooperative game theory)”。合作博弈是指全体或一部分局中人自发签订具有束缚力的条约并允许联合的博弈情况,包括国际贸易、劳资双方协约以及在发达国家实行的律师检察院之间的有罪协商制度等。如果局中人为了获得最大利益而违背条约那么合作博弈就将终止,这时违背条约的人将会受到惩罚。

  非合作博弈是指原则上不签订具有约束力的条款以及不允许联合的博弈情况。在游戏规则内可以签订具有约束力的条款,但是在非合作博弈中即使违反条款也不会受到惩罚。最具有代表性的例子有“囚徒困境”、“恶意兼并”以及“完全市场竞争”等。非合作博弈会导致博弈者追求自身利益,我们称之为“自我强制执行行为(self-enforcing behavior)”。在没有任何人强制的情况下博弈者能够约束自身行为是因为他的行为符合他自身的利益。因此,非合作博弈的着眼点在于阐明局中人的自我约束行为。

表现方式
  博弈的表现方式有“战略型博弈(strategic form games)”和“展开型博弈(extensive form games)”两种。战略型博弈由局中人的可选策略集合以及根据局中人已选策略产生的得失构成,我们称之为支付矩阵(payoff matrix)。之前我们看到了点球博弈。它的局中人为射手和守门员,他们的策略为左、右两个方向,也就是说守门员要选择向左扑或者向右扑,同理射手也要选择向左射或者向右射。局中人的得失情况为成功记作“1”,失败记作“-1”。举例来说当射手朝左边射门而守门员也朝左边扑球时,守门员的得失为“1”,射手的得失为“-1”,相反,如果射手朝球门左边射门而守门员朝右边扑球,此时守门员得失为“-1”,射手得失为“1”,如此我们可以得到以下支付矩阵。


           射手
左         右
守门员           左          1,-1          -1, 1
右          -1,  1          1,-1
                                      点球支付矩阵

    博弈可以进行一次,也可以连续进行多次。这时由于博弈的动态决策以及不确定性很难用图表进行表达。为解决这类问题于是产生了展开型博弈的表现方式。它通过博弈树(game tree)向我们提供了之前的决策是怎样对现在造成影响的思考方法。

    博弈论在发展并被应用到各个领域的过程中,企业曾认为它对社会科学领域的贡献微不足道。但当美国联邦政府决定把无线电频谱使用权拍卖时企业的态度在一夜之间发生了翻天覆地的变化,因为当时没有这方面的专家,于是移动公司把眼光投到了博弈论专家的身上。最后美国联邦政府拍出超过预期2倍即200亿美元的价格。英国也有以350亿美元成交的无线电频谱电拍卖事例。我很好奇我国(韩国)会怎样?

原文作者简介:金哲环,韩国亚洲大学经济系教授,毕业于成均馆大学经济系,并在美国加利福利亚州立大学(圣巴巴拉市)取得硕士学位与博士学位。现就职业亚洲大学经济系,主要著作有《趣味经济学》、《汇率论与国际收支》等。最近发表的论文有"Does Korea have Twin Deficits?" Applied Economics Letters, 2006; "Do Capital inflows Cause Current Account Deficts?" Applied Economics Letters, 2010。
译者注:基数效用是指像个人的体重或身高那样在基数的意义上可以度量的效用






欢迎光临 知讯网-财务分析、股票分析-专注管理、经营、创业、科技等资讯 (http://zhixun2010.com/) Powered by Discuz! X3.2