带你快速了解博弈论

博弈论

思考有五个海盗,劫了100两金子要分赃。他们的分赃办法是抓阄决定:抓到第一个阄的海盗,可以先提出一个分配方案,如果有一半以上的人同意他的方案,就照他的方案分赃,否则第一个人就要被杀。剩下的人以此类推。如果你是第一个人,你会提出什么方案?我们假定,每个人都是只追求自己的利益最大化。

估计有些人会提出平均分配,即每人20两,或者是自己不要。但这并非正确答案。
第一个人唯一正确的答案是:100两金子全部归我!而且这个方案一定会被一半以上的人同意,第一个人不会被杀掉。是不是和直觉有点相悖?那这个答案是怎样得出的呢?
经济学家最根本的假设是理性人,即每个人都在追求自己的利益最大化。经济学家最重要的思维之一是边际考虑,即考虑问题时从最后一个变化单位开始。我们就从最后一个人,也就是第五个人开始考虑。
轮到第五个人提方案的时候,其他的人都死光了,金子全部是他的,所以使他利益最大化的行为是,不管前面谁提了什么方案,他都会一概否决。
再看第四个人,他知道无论自己提什么方案,第五个人都会否决,然后他都会被杀掉,所以他利益最大化的方案是:尽量不要轮到自己提方案。所以,不管第一个人提出了什么方案,他都会同意。
然后是第三个人,知道第四和第五个人的选择策略后,他的利益最大化的方案是100两金子全归自己。因为他知道自己和第四个人会同意,即超过了半数的人同意。所以不管第一个人提什么方案,第三个人都会反对。
再看第二个人,他明白无论自己提什么方案,第三和第五个人都会反对,无论怎样都无法达到半数以上的人同意,一旦轮到自己提方案就死定了,所以他利益最大化的行为是同意第一个人提出的任何方案。
所以,不管第一个人提什么方案,第二和第四个人都会同意,再加上第一个人自己的话,就是三人同意,超过半数,可以通过。既然第一个人提出的任何方案都可以通过,而第一个人追求的是自己最大化的利益,那他的方案就应该是:100两金子全归自己。

现实世界中,人们的行为并不是孤立的,而是相互影响的。但经济学的传统方法——新古典经济学(标志是马歇尔的经济学),假设市场是完全竞争的,任何一个人的行为对其他人都没影响。这个假设在解释寡头市场时就出现了问题。寡头市场就是由少数几个大企业所占据的市场,在这种市场中,每个企业的决策和动作对其他企业都有着实质性的影响,这时,博弈论就可以发挥其作用了。


博弈论

博弈论是由著名数学家冯·诺依曼(John von Neumann,1903-1957)开创的,他在20世纪40年代所写的书《博弈论与经济学》是博弈论的开山之作。
博弈论分析的是人们在行为相互影响的条件下是如何作决策的。在博弈中,不仅要考虑别人的决策对自己的影响,也要考虑自己的决策对别人的影响。
诺依曼的博弈论主要是合作博弈论,即在大家遵守协议的情况下发生的博弈行为。而我们现在说的博弈论主要是非合作博弈论,即相互之间没有约束力下的博弈行为。非合作博弈论的开创者是电影《美丽心灵》(A Beautiful Mind)中的主人公原型——约翰·纳什,他在1950年发表了博士论文《非合作博弈》,并在1994年获得了诺贝尔经济学奖。在该论文中,纳什定义了我们经常听到的纳什均衡:这是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。
为方便分析,经济学家根据信息是否完全、博弈是单次还是多次进行,把博弈分为以下四种类型:
完全信息静态博弈;
完全信息动态博弈;
不完全信息静态博弈;
不完全信息动态博弈。
信息是否完全,是指局中人对于对方的策略和其产生的影响是否有完整的信息;静态是指局中人同时做出决策,或者虽然不同时,但后行动者并不知道先行动者做了什么决策;动态是指一方行动在先,另一方可以根据先决策者的行动来决定和调整自己的策略。


囚徒困境
  1. 完全信息静态博弈
    最著名的就是囚徒困境。甲乙两人入室抢劫未遂,警察在房子里发现有人被杀,所以两人被捕。警察为尽快破案,将他们隔离审讯,并规定了「政策」:若两人都坦白杀了人,各判8年;若一个坦白一个抵赖,则坦白的人获释,抵赖的人判10年;若两人都抵赖,虽无法证明杀人,但入室抢劫罪证确凿,两人各判2年。
    之所以「囚徒的困境」是一个完全信息静态博弈,是因为局中人甲乙对对方的策略和影响是完全清楚的,且局中人被隔离审查,相互不知道对方的决策。那到底会出现什么结果呢?答案是(坦白,坦白),即两人都会被判8年刑,这是最坏的结果。
    为什么会这样?对甲来说,他要怎么行动取决于乙怎么行动。如果乙坦白,甲的最佳策略是坦白,因为坦白被判8年,而抵赖要被判10年;如果乙抵赖,甲的最佳策略也是坦白,因为坦白可以被释放,而抵赖要被判2年。对乙来说,情况和甲是完全对称。因此,最后的结果就是两人都坦白,各被判8年刑。完全信息静态博弈的结果,就叫「纳什均衡」。

2.完全信息动态博弈
动态是指一方的行动在先,另一方可以根据先做出决策者的行为来调整和决定自己的策略。
在《三国演义》的第三十三回,「曹丕乘乱纳甄氏 郭嘉遗计定辽东」中,官渡之战后,袁绍的两个儿子袁熙和袁尚在河北战败,于是逃往辽东。曹操对其穷追不舍。辽东太守公孙康问手下该怎么办,有人说:我们要先观察一下,如果曹操追过来了,我们就先同袁氏兄弟联合,把曹操打跑,然后再收拾袁氏兄弟;如果曹操没有追过来,说明曹操无意侵占我们的地盘,我们就可以先解决掉袁氏兄弟。
这是一个完全信息博弈,因为博弈的各方都知道对方的策略和影响。这也是一个动态博弈,因为曹操的行为在先,而公孙康的行为在后。此时曹操的抉择就显得非常关键了。而曹操的四大谋士之一郭嘉为曹操出了一个策略:不要忙着追袁氏兄弟,袁氏和公孙康必会相互残杀,我们坐收渔利即可。虽然这是小说,但其中郭嘉这个人物深谙博弈之道!

3.不完全信息静态博弈
所谓不完全信息,是指博弈的各方都有一些信息是自己知道而别人不知道的。在这样的情况下,就要根据概率行事。
例如,一个女孩遇到一个男孩向她求爱,但她不知道对方是不是好人。假如女孩答应且男孩是个好人,双方的获得都是100(无单位);如果对方不是好人,则女孩获得-100,男孩获得100。假如女孩不答应,双方的获得都是0。
女孩不知道男孩是不是好人,那她应不应该答应呢?这类问题是约翰·海萨(John Harsanyi)的主要工作,他假设博弈各方虽然不知道对方是好人还是坏人,但是知道对方是好人和坏人的概率。这时,就需要计算不同选择下的数学期望,即不同情况出现的概率和其获得的乘积之和。
如果女孩知道男孩是好人的概率为x,那是坏人的概率即为1-x,女孩答应男孩求爱的数学期望为:x * 100 + (1-x)*(-100)=200x – 100而女孩如果不答应,数学期望为零。
我们可以比较(200x - 100)和零的大小,如果前者大于零,则女孩应该答应;若小于零,则不应答应。通过计算,当男孩是一个好人的概率为50%或以上时,理论上女孩就可以答应。但关键是这个概率又是怎么知道的呢?这就是靠女孩的直觉和经验啦。

4.不完全信息动态博弈
最后一种博弈是指信息是不完全的,各方都有一些信息其他人不知道,且各方的行动有先后。
比如在面对诸葛亮的空城计时,司马懿再三衡量后选择了退兵,就是一个典型的不完全信息动态博弈。


博弈论

下面是我对现实中博弈情况的一点思考:
第一,与人相处时,人与人之间的博弈。我们会遇到两种人,一种是特别熟悉的,比如自己的爱人,亲人。你很熟悉对方的处事模式,所以当遇到选择时,你们彼此都是知道对方的选择。这就更倾向于完全信息的博弈。另一种是和陌生人的,比如买家和卖家。彼此交际浅,不清楚对方的处事风格和水平,这就更倾向于不完全信息博弈。而静态和动态的层面就看彼此之间是否针对某件事有进一步的互动,有的话就是动态博弈,没有的话就是静态博弈。
第二,做事时,事件与事件之间的博弈。可以从时间纬度来看。一种是短期的变化我们是可以相对看清楚一些的。比如自己每天的任务安排,在自己的某个时间做了这件事就做不了那件事。这是可以看清楚些的,可以倾向于是完全信息的博弈。另一种是长期些的事件和目标。因为不可掌握的因素太多,可以看成非完全信息博弈。其动态和静态就在于事件彼此之间的进一步的影响程度,影响小的可以看成静态,影响大的可以看成动态。

这些理论是对情况的分类和总结,但真正博弈的智慧在于如何做出正确的决策,从而获得个人或集体利益的最大化。这里面最关键的就是尽可能了解情况,并有相关专业的知识来分析清楚。比拼的是搜集信息和分析判断的能力。个人理解上,就是尽可能把非完全信息转化到完全信息上,增强对局势和人的认知与掌控力,能识人并会办事。个人能做的就是要多认识人、多做事,有针对性地多学习分析与总结。

推荐阅读更多精彩内容