博弈论思维

什么是博弈论

博弈论(Game Theory)是 研究具有斗争或竞争性质现象的数学理论和方法,二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的[1]

博弈论的发展

1928年,著名科学家、计算机之父冯·诺依曼证明了博弈论定理。

1950年,普林斯顿数学系教授约翰·纳什,通过不动点原理证明了均衡点的存在,并且提出了著名的纳什均衡理论,将博弈论引入到了除数学以外的其它领域内。

约翰·纳什

1994年,约翰·纳什与约翰·海萨尼、莱茵哈德·泽尔滕,处于表彰他们对博弈论做出的贡献,授予三位当年的诺贝尔经济学奖,从此博弈论被推上了学术界高峰地位。2001年一部以约翰·纳什为传记改编的电影《美丽心灵》,诠释了纳什的传奇人生。

2001年,乔治·阿科尔洛夫、斯宾塞和约瑟夫·斯蒂格利茨,利用博弈论分析了市场的信息不对称问题,为现代信息经济学奠定了基础。

2005年,托马斯·克罗姆比·谢林和罗伯特·约翰·奥曼通过博弈论分析了冲突和合作的理解。

2007年,罗杰·迈尔森和埃里克·马斯金、里奥尼德·赫维茨,通过博弈论的研究推动了机制设计理论的发展。

2012年,罗斯与沙普利根据博弈论创建了稳定分配理论。

2014年,梯若尔在产业组织理论以及串谋问题上,采用了博弈论的思想,让理论和问题得以解决,并且在规制理论上也有创新。

纳什均衡理论
纳什均衡

纳什均衡是指在一组组合策略之中,对于每个参与者来说,只要其他人不改变自己的策略,那么他就无法改善自己的状况。简单来说在一种稳定的状态下任何人单独改变策略都得不到好处。

举个例子:我和我的朋友去酒吧去找对象,对面吧台前面有许多美女,一群是金色头发(blonde),还有一群是褐色头发(brunette),此时如果我们要上前搭讪,那么会有这么几种可能性:

①如果我和我的朋友同时找所有的金发女郎搭讪,那么我们找到合适对象的机会是0,因为我们无法深入了解所有人。(0,0)

②如果我的朋友去找所有的金发女郎搭讪,而我去找一位褐发女郎搭讪,那么我成功的概率远大于我的朋友,因为我可以通过足够深入的聊天去了解彼此。(2,5)

③如果我的朋友去找一位褐发女郎搭讪,而我去找所有的金发女郎搭讪,相同的道理我朋友成功的概率会远高于我。(5,2)

④如果我和我的朋友都分别去找一位褐发女郎搭讪,那么我们成功的概率相差无几。(2,2)

在这组找对象的策略组合中,第四种策略即属于纳什均衡策略。也就是说双方可以达到共赢的状态,任何一方变动策略都会是的局面失去平衡。

博弈论工具

(1)博弈树

博弈树

博弈树:又称扩展式博弈模型,由节点、主干、枝干构成的策略组合模型。

如图所示:节点:①、②;主干:U、D;枝干:U‘、D‘

起点①为初始决策点,竞争者:“我”

主干U为“进入”决策的条件:“找所有的金发女郎搭讪”

主干D为“不进入”决策的条件:“找一位褐发女郎搭讪”决策

中间决策点②,竞争者:“我的朋友”

枝干有两个策略:一个是“去找所有金发女郎”,另一个是“去找一位褐发女郎“

决策终止点:决策结果分别为(0,0)和(2,5)

图片发自简书App


(2)博弈表

博弈表
博弈表顾名思义,是以表格的形式进行策略组合分析博弈的模型,又称支付矩阵。上述纳什均衡策略便是博弈表中的一种策略。


博弈论经典案例

(1)囚徒困境

囚徒困境

话说甲乙两名囚犯因抢劫罪被捕入狱,警察需要录口供判定二者的罪行:

如果甲乙都招供罪行,那么各判2年;

如果囚犯乙招供所有罪行都是甲做的,甲保持沉默,那么甲判刑10年,乙当庭释放;

如果囚犯乙保持沉默,甲招供所有罪行都是乙做的,那么甲当庭释放,乙判10年;

如果两个人都保持沉默,什么都不肯说,那么警察找不到确切证据判刑,只能各判半年。

1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·帕克以囚徒方式阐述,并命名为“囚徒困境”[2]。该博弈案例反应的是个人的最优策略并非是集体的最优策略,从案例中可以推出,从最优的策略角度来看,二者都保持沉默不招供,各自只会判半年,然而从人的本性选择来看,却都倾向于招供罪行,因为每个人都怕自己万一保持沉默,对方把罪行全推到自己头上,判10年的罪行。这是人性的弱点所导致的非理性博弈。

(2)智猪博弈

智猪博弈

猪圈里有一只大猪和一只小猪,猪圈一边放着一个由绳索钩挂的猪槽,另一边是连接伸缩的踏板,如果它们想吃到食物必须踩一下这一边的踏板,另一边会有10份食物从猪槽里掉下来。无论谁踩踏板,都会消耗2份食物的能量,下面有这几种情况:

两只猪一起踩踏板,大猪比小猪吃得快,大猪吃了8份,小猪才吃了2份。(6,0)

大猪踩踏板,小猪守在槽边,由于小猪没有出力,只能吃4份食物,大猪可以吃6份。(6,6)

小猪踩踏板,大猪守在槽边,大猪吃得比小猪快,小猪跑过来时,10份全被大猪吃完了。(10,-2)

两只猪都不踩踏板,全部没食物吃。(0,0)

在企业中,大企业就好比大猪,中小企业就好比是小猪。控制按钮可以比作技术创新,可以给企业带来收益。大企业资金雄厚,生产力大,有更多的能力进行技术创新,推出新产品后可以迅速占领市场获得高额利润。而小企业的最优选择就是等待,等大企业技术创新后,跟在大企业后,抢占市场份额,从这种创新中获得利益[3]

博弈论类型

(1)零和博弈:表示所有博弈方的利益之和为零或一个常数,即一方有所得,其他方必有所失[4]。生活中的俗语:“不是你死就是我亡”、“非黑即白”。

(2)非零和博弈:是与零和博弈相对的概念,一方有所得,另一方也可能有所得,最终是一个双赢或者双输的局面。生活中的俗语:“合作共赢”、“同归于尽”。

参考文献:

[1]360百科:博弈论

[2]Wikpadia:囚徒困境

[3]MBA智库:智猪博弈

[4]Wikpadia:零和博弈

本文首发于微信公众号“认知与新思维”。

推荐阅读更多精彩内容

  • 最近看了李易峰主演的《动物世界》,节奏紧张,充满悬念和反转,然而更打动我的是影片主题,人性在残酷世界中的冰冷博弈,...
    云舒梦Shirley阅读 380评论 0 7
  • 实例一、坐公交案例公交路线是这样的,636路公交,A地(始发站)到B地(终点站),我处于始发站的第五站C站,C地呢...
    Mystyle007阅读 120评论 0 0
  • 我觉得有意思的一个点:很多博弈有效的前提是需要参与者都是理性人。因为非理性人不可预测。 比如海盗分金、枪手博弈、冷...
    426柚子阅读 1,898评论 1 1
  • 为什么麦当劳和肯德基都挤在一起开店呢?我们来看一组数据 成都市0-250米竞品门店数量占比达到了恐怖的75%,几乎...
    模型思维阅读 2,073评论 0 17
  • 这题最复杂的地方是正负号问题。算法是Bit shifting.
    98Future阅读 80评论 0 0