博弈论(一)

前段时间在得到上学习了万老师的《博弈论》,现就对博弈论的学习做一个复盘笔记吧。

博弈论不同于“三十六计”,不是“诡计”而是理性人之间对都想要的东西一种争夺“战略”。

一.什么是理性人。

博弈论的一个前提条件是发生在理性人“身上”,那什么是理性人呢?

第一.你得知道你想要什么。

第二.你的行动是在一定的规则之下,争取得到你想要的东西。

第三.你知道对手也是这么想的,而且对手也知道这些规则。

二.博弈论的用处

博弈论可以让你看到社会很多长期存在的现象背后的原因,并告诉我们如何改变不好的局面。对于个人来说博弈论可以提醒我们时刻要理性。如果不理性那博弈论对于你来说不是白学了吗?更进一步你应该作为一个“player”,player在博弈论中叫参与者,博弈论其实本质都是game,博弈论的英文就叫Game Theory。因人不可能一直理性。

但是凡事有一点参与游戏的精神,你就有权在规则范围内采用对自己最有利的行动,你就是积极主动的,你就会平等对待对手——你就既不是一个浑浑噩噩整天根据别人设定做事的人,也不会有整个世界绕着自己转的幻觉。

三.博弈论三个基本概念

在了解了博弈论的前提后,我也有种博弈论不适用的感觉,但在学了后面我介绍的这三个概念后,你会对社会中很多现象有了更深层次的理解。

帕累托最优与纳什均衡

现实社会中你注意到没有,同一类商家总爱聚集在一起。一个十字路口总是有两家甚至好几家加油站。那为什么商家非得扎堆呢?这背后的原理就是因为帕累托最优的不稳定。

那什么是帕累托最优呢,我们举个例子说明,例如在一个海滩上卖冰激凌,如果只有你一家,你会把冰激凌摊摆在哪里?最聪明的做法是应该摆在海滩的中心位置。但如果是两家卖冰激凌的摊主,最理想的位置应该是把摊位分别摆在1/4与3/4的位置,这样大家买冰激凌的影响区域都是相同的,各影响海滩的一半区域。但是如果其中一家将位置向另一家靠近一点,其影响区域就会最大,他的利益就会更大。但是这个现象另一家会迟早发现的,另一家也会向中心靠近。最终结果是两家的冰激凌店都会扎推开到海滩的正中心。

前者说的就是帕累托最优,而后者说的就是纳什均衡。帕累托最优是不稳定的,而纳什均衡才是这个社会很多现象的体现。

理想青年喜欢帕累托最优,但是博弈论告诉我们只有稳定的局面才能长久存在。

压倒性策略

再举一个博弈论中最著名的例子囚徒困境。


两个同伙同时被被警察逮捕,警察给提出条件如上表,如果囚徒1招供且囚徒2同时招供,他们分别将获得3年的有期徒刑,如果囚徒1招供而囚徒2不招供,则囚徒1将无罪释放,而囚徒2将获得5年的有期徒刑,反之亦然,如果囚徒1与囚徒2都不招供,他两分别将获得1年的有期徒刑。其中帕累托最优是两人都不招供,但往往现实将会是两人都招供的纳什均衡。而不管囚徒2招不招供,囚徒最好的策略都是招供。这就是所谓的“压倒性策略”。这个策略压倒其他一切策略,不管对手这么做,这个策略对你来说都是最好的。

推荐阅读更多精彩内容