AlphaGo真的战胜人类了吗？

今天，引人注目的人机大战终于以4:1的悬殊比分，宣告了AlphaGo赢得了比赛，看起来计算机相当的强大，就围棋这个领域来讲，已经完全战胜了人类，那么我们不禁要问，计算机战胜人类的原理是什么？他们真的具备跟人类匹敌的智商吗？

大概在10多年前，我曾经写过一个中国象棋的AI项目，当时并没有利用分布式计算（那时也不懂），只是一个单机程序，大概能有6-7步的预测能力，经过不客观测试，能战胜我能接触到的所有象棋爱好者。当时人机博弈理论的基础就是Alpha-Beta搜索：

Alpha-Beta搜索实际上是从最简单的BFS搜索和之后的A*搜索发展来的，BFS其实就是最简单的穷举，每层都把所有的可能列出来，最后给一个结论，而A*搜索在这个基础上，多了一个选择函数，即在每层遍历时，给一个优先级，优先从看起来局部最优的方向入手遍历，比如我们在地图上设计寻路的机器人，可以设定NPC周围所有8个节点方向上，最指向最终目的地的方向的节点是看起来最优的，然后从这个节点优先遍历。

Alpha-Beta搜索，实际也借鉴了A*的思想，即每次都从局部看起来最优的结果给出下一步的判断。首先，我来解释一下什么是局部最优：

因为以目前计算机（尤其指单机）的计算能力，是无法遍历棋盘所有可能的，以围棋为例，19*19的棋盘上，一共有361个点，也就是执黑先行者有361个选择，之后执白有360个选择，于是361*360*359....，这是一个比天文数字还大的数字，所以我们根本不可能通过计算得到全局最优。

判断棋局的优劣

那么，我们怎么评价某一种走法看起来最优呢？这就需要根据不同的棋，设定规则了，以中国象棋为例：

某个残局

规则1，我们规定，自己一方所有子能走的区域越大则越优，说俗点，别把自己给“闷死”了，比如马走到边上。于是给定一个棋盘，我们可以计算：

V1= 马可走的区域+车可走的区域+兵可走的区域+帅可走的区域+....

V越大，则越优秀

但是，下过象棋的人都会觉得，规则1也太简单了吧，完全没考虑到车和兵在棋盘上的重要度完全不一样，不能按照一个权值系数算，另外，规则1完全没考虑到对对手的威胁性，于是，我们进行改进：

V2=系数A * (系数1*马可走的区域+系数2*车可走的区域+系数3*兵可走的区域...) + 系数B * （自己的马有可能吃掉对方的子的重要度+自己的车有可能吃掉对方的子的重要度+自己的兵可以吃掉对方的子的重要度...）

大家能明显的看到，V2比V1合理多了，不仅仅考虑到了自己的字别被“闷死”，还考虑到了对对方的威胁，那么这个公式还能不能改进呢？还能！我们知道，对对方的威胁，对帅的威胁是最高的，对车的威胁完全高于对兵的威胁，说俗一点，就是能吃掉对方的帅，绝不吃掉对方的车，能吃掉对方的车，绝不吃掉对方的兵。

于是，这个公式就V3就更复杂了，系数也越来越多，这里我们得出一个结论：

我们一定一个得到一个公式，它较公平的判断一个棋局，对某一方的优劣是什么，且这个优劣还是可以量化的！当然，对于围棋而言，这个公式更麻烦一些。

但这里我们忽略了一个问题：即最终的公式有N多的系数，我们需要一种办法来确定最优的系数组合。

Alpha-Beta搜索

当双方博弈时，当下一步该自己走时，只需要遍历所有的下一步可能，然后选择一个棋局对自己最优的方案即可，这个非常简单，但是，这仅仅代表计算机有预测一步的能力，按照这个逻辑设计出来的程序可能连小孩都打不过，要想战胜人，需要有提前预判N步的能力。那么怎么预测两步呢？

我们可以遍历所有的下一步的下一步的可能，因为下一步的下一步是对手下，所以我们只需要从所有可能中选择让对手最难受的一种可能即可。于是，按照这个思路，我们就产生了两个约束条件：

A：对自己最有利

B：让对手最难受

如果我们在搜索过程中，不断的以这两个约束条件去进行搜索，这就是Alpha-Beta搜索。两个约束条件更符合博弈的本质，即对自己最有利且不断限制对方。Alpha-Beta算法本身也很简单，可自行Google。

看起来AI下棋的原理不难，但其实真正的奥秘就是如何减少搜索的计算量。

核心：减少计算量

从之前的描述，我们可以看出，计算机算的越快，赢的概率越大，那么怎么算的更快呢？更好的硬件+分布式并行是一种思路，当然从算法上能减少计算量则更好！减少计算量的办法至少有这么几种：

1，其实每步下棋时，没有必要棋盘上所有点都考虑，而是可以优先考虑某些点，比如离目前棋子比较近的点，这样就能减少相当一部分工作量。

2，录入相当多的棋谱，这样可以避免搜索一直到叶子节点，如果匹配到棋谱的话，可以从之前很多步就提前返回。

3，赋予计算机一种神奇的能力，让他能够有预感，预感到某一步可能“有戏”，这样把这一步放到Alpha-Beta搜索队列的前面，优先搜索，这样避免把计算资源浪费在其他“没戏”的下一步上。

而3，也是根据AlphaGo公开出的资料中，最高深的一点，即所谓的CNN，应用在蒙特卡罗搜索MCTS中，从而把有限的计算能力计算值得计算的子节点。这一点在围棋中尤为重要（更尤其在初盘中盘，因为末盘的搜索量会急剧减少），能做好这一点才是让围棋AI能够战胜人类高手的关键。

那么按照公开资料，AlphaGo是根据CNN卷积神经网络来训练AI的，输入就是19*19的棋盘信息，输出就是一个value，量化的代表对谁有利，通过输入成千上万的高手棋谱，经过反复的自学习，确定神经网络的参数，最终可以实现给定任何一个棋局，判断其是否对自己有利，这样就可以在每次Alpha-Beta搜索计算前，把待搜索的布局排序，优先搜索那些对自己有利的布局，从而大大缩小计算量。

3层神经元网络

神经元网络大多都依赖梯度下降，即误差反传BP，举个通俗的例子，一个盲人登山，要寻找山的最高点，他所能做的，就是不断的往前或者往后迈，不断收集前后两步的高度差值，如果高度差很大，就反馈给大脑加大步伐，如果高度差越来越小，就反馈给大脑减小步伐，最终直到前后两步的高度差一样了，也就找到最高点了（其实是局部最高点）。这个比较好理解，但是为什么卷积的神经网络适合围棋这个场景，这里面是数学理论的推导依据还是先有模型不断经验测试的结果，只能靠进一步研读Google的资料来寻找答案了。

机器战胜人类了吗？

从上面的浅显分析可以看出，即使AlphaGo将来可以战胜柯洁大棋渣，其整个运算过程其实跟围棋艺术本身没任何关系，包括是最神秘的那个CNN里面的层级、参数关系，也很难说明他们跟人类的思考模式有相似的关系。我总感觉，这种AI只不过是用计算机的逻辑在某一个“固定的、可言传的”规则上计算能力超过了人类。

但我们现实生活中，“不固定的、不可言传”的事务比比皆是，怎么谈生意、怎么忽悠投资人、怎么跟领导汇报、怎么泡妞。。。这些都无法用固定规则来描述，换句话说，即使给出再大的计算能力，也很难给出上面这些事的“棋局优劣函数”，同时也无法找出一个CNN网络来评估训练这些事，因为他们的输出根本就是不是离散的。

所以，我觉得目前的AlphaGo距离真正的人类智商还相差太远，等什么时候，计算机能够做到察言观色、洞察秋毫，能够像电影“机器姬”迷惑人类时，才能算是真正的人工智能！

最后编辑于：2017.12.03 03:10:15

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,015评论 4赞 362
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,262评论 1赞 292
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,727评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,986评论 0赞 205
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,363评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,610评论 1赞 219
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,871评论 2赞 312
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,582评论 0赞 198
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,297评论 1赞 242
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,551评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,053评论 1赞 260
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,385评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,035评论 3赞 236
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,079评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,841评论 0赞 195
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,648评论 2赞 274
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,550评论 2赞 270

AlphaGo真的战胜人类了吗？

判断棋局的优劣

Alpha-Beta搜索

核心：减少计算量

机器战胜人类了吗？

推荐阅读更多精彩内容