[王德新收藏]:人工智能革命——通往超级智能之路

(1)

[美]蒂姆•厄本 作 黄菁 编译

本帖之所以耗时三周才完成译文,是因为在我钻研人工智能相关研究时,我所读到的东西令我震惊。我很快意识到,人工智能领域正在发生的一切,不仅是当下的重要课题,而且是迄今为止,关乎人类未来的,最为重要的课题。因此,我想尽我所能地去更多了解人工智能,而在这之后,我又希望能写一篇帖子,清楚解释人工智能发展的总体形势,以及了解这一形势的重要意义。——作者

我们正面临的这一场变革,其意义丝毫不亚于当年人类在地球上崛起。

——弗诺•文奇(Vernor Vinge)

站在此处感受如何?

是不是很刺激?但是别忘了,站在时间轴上的时候,你无法看到你右侧发生的一切。所以下图才是你站在此处的实际感受:

无甚特别之处。

遥远的未来——近在眼前

想象一下乘坐时光机器回到1750年——没有电,通过大声叫喊或是朝空中发射炮弹来完成远程通信,运输都靠畜力拉动。在那儿,我们找一位老兄,把他带到2015年,领着他四处走走,看看他对周围事物的反应。当他看到闪亮的小盒子在高速公路上飞驰,当他跟今天早些时候已经去往大洋彼岸的人通话,当他观看正在1000英里外举行的体育赛事,当他欣赏一场50年前的音乐会,当他用我的魔力方盒拍照或录像,当他生成一张有一个不寻常、会移动的蓝点来表示他所在位置的地图,当即使人们远在国家的其他地方,他也能看着他们的脸来聊天,当他体验其他难以置信的魔法时,我们是很难理解他的内心感受的。这时我们尚未向他展示互联网,或解释诸如国际空间站、大型强子对撞机、核武器或是广义相对论等问题。

他的感受应当不会是惊讶、震撼,抑或心潮澎湃——这些词还欠缺力道。他可能会直接懵掉。

但有趣的是:当这位老兄再度回到1750年,嫉妒我们看他被整懵的这种行为,并决定也要尝试一把,他乘坐时光机,回返相同的路程,去把一个1500年前后的人,带到1750年,向他展示一切。这位来自1500年的兄弟可能对眼前的许多事物感到震惊——但绝对不会懵掉。他的体验远远称不上疯狂。这是因为,尽管1750年与1500年非常不同,但这种不同,却远远小于1750年与2015年之间的差异。1500年的兄弟会了解到一些高深的空间和物理知识,会对原本君主国林立的欧洲走上帝国主义潮流印象深刻,会对自己的世界地图概念做出大幅修正,但是1750年的生活方式——交通、交流方式,等等——绝对不会让他懵掉。

因此,如果1750老兄想要达到目的,他得回到更为久远的时代——也许应径直回到公元前12000年。早在农业革命促使第一批城市及“文明”这一概念出现以前。一个来自狩猎采集社会的人——来自一个,人类或多或少只能称为一个物种的时代——看着1750年人类帝国高耸的教堂、远洋的舰船、体验他们“在里面”的概念,他们庞大的集体,累积起来的人类知识与发现——他很可能会懵掉。

接着,在懵掉之后,他感到嫉妒,并决定也要尝试一把,如果他回溯12000年,来到公元前24000年,带一个人来到他的时代,向这个人展示一切,这个人很可能会说:“好吧,到底要整点儿啥。”公元前12000年的兄弟如果想把一个古人整懵,他至少要回溯100000年,从那儿带回一个人来,教他第一次领略火和语言。

为确保一个人被传送到未来后,被那时的发展程度吓懵,他们必须跨越至已达到“能把人吓懵的发展程度”的年份,换句话说,跨越一个“吓懵单位(Die Progress Unit)”。在狩猎采集年代,一个吓懵单位意味着100000年,而在后农业革命时代,它仅仅意味着12000年。工业革命后,世界发展得如此迅猛,一个1750年代的人仅需200年,就能跨越下一个“吓懵单位”。

这种随着时间发展,人类进步也会越来越快的模式,正是未来学家雷蒙德•库茨魏尔(Ray Kurzweil)所称的加速回报定律(Law of Accelerating Returns)。这是因为更加先进的社会,较之此前不够先进的社会,拥有可以更快发展的能力——这也本就是“更加先进”的要旨。比之15世纪,人类在19世纪掌握更多知识与技术,因而毫无疑问,也取得了远超15世纪的进步——15世纪的人类与19世纪没法儿比。

该定律在小时间段上同样适用。电影《回到未来》拍摄于1985年,将“过去”设定在1955年。电影中,当迈克尔•J•福克斯(Michael J. Fox)回到1955年,电视的新颖、苏打水的便宜、刺耳的电吉他还没时兴、不一样的俚语,都令他不禁着迷。是的,世界如此不同——但如果是现在制作这部电影,而“过去”发生在1985年,电影情节会因为两个年代间的更大差异而变得更为有趣。角色会回到一个没有个人电脑、没有因特网或手机的年代——从今天穿越回1985年的90后少年马蒂•麦克弗莱(Marty McFly),会比电影中回到1955年的马蒂•麦克弗莱,显得更加与旧时代格格不入。

这同样是因为,加速回报定律在起作用。1985年至2015年间的平均发展速度,高于1955年至1985年间的发展速度——因为前者是更为先进的社会——因而后30年与前30年相比,社会发生了更多变化。

因此,人类正在取得越来越大、同时也越来越快的进步。这意味着我们的未来会发生一些非常有趣的事情,对吧?

库茨魏尔说,如果整个20世纪能有2000年的发展速度,那么百年成就只要20年就能取得——换言之,2000年的发展速度,是整个20世纪平均发展速度的5倍。他说,2000年至2014年间,我们已取得了等量于20世纪的增长,而取得下一个同样增长将是在2021年,仅过7年而已。库茨魏尔相信,20年之后,一年内即可多次实现整个20世纪的进步。而后,很可能不到一个月就能实现一次。根据加速回报定律,库茨魏尔坚信,21世纪将取得千倍于20世纪的进步。

如果库茨魏尔和他的支持者是对的, 2030年就会让我们懵掉,就像来到2015年的1975年老兄一样——也就是说,下一个“吓懵单位”也许只有20年——而2050年的世界,更将变得面目全非。

这不是科幻。这是比你我都更加聪明、知之更多的科学家们都坚信的事实——而且当我们回顾历史,这一预测是合乎逻辑的。

那么,你在听到我讲“35年后的世界将变得面目全非”时,为什么会说“听上去很酷,但是呢?”有三个原因,会让我们质疑对未来的古怪预测。

(一)我们用直线方式思考历史

当我们想象下30年发展的时候,我们会反观过去30年发展情况作为预测指标。当我们预想21世纪全球发展程度的时候,我们不过是将20世纪的发展作为参照,然后照搬到公元2000年之后而已。这就是我们那个公元1750年兄弟所犯的错误:他想让来自200年前的人感受到他去往200年后所感受到的同样震撼。以线性方式思考对我们来说最为直观,但是,指数方式才应当是我们思考问题的方法。如果有人能更聪明些,他们有可能就不会通过回望过去30年来预测未来30年的发展,而是以当前发展情况作为参照与基准。这样做会精确得多,但仍然会差之甚远。想要准确地预测未来,你需要想象未来事物的发展速度远胜当下。

(二)最近一段时期的轨迹往往会对事实有所扭曲

首先,即使是陡峭的指数曲线,当你仅仅截取一小段进行观察时,都会近似一条直线。正如你近距离审视一个巨大圆环的一小段时,感到它像一条直线一样。其次,指数曲线的增长并不总是平滑、均衡的,库茨魏尔称之为“S-曲线”增长。

当席卷全球的新理论带动了进步的浪潮,S-曲线就出现了。该曲线有三个发展阶段:

1.缓慢增长阶段(指数增长初级阶段)

2.急速增长阶段(指数后期、爆炸性增长阶段)

3.趋平阶段(当新理论趋于成熟时出现)

如果你仅仅盯着最近一段时期,那么你处于S-曲线上的位置,会影响你对事物实际发展速度的判断。1995年至2008年,互联网爆炸式发展,微软、谷歌、脸书进入公众视野,社交网络诞生,手机、而后是智能手机出现。那正是S-曲线的第二增长阶段:井喷式增长阶段。但2008年-2015年间,发展平缓了下来,至少在技术前沿是这样。一些未来思考者可能会以过去几年的发展速度,来估计当前的发展速度,这样做,恰恰漏掉了更大的图景。事实上,一个新的、巨大的井喷式的发展(S-曲线第二阶段),也许正在孕育当中。

(三)以我们的经验看待未来,未免过于古板

我们在个人经验之上形成了世界观,最近以来的发展速度,正是“事情发生的方式”,这一观念在脑中早已根深蒂固。同时,想象力也会限制我们,让我们通过经验来预测未来。但是很多时候,我们已知的一切,无法协助我们正确地思考未来。如果我们所听到的预测背离了我们“事物如何运作”的经验,我们会本能地认为这个预测并不靠谱。如果我在本帖的后面告诉你,你也许可以活到150岁、或250岁,甚至可能长生不老,你一定会本能地认为:“愚蠢!——如果我只从过去学到了一件事,那么这件事就是:人都会死。”是的,过去无人能逃避死亡,但是在飞机发明以前,也没有人乘坐过飞机呀。

所以当你读着本帖,持否定态度并自我感觉良好的时候,很可能你已经错了。事实上,如果我们正依靠逻辑思维和历史形态预测未来,我们就应该能推断出:未来十年将要发生的变化,将远远超出我们今日的预期。逻辑思维同样启示我们,如果某星球上最高级的物种始终在不断加速地跨越式发展着,终有一日,他们将完成一个重大的跨越,从此彻底改变他们的生活,并使他们咂摸到身而为人的滋味——这有点儿类似于地球上的情况,生命一步一步向智慧生物演进,最终完成了重大的跨越,人类出现,所有物种的生存状态为之大变。如果你肯花点时间读一读科技资讯,你就会发现,已经有很多信号在默默暗示,我们已知的生活方式根本无法抵御来自下一个跨越的冲击。

何谓人工智能(AI)?

如果你像我一样,过去总把人工智能当成一个荒唐的科幻概念,最近却常听到严肃人士提起它,而你又不大弄得明白。

有三个原因令很多人对“人工智能”一词感到困惑:

(一)我们把人工智能和电影联系在一起

《星球大战》《终极者》《2001:太空漫游》,甚至动画片《杰森一家》,都是科幻片,里面的机器人角色也都是虚构出来的。这让人工智能听起来有点像是虚构的。

(二)人工智能是个很宽泛的概念

从手机上的计算器到无人驾驶汽车,再到未来有可能显著改变生活的某样东西,人工智能与所有这一切息息相关,这也令人困惑。

(三)我们每天都在使用人工智能,却往往没有发觉

约翰•麦卡锡(John McCarthy)于1956年创造了人工智能(Artificial Intelligence)一词,他曾抱怨道:“一旦人工智能实现,人们就不再叫它人工智能。”正因如此,人工智能一词听上去更像是对未来的神秘预测而非现实存在,也像是一个来自过去的流行概念,永远也不会成为现实。雷蒙德•库茨魏尔说,他听到有些人讲,人工智能在20世纪80年代已经消亡,如同“坚持说因特网在.com爆炸的21世纪初年完结了”一样。

所以,让我们来搞搞清楚。首先,别老想着机器人了。机器人只是人工智能的容器。机器人有时模仿人类形式,有时则不模仿——但人工智能本身是安装在机器人内部的电脑。人工智能是大脑,机器人是身体——如果人工智能有身体的话。比方说,Siri背后的软件和数据属于人工智能,我们听到的女性声音是人工智能做出的拟人化表现,但是Siri并没有机器人的身体。

其次,你可能已经听说过“奇点”或“技术奇点”的术语,在数学领域,类似于渐近线情况、不满足整体性质的点可被称为奇点。在物理学领域,奇点被用于描述类似无限小的高密度黑洞,或是宇宙大爆炸的起点。同样,这个点是不满足整体性质的。1993年,弗诺•文奇(Vernor Vinge)写了一篇很著名的文章,将科技智能胜过人类智能的时刻称为奇点——他认为在那之后,我们已知的生活将永远改变,而通常的规律则不再适用。雷蒙德•库茨魏尔后来更将加速回报定律的作用发挥到极限、科技进步速度趋近极限的时刻称为奇点,并说在那之后,我们的生活将发生翻天覆地的变化。我发现很多人工智能人士已经不再使用这一术语,而该术语用起来多少有些令人困惑,所以本帖中也用之不多。(即使本文始终聚焦在奇点这一概念上)

最后,人工智能是个广义概念,种类和形式也很多,可以通过判定人工智能的“口径”级别对其进行归类。以下是人工智能三种主要的口径级别:

一级口径人工智能:窄域人工智能(Artificial Narrow Intelligence (ANI))。有时也称为弱人工智能。窄域人工智能是专注于某一领域的人工智能。有的人工智能可以打败国际象棋冠军,但是除此之外,它什么也干不来。想让它找出在硬盘上存储数据的更好办法,它就只能木然地看着你了。

二级口径人工智能:宽域(或可译为“通用”)人工智能(Artificial General Intelligence (AGI))。有时也称为强人工智能,或人类级人工智能。宽域人工智能是指在各方面都和人类一样聪明的计算机,可以从事任何人类级的智力工作。创造宽域人工智能的难度远胜窄域人工智能,迄今尚未实现。琳达•戈特弗雷德逊(Linda Gottfredson)教授将智能定义为一种“非常全面的人脑能力,除了别的之外,还包括推理、计划、解决问题、抽象、理解复杂观念、快速学习和从经验中学习等能力”。宽域人工智能做起这些事情来,和你一样简单。

三级口径人工智能:超级人工智能(Artificial Superintelligence (ASI))。牛津大学哲学家、思考人工智能的领军人物尼克•博斯特罗姆将超级人工智能定义为“在几乎任何领域都远超人类最聪明大脑的智能,包括科学创造力、整体智慧和社交能力”。一个计算机在各个方面,不管是只比人类聪明一点、还是比人类聪明上数万亿倍,都叫超级人工智能。正是因为超级人工智能,人工智能话题才成为了“当红炸子鸡”,“永生”和“灭绝”两词才一同、并且多次出现在这些话题帖当中。

现在,人类已经通过很多方式攻克了最低级别口径的人工智能——窄域人工智能——并使它无处不在。人工智能革命之路,起步于窄域人工智能阶段,将通过宽域人工智能阶段,最终达到超级人工智能阶段。这条路,无论人类能否存活下来,它终将改变一切。

现在让我们更近一步,看看思考人工智能的领军人物们是怎样看待这场革命的,以及为什么这场革命会发生的比你想象中要早吧。

为现在定位——运行在窄域人工智能上的世界

窄域人工智能(ANI)是在某单一领域相等或胜过人类智力或效率的机器智能。举些例子:

轿车上满是ANI系统,从确定防抱死制动装置启动时机的计算机,到调节燃油喷射系统参数的计算机,都属ANI。谷歌正在测试阶段的无人驾驶汽车,将搭载强健的ANI系统,能够感知周围世界并对其做出反应。

手机是一个小型ANI工厂。当你使用地图应用进行导航、从潘朵拉电台接收定制的音乐推荐、查看明日天气、和Siri交谈、或从事许多其他的日常活动时,你在使用窄域人工智能。

垃圾邮件过滤器是一种典型的ANI类型。首先,一个知道如何区分垃圾邮件和正常邮件的机器智能被装载上来;接着,该智能根据你的特殊喜好不断积累经验,通过不断学习,把自己修改得更加像你。当巢牌(Nest)恒温器试图开始弄清你的生活习惯并相应作出反应时,它所做的也正是同样一件事情。

当你在亚马逊上搜索商品,而后,在另一个网站上,你看到了一种“为您推荐”商品;还有,脸书居然知道谁该是你加朋友的对象,这种事毛骨悚然吧?那是一个窄域人工智能系统网络,它们在一起工作,互相告知你是谁、你喜欢什么,然后利用这些信息,来决定为你展示什么。亚马逊“买这件商品的人同时还买了……”等推荐也是同样原理——使用ANI系统获取数百万计顾客的行为信息,在经过综合分析后,对你进行追加促销,促使你买更多的东西。

谷歌翻译是另一种经典的ANI系统——在一个窄领域里做得相当出色。语音识别系统是另一种,大量应用程序调用着两个翻译人工智能,令它们像双打队员那样密切协作,在你用某种语言说出一句话的同时,系统可以通过一个麦克风,把这句话用另一种语言翻译出来。

当你的飞机着陆后,不是由人来决定你该走哪个舱门,正像不是由人来决定你机票的价格一样。

当今世界上最棒的西洋棋、国际象棋、拼字游戏、西洋双陆棋、黑白棋的棋手,全是窄域人工智能系统。

谷歌搜索是一个庞大的ANI大脑,它通过超级复杂的算法,特别针对你来制作搜索页排名,展示搜索结果。脸书的新闻推送也是如此。

以上还只是在消费领域。复杂的窄域人工智能系统已经广泛应用于诸多部门与工厂之中:例如军事、制造、金融等领域(美国市场超过二分之一的交易额都是由具备高效算法的人工智能交易员完成的。以及一些专业性很强的系统之中,比如医生辅助诊断系统,其中,最著名的要数IBM的沃森(Watson),它存储了大量事实,懂得腼腆的特里贝克式语言,轻松打败了《危险边缘》节目最厉害的冠军们。

现在的窄域人工智能系统还并不怎么吓人。最糟糕,也不过是因为小故障或编程不善,破坏一座发电站、造成核电站失能、或是引发金融市场灾难(曾有一个ANI程序对突发事件作出了错误反应,造成了股票市场的短暂下滑,1万亿市值随之蒸发,造成了著名的2010年“崩盘暴跌”。事后,仅有部分损失得到了挽救。)

但是,尽管ANI还不足以构成人类的存亡威胁,我们还是要意识到,ANI,这个暂时无害的、正在不断变得庞大和复杂的生态系统,是一场即将席卷世界之风暴的先导。每一点ANI的创新,都是在为实现宽域人工智能以及超级人工智能铺路。或正如亚伦•萨耶恩兹(Aaron Saenz)所言:ANI系统就像是“地球早期原始软泥中的氨基酸”——这种构成生命的非生命原料,会在意想不到的一天,苏醒。

从窄域人工智能到宽域人工智能

为何如此之难?

创造出一台像人类一样聪明的计算机,具有不可思议的挑战性。明白了这一点,你将会十分佩服人类的智能。建造摩天大楼、将人类送往太空、说出宇宙大爆炸冷却的细节——所有这些,比起理解我们的大脑,或是做出像它一样酷的东西,实在容易太多。迄今为止,人类大脑是我们已知宇宙中最为复杂的事物。

有趣的是,建造宽域人工智能(AGI,一台在各个方面,而非只是某狭窄专业领域都和人类一样聪明的计算机)过程中的困难部分,并不像你直觉中认为的那样容易。让一台电脑瞬间完成两个十位数的相乘运算——难以置信的容易。让电脑看着一只狗,并问它这是猫还是狗——非常困难。让人工智能在国际象棋中赢了所有人类——已经实现。让它读六岁孩子绘本中的段落,不仅认出这些词语,还能理解意思——谷歌已经为之花了数十亿美元了。难的事情——例如运算、金融市场战略与翻译——对计算机而言非常简单。而容易的事情——例如视觉、手势、活动、直觉——对它而言则实在太难。或者正像计算机科学家唐纳德•克努斯(Donald Knuth)所说:“现如今,需要‘思考’的事,电脑基本上都能做,但是人类和动物不需‘思考’就能做到的事,电脑反而基本上做不到。”

那些对我们而言很容易的事情,实际上异常复杂,所谓的容易,其实是我们(以及大多数动物)在数千亿年的进化中不断实现优化的结果。想想这个,什么是难、什么是易也就好理解了。当你向上伸手够东西的时候,你肩部、肘部、腕部的肌肉、肌腱与骨骼和你的双眼互相协调,迅速完成了一长串物理动作,使你的手可以在三维空间中沿直线伸出。你的大脑中已经有了完美的软件,故而这件事做起来毫不费力。同样的,恶意软件辨别不出你在网站注册新用户时的验证码——人脑做这件事则超级给力。

换句话说,不管大数相乘或是下棋,都是生物的新活动,我们的这些能力还进化得不够纯熟,因而计算机赢掉我们并不困难。想想看,你愿意写哪个程序:是写一个大数相乘的程序,还是写一个能真正理解字母的程序?你给计算机一个B,不管是哪种不可预知的字体或手写体,它马上就能认出那是B?

来看一个有趣的例子:你和计算机都能识别出这是一个深浅色调方格交替出现的正方形边框。

到目前为止平局。但当我们揭开黑色图层,露出完整图像的时候……

你仍可以很容易就认出各种不透明和半透明的圆柱体、平板和3D拐角,但计算机,糟糕,它认不出来了。它只是看到了很多不同色调的二维形状——正如显示出的那样。你毫不费力就能理解出图像所要表现的三维深度、明暗变化和室内照明。

请看下图。计算机只能看到一幅二维的黑白灰三色拼贴画,而你很容易就能看出它到底是什么——一张黑色石头的三维照片。

摄影:马修•劳埃德(Matthew Lloyd)

刚才我们提到的还只是处理静止图像信息。想要成为人类级别的智能,计算机还需要理解很多事情,诸如区分微妙的面部表情:欣然、欣慰、满足、满意、高兴之间的不同,明白为什么《勇敢的心》是部很棒的电影,而《爱国者》则是部烂片儿。想想都难。

所以,到底该怎样实现呢?

实现宽域人工智能的第一个关键:提高电脑运算能力

想要实现宽域人工智能(AGI),必须实现的一件事是:计算机硬件运算能力的提升。如果一个人工智能系统想和人脑一样聪明,就必须达到人脑天然的计算能力才行。

衡量这种能力的办法之一是人脑每秒运算总量(the total calculations per second (cps))。把人脑中各个结构每秒运算量的最大值加合起来,就能够得到人脑每秒运算总量了。

雷蒙德•库茨魏尔在计算人脑每秒运算总量时找了一条捷径:采用某人对某大脑结构每秒运算量的专业估算值,以及该结构占整个大脑的重量比,两数相除,得出人脑每秒运算总量的估值。听起来有点不靠谱,但是库茨魏尔已经使用了大量的不同脑结构区域的专业估算值,而最终得出的结果都差不多——1016cps左右,或约每秒1亿亿次。

现在,世界上运算速度最快的巨型机,中国的天河二号,计算能力实际已经超过1亿亿次/秒,达到了3.4亿亿次/秒。然而,天河不过运算能力刚刚够格,却占地720平方米,耗电功率为2400万瓦特(人脑仅为20瓦特),建造费用为3.9亿美元。而且,并不能广泛应用,甚至绝大多数商业或工业领域目前也指望不上它。

库茨魏尔建议,我们可以用1000美元能买到多少cps来衡量计算机的发展水平。当1000美元能买到人脑级别的运算速度——1016cps时,就意味着AGI可能成为生活中非常现实的一部分了。

摩尔定律(Moore’s Law )已被历史证实,世界上最强的计算机运算能力大约每两年翻一倍。这意味着计算机硬件发展同人类发展一样,是以指数形式增长的。请看摩尔定律与库茨魏尔“1000美元能购买多少cps”衡量法之间的联系。我们现在花1000美元可以买到10万亿cps,与图中的预测轨迹正好相符:

所以,现在1000美元能买到的计算机,已经胜过了老鼠的大脑,并且达到了人脑千分之一的水平。这算不了什么,但是请你记得:1985年,这个比例是一万亿分之一;1995年已达十亿分之一;2005年,是一百万分之一。2015年达到一千分之一,按照这个速度发展下去,我们在2025年,就能买到运算能力相当于人脑的计算机了。

所以在硬件方面,中国已经使AGI原始计算能力在技术上具备了可行性,10年以内, AGI硬件产品将会变得价格低廉、应用广泛。但是仅具备原始计算能力,还不足以使计算机拥有综合性智能——下一个问题是:我们怎样把人类级别的智能赋予这种运算能力?

实现宽域人工智能的第二个关键:计算机智能化

这是麻烦的部分。事实上,还没有人真正搞懂该怎样使计算机智能化——我们仍然在争辩该怎样让计算机具备人类级别的智能,学会认出一只狗、写法怪异的B,以及什么样的电影算是烂片儿。但是,已经有了不少目前尚显牵强的解决策略,在某一时刻,它们中的一个将开始工作。以下是我碰到的三种最常见的策略:

(一)剽窃人脑

这就好比在科学家班级里,有个坐在他们旁边的孩子,聪明得每次都考得特别好,无论他们再怎么努力,也考不过他。最后他们决定:“我靠,以后他答啥我抄啥。”这办法不无道理——我们在制造一台超级复杂计算机的过程中遇到了困难,而与此同时,我们人人脑袋里都装着一台完美的样机。

科学界正在对人脑进行倒序仿制,好弄明白这种绝妙的东西是怎么在进化中产生的——据乐观估计,2030年前这项工作就能完成。一旦我们对人脑完成倒序仿制,我们就能知道大脑是怎样有力、有效工作的所有秘密,我们可以从中汲取灵感,并偷走它的创新。计算机结构学模拟大脑的一个例子是人工神经网络。首先搭建一个晶体管“神经元”网络,这些“神经元”通过输入、输出互相联结在一起,并且像一个婴儿大脑一样,什么都不懂得。它通过完成任务来“学习”,例如识别笔迹。一开始辨认每个字母时,它的神经活动和随后的猜测将是完全随机的。但是一旦当它得知自己认对了,得到正确答案的神经元联结通路就得到了增强;而当认错了时,那些错误通路的联结就会变弱。经过大量测试和反馈,这个“神经元”网络就会自己形成智能神经通路,而针对这项任务,机器的能力也就得到了优化。

大脑的学习过程和上述过程有些类似,但是更为复杂。随着我们继续研究大脑,我们还会找到巧妙利用神经回路的新方法。更极端的剽窃办法包含一种叫“全脑仿真”的策略。这一办法的目标是把人脑切成薄片,对每一片进行扫描,使用软件来重建一个精准的三维模型,然后用一台功能强大的计算机运行该模型,这样,我们就正儿八经有一台人脑能做啥、它也能做啥的计算机了——它只需要学习和收集信息就行。如果工程师们能对人脑做到高精准仿真,则当这个三维模型装载上计算机时,被仿真人脑的全部人格与记忆也将被完整还原。如果被仿真的大脑生前属于吉姆,这台计算机就将是苏醒的吉姆,一个强健的人类级别宽域人工智能,接下来我们可以做的,就是把吉姆变成聪明超乎想象的超级人工智能(ASI),吉姆自己大概会兴奋得不得了。

我们离全脑仿真还有多远?迄今为止,我们刚能仿真扁形虫1毫米长的大脑,仅含302个神经元。人类大脑的神经元数量是1万亿个。如果觉得这工程好像实现无望,就想想指数增长的威力——小小虫脑的仿真已经攻克,蚂蚁的不久就能实现,然后是老鼠,然后忽然,就会觉得人脑仿真不那么不切实际了。

(二)仿真进化

所以,如果我们感到那个聪明小孩的考卷儿太难抄,我们可以学学他准备考试的方法。

我们知道,建造一台和人脑一样强大的计算机是可能的——人脑的进化过程即是证明。如果人脑过于复杂、难于仿真,我们可以换一条路,试着仿真人脑进化过程。事实上,即使我们能够仿真人脑,也好比通过模仿鸟类扑翼运动来建造一架飞机——通常,完美的机器设计途径是创造性地面向机器,而非完全去模仿生物。

所以该怎样仿真进化过程,来构建宽域人工智能呢?这种被称为“遗传算法”的方法是这样的:加载一个不断重演的“表现—评估”程序(像生物一样,以个体生活来“表现”,以是否能够自我繁殖作为“评估”),使用一组计算机来完成赋予它们的任务,将表现最出色的两台计算机的程序各取一半进行融合,产生一台新的计算机。而表现不够好的计算机将被淘汰。经过足够多次反复之后,这一自然选择过程就会产生出越来越好的计算机。这个方法的难点在于创建一个自动的评价与繁殖循环,使计算机可以自行进化。

仿真进化的问题是,进化可能要花上10亿年左右的时间,而我们则希望它短短几十年就能完成。

但是与进化相比,我们有很多优势。首先,进化没有预见能力,是随机的——它产生的无用变异比有用变异要多,而我们可以操控仿真进化的过程,它会针对有益的缺陷做出针对性的调整。其次,进化是没有目标的,包括产生智能在内——有些环境甚至对更高智能是不利的(因为智能会消耗很多能量)。而我们则能将仿真进化过程,明确引导到不断产生更高智能的方向。再次,自然进化需要很多辅助手段促进智能的产生与发展——例如修改细胞产生能量的方式——而我们则可以利用电力,省掉额外的麻烦。毫无疑问,模拟进化的速度将远远高于自然进化,但是能快到什么程度,我们仍然不能肯定。而假如不够快,这一策略也就算不上可行。

(三)把这件事交给计算机,我们不管了

科学家无计可施之后,准备给试卷编程,好让它自行答题。这种方法或许是我们能用的最有希望的一种。

其理念是建造一台拥有研究人工智能和为自己修改代码两大技能的计算机——允许它不仅可以学习,还可以改进自身的体系结构。我们把计算机教成计算机科学家,好让它们可以引导自身发展。那就是它们主要的工作——整明白怎么样让自己更加聪明。这一点,我们稍后将详加说明。这一切很快就会发生。

硬件的快速发展与软件的创新实验也在同时进行。有两个原因,会让超级人工智能很快并出乎意料地悄悄来临:

(1)指数的增长是很激烈的——看似蜗牛一样的发展速度会猛然向上增长,密歇根湖的容量(单位:液盎司)与人脑容量差不多(单位:每秒运算量)。计算机运算能力每18个月翻一倍,以这个速度,你很长时间都难以看到进步——然后突然,事情搞定了。

(2)说到软件,发展看起来缓慢,但一次顿悟就能立马改变发展速度(这有点像科学的发展,当人类信奉地心说时,很难计算宇宙的运行,但后来随着日心说的发现,计算宇宙运行就简单了许多)。也许我们离制造一台能自我改进的计算机还很远,但我们与制造千倍于现在运算能力的计算机和实现人类级别的智能之间,也许只差一个微小的系统调整的距离。

从宽域人工智能到超级人工智能

在某一刻,我们实现了宽域人工智能(AGI)——电脑都具备了人类级别的智能。人类与计算机平等地生活在一起。哦,实际上并非如此。

原因在于,拥有与人类大脑同样级别智能和运算能力的AGI,与人类相比,仍具备明显的优势显著。比如:

硬件:

速度。人脑神经元的运算频率上限为200赫兹,而今天的微处理器(运算速度远低于AGI时代)运算速率为2G赫兹,是人脑神经元的1000万倍。人脑的内部通讯速率为120米/秒,与计算机光通讯的光速率完全无法相比。

尺寸与存储。人脑的大小受限于颅骨形状,再也无法增大,要不然,以120米/秒的内部通讯速率进行大脑结构区之间的通信,也显得有点远了。计算机则可扩展至任意大小,允许更多的硬件参与工作,它有着更大的工作记忆器(内存RAM)和长时记忆器(硬盘),与人脑相比,容量更大、精度更高。

可靠性与耐用性。计算机不但存储器更为精确,其晶体管也比生物神经元更为精密。它们不容易退化(即使坏了,也可以进行维修或替换)。人脑还很容易疲劳,而计算机,则可以一周七日、每日24小时以极佳性能不间断运行。

软件:

可编辑性、可升级性与更大范围可能性。与人脑不同,计算机软件可以接受更多升级与修改,在上面做实验也很容易。计算机的升级也可以扩展到人脑的弱势领域。人类的视觉系统相当先进,但是复杂的工程设计能力就很不怎么样。通过升级,计算机不但可以赶超人类的视觉系统,还可以在工程设计以及其他领域得到同样的优化。

集体能力。人类创造了非凡的集体智能,足以傲视其他所有物种。人类的集体智能,在语言的发展和大型密集群落形成的过程中萌芽,在文字与印刷的发明中提升,如今,通过像因特网这样的工具不断得到强化,它是我们能够远远领先于其他物种的主要原因之一。而计算机将比我们做得更好。一个安装有特定程序的全球人工智能网络能够定时自我同步,这样,网络中任意一台计算机学到的任何东西,都可以立即上传至其他所有计算机中。这个计算机网络还可以像一个单元那样处理同一个目标。因为计算机之间,不一定会有像在人类内部会出现的诸如异议、不同动机以及个人利益等问题。

人工智能,有可能通过编入自我改进的程序而实现宽域人工智能,但它不会将“人类级别智能”当作重要的里程碑——那只是我们的角度而已——人工智能没有任何理由在“人类级别”上停滞不前。只具备相当于人脑智能的AGI依然优于人脑,所以很明显,它只会在人脑级别智能上作短暂停留,随即向领先于人类智能的领域跑去。

这一切的发生很可能令我们震惊。因为从我们的角度看:A)虽然动物智能各不相同,但它们的主要特征是都远远低于人类智能。B)最聪明的人远比最愚笨的人聪明。有点像下图所示:

所以,当人工智能在智力上向我们急速逼近时,我们会以为,它不过是像动物那样变聪明罢了。后来,当它达到人类最低智力的时候——尼克•博斯特罗姆使用了“乡下白痴”一词来形容——我们的反应可能会是:“哇哦,它可有点傻。真可爱!”而我想说的是,人类智力从乡下白痴到爱因斯坦之间的巨大差异,其实只差在一个很小的区间里。所以人工智能刚达到乡下白痴智力、达到AGI水平不久,它的智力便会突然超过爱因斯坦,搞得我们晕头转向。

而在那之后,会发生什么?

智能爆炸

希望你享受了正常的时光。因为接下来,我们的话题将变得不正常和吓人,这种状态将一直保持到文末。现在我想停下来提醒你,我接下来要说的每一件事都是真的——来自一群最受尊敬的思想家和科学家对未来科学的真实预测。一定要记着。

但无论如何,正如我在上文所说,我们绝大多数实现AGI的现有模型都涉及到人工智能的自我改进。而一旦人工智能达到AGI水平,即使是那些不曾依靠自我改进方法构建与发展的计算机系统,也会聪明到开始启用自我改进程序——只要它们想。

在这里,我们引入一个强烈的概念——循环式自我改进。解释如下——处在某特定级别的人工智能系统——让我们假设是乡下白痴水平——加载了提升自我智能的程序,它改进一次,就聪明一点——也许这回到了爱因斯坦水平——因为具备了爱因斯坦级的智能,所以,当它再度提升自己的时候,就会更加容易,并且取得更大的飞跃。这些飞跃使它比任何人类都聪明得多,也使得它未来的飞跃一次比一次大。当飞跃越变越大、发生地越来越频繁,AGI的智能向上飙升,很快便会达到构成超级人工智能系统的超级智能水平。这就叫做智能爆炸。是加速回报定律的终极版本。

现在,关于人工智能何时能达到人类级别的宽域智能还有些争议。一项针对数百位科学家的调查显示,他们相信,我们更有可能在2040年实现AGI——距今不过25年,听起来没什么了不起,但是,很多该领域的思想家都认为从AGI发展到ASI很可能会相当快。就好比——一个人工智能系统花费了数十年才实现了低级宽域智能,但最终是实现了。一台计算机可以像个四岁小孩儿一样去理解周围的世界了。然而仅在这里程碑之后一小时,这一系统就推导出了统一广义相对论和量子力学的大物理理论,做到人类不曾做到的事。而仅仅在这件事发生90分钟之后,该人工智能就转变成了超级人工智能,比人类聪明17万倍。

那个量级的超级智能,并非我们所能掌控。就如同一只黄蜂不能用凯恩斯经济学来充实它自己的大脑一样。在我们的世界里,智商130被称为聪明,智商85被称为笨——智商12952该称为什么呢?

我们确定知道的是,人类在地球上的完全主导地位暗示了一个明确的规则:智能就是力量。这意味着,我们创造出的超级人工智能,将会成为地球有史以来最为强大的存在,而所有生物、包括人类的命运,全在它的一念之间——而这,在接下来的几十年内就可能发生。

如果连我们贫乏的大脑都能够发明Wi-Fi,那么,比我们聪明100倍、1000倍甚或10亿倍的智能,在任何时间、以任何方式操控世界上每一个原子的位置应当毫无问题。每一件我们认为超自然的事、每一种我们想象中只有至高无上的神才具有的力量,对超级人工智能来说,就像我们开灯一样稀松平常。创新科技来对抗人类衰老、治愈疾病、消灭饥饿甚至死亡,改变天气来保护地球生命的未来——都突然成为可能。同样,地球上所有生命的突然终结也会成为一种可能。

就我们而言,如果超级人工智能成为现实,地球上就有了一位无所不能的上帝——对我们来说,最重要的问题是:它会是个友好的上帝吗?

推荐阅读更多精彩内容