向人工智能学习如何学习

96
越峰者
2017.05.05 01:13* 字数 2706

不知道是幸运还是不幸,我们所处的时代出现了一种叫做“人工智能”的技术,创造它的初衷是为了帮助人类从繁复的计算和重复劳动中解放出来,顺便提供一点娱乐消遣。但随着技术的发展和大数据的支持,它变得越来越聪明,甚至在某些方面超过了人类。这让人类开始有了危机感,害怕有朝一日被自己制造出来的智能体征服,就连霍金也发出了“完美人工智能的开发便意味着人类的终结”的警告。我把这种观点称之为“危机论”,秉持这种观点的人比比皆是,但也有人提出不同的想法,比如今天提到的<人工智能狂潮-机器人会超越人类吗?>这本书的作者,日本著名人工智能专家松尾丰先生。他认为人工智能将会征服人类这种说法完全是无稽之谈,人工智能必然会促进人类的发展。这种观点我把它叫做“共存论”。

上述观点究竟孰是孰非,这要交给时间来证明,现在我们能够确定的是:人类已经教会了计算机自我学习的方法,它的发展势头将无人可挡。这种方法就是近年来人工智能领域研究出来的深度学习技术。人工智能领域我连门外汉都算不上,因为门儿在哪我都不知道,可我偏偏对人工智能如何从小时候玩的俄罗斯方块手掌机发展到可以战胜职业棋手的ALPHAGO这个过程很感兴趣,于是找到了前面提到的<人工智能狂潮>来读。合上书,我对人工智能的发展过程有了初步的了解,更重要的是,我觉得似乎可以从人工智能学习的方法上借鉴一点东西用在我们身上。

计算机的自我学习方法是人类研究出来的,反过来我们又从计算机身上学习学习方法,有点怪是吧?那就让我们从人工智能发展的历史开始梳理吧。作者松尾丰先生作为日本人工智能学会的会长,他把人工智能的发展分为四个阶段,分别是:

  • 推理与搜索时代 1956年夏天,美国东部达特茅斯的一次学术会议上第一次提出了“人工智能”的概念,这一时期的人工智能主要是按照“前提条件—行动—结果”的流程进行推理与搜索。这一时期人工智能能够解决的问题的范围和能力都有局限性,只用于下棋、游戏等方面,这就造成研究激情于20世纪60年代逐渐退却;

  • 知识表示时代 在这一阶段,人工智能依靠“知识”的支撑,也就是大量数据的输入,配合事先指定的规则,可以实现不同的输出结果,实现诸如诊断病情、智能对话之类的功能。这种人为输入指示解决问题的方式就是所谓的专家系统。对于人工智能发展至关重要的一个概念”知识表示“浮出水面,即让计算机理解人类掌握的知识的方式,它的发展程度决定了人工智能的进步速度。该阶段的知识表示还停留在人工输入阶段,人为将大量的通识知识、定理等输入计算机,但由于信息量太大,且描述困难,进而延伸出“本体研究”的概念,即概念化的明确的规范说明,就像说明书一样。但知识是无穷尽的,如何提炼出抽象的概念让计算机能够理解,计算机如何根据情境选择正确的知识解决问题,这些都是这个阶段面临的问题。

  • 机器学习时代 1990年,网页开始出现。随之而来的是数据大量激增,计算机处理能力逐步提升,计算机可以根据特征量自动找到区分各类知识的方法,进而可以对之前它从未接触过的实物进行识别和判断,甚至做出预测,这就是所谓的机器学习。特征量我们可以理解为标准,是对象与其他事物不同点。比如西瓜和苹果,两者之间的区别就是各自的特征量,到了这个阶段,人工智能的发展速度开始提升,但特征量依靠人类设计造成精准度不高。可以说如果解决了计算机自行确定特征量的问题,人工智能将一飞冲天。

  • 深度学习时代 这就是我们现在所处的时代,2006年深度学习开始被研究,十多年来已经取得了非凡的成果,计算机已经可以自主学习,分辨事物,解决问题。深度学习指的是以数据为基础,计算机自动获取高层特征量,生成数据库,不再依靠人来设计特征量。谷歌2012年开始的“猫脸识别”就是典型的深度学习,提供1000万张猫脸照片给计算机,让其自动提取特征量,作为今后识别猫这种动物的标准。是不是很神奇?这究竟是怎么实现的呢?太深奥的原理我不懂,只能简单说说我的理解,还以“猫脸识别”作为例子:首先将输入和输出都提前给定,也就是说,我们把1000万张猫脸照片输入计算机,然后告诉计算机这些照片都是一种叫做“猫”的动物,由计算机自动提取猫的特征量,假设计算机提取了一系列猫的特征,比如身上有毛,有尾巴,四条腿等等,然后为了提高准确度,我们再加入一些噪音,比如狗的照片并告诉它,这不是猫,于是计算机又会进行修正,在其他特征都吻合的条件下,加入圆脸的才是猫,长脸的不是等等类似的特征(举例子啊,我并不确定是否存在长脸的猫),今后计算机就能够根据自己建立的特征量数据库识别出猫这种动物了。这一切都是建立在大数据基础上的,就像罗胖说的“人工智能是用大数据喂养出来的怪兽”。当然,深度学习技术当然不会这么简单,这只是我理解的一点皮毛而已。

我们的时代不仅有人工智能,还有一个不同于此前所有时代的特征,就是知识迭代的周期不停的缩短。所以,处在这个时代的我们,无论是贫穷还是富有,疾病还是健康,都会主动或被动获得一个额外的职业—学生。终生学习是我们适应时代发展的必要条件,学习力的高低甚至可以决定你的人生高度。从人工智能的发展历程中,特别是深度学习技术里,我总结了几个提升学习力的要点,和大家做个分享:

  • 学习目标要清晰 人工智能的产生和发展都是为了解决问题,可以引申到我们究竟为什么而学,这是最重要的问题。在我看来,学习分为两类:以知识为导向的学习和以问题为导向的学习。前者指的是学院教育,侧重于知识的积累,适合学生,而后一种是指为解决某一问题而进行的有目的学习,适合成年人。两种方法优势互补,但对象不同,侧重点就不同,就我个人而言,问题为导向的学习更适合我,当然,知识学习也是必须的,只不过排在第二位;
  • 输入和输出都很重要 前面提到的深度学习里输入和输出两个方面,也可以应用在学习上,输入的重要性毋庸置疑,输入量要尽可能的大,无论你是哪一种学习者,大量的输入才能有高质量的输出。输入是手段,输出才是目的,输出最重要的是从输入中提炼出“特征量”,也就是独特的观点然后表达出来,才能取其精华,内化于心;
  • 善用抽象和类比 计算机利用深度学习技术提取特征量用的就是抽象和类比的方法。这两种方法在学习中简直是神器。《如何高效学习》的作者斯科特.杨,一年学完MIT全部课程,靠的就是这两种方法。抽象是总结,把总结出来的知识、方法活用到其他领域就是类比,所谓“一通百通”就是这个意思了。推荐看一下coursera上的课程《Learning how to learn》(中文:学会如何学习-帮助你掌握复杂学科的强大智力工具),绝对有帮助。

一本书看了一周,笔记拖了两个月,我这拖延症也是没谁了。Facebook的小札说过“完成比完美更重要”,与拖延症病友们共勉

用笑来老师的公众号题目“学习学习再学习”作为结束,第一个和第三个“学习”都是动词,第二个是名词,懂了吧。

读书
Web note ad 1