“火炬上的深度学习”之缘起

无论你愿不愿意,人工智能时代都已经来临。

从一开始,这个时代就展现出了一些不同寻常的特征。比如,如今的学术发展前沿已经从高校和研究院所转移到了科技巨头企业;再比如,一些人工智能创业公司在进行基础科学研发。这里面最典型的代表就是Google旗下的Deep Mind公司,他们简直就是一支基础科学研究团队,而不像商业公司。同样的道理,人工智能的教育和培训也存在着许多与以往的教育和培训不同的地方。

说起人工智能培训,我不得不对如今所呈现的这种鱼龙混杂的状态感到忧虑。目前,绝大部分人工智能培训都可以分成两类,一类是响应国家号召,面向中小学的人工智能教育。说实在,这类教育可能更多地应偏向于编程或机器人教育,而这和人工智能还是是两码事儿。由于目前的人工智能开源工具尚没有出现类似Scratch这样简化的平台,所以要让小学生学会使用TensorFlow还有相当长的路要走。

另外一类就是面向IT工程师转型的教育培训。这类培训面临的一个最大问题就是到底教什么、学什么?学算法吗?可是如果你真正接触人工智能的相关工作就会发现,绝大多数公司需要的并不是开发算法的人,而是那些清洗数据、处理数据、有丰富调参经验的工程师。换句话说,真正应该教的,面向就业的东西就应该是各式各样的清理数据、调参的工程经验。然而,这些东西又是很难用授课的方式来教的,因为面向毫无经验的学员,你罗列了一套一套诸如Dropout、BatchNorm等技巧不仅对他们毫无用处,反而会让他们感到厌倦。

那就带着他们做项目呗。对于一个师徒制的小团体来说,带着几个学生承接一个项目来做应该是没有问题的。但是,这似乎并不能算是教育或培训了,而更多的是工程开发。所以,Kaggle选择的就是数据科学竞赛这种形式来对接产业中的项目需求和需要练手入门的程序员们,而没有走培训教育的道路。(www.kaggle.com)

正是对这些问题的思考,以及目前人工智能培训中的痛点,我带领着集智AI学园的小伙伴们开发了《火炬上的深度学习》课程,尝试为人工智能教育提供一套不同以往的解决方案。我认为人工智能教学更主要的不是算法,更不是只有在实际的工程中才能用得着的那些优化Trick,而是对算法更深层次的理解以及对实际问题的建模思路。当你能够在更高的维度掌握算法和建模思路的时候,你就会自然知道如何来套用哪一系列的优化技巧来解决问题,因为你已经从本质上对人工智能有了透彻的了解。

比如,在《火炬课》上的《单车预测器》一节之中,我讲解了如何解剖一个简单的神经网络。

通过手动编程,我们可以窥探一个神经网络内部的运作机理,从而发现什么时候神经元会被激活,以及它所对应的数据之中的特征会是什么。这一节的内容受到了学员们的一致好评。对神经网络的解剖不仅仅破除了他们头脑中无法打开神经网络黑箱的迷信,也帮助他们更透彻地理解了神经网络是如何绕开传统的If else编程,而实现从数据中自动探测模式的。

面对大部分学员都缺乏实操经验的问题,《火炬课》为他们精心设计了一系列小项目。这类项目首先与真实工程非常不同:你不需要超大规模的运算和数据就能解决,甚至可以在自己的笔记本电脑上跑一两小时而完成;另一方面,这类项目又具有足够的难度,以使得你必须掌握一定的技巧,对相关算法和技术理解到一定程度才能完成。在科学中,这种项目被称为最小模型,我们就是让学员进行大量的最小模型训练从而理解深度神经网络的工作原理。

换句话说,我们的课程更注重站在第一性原理的角度来思考人工智能,而不仅仅是对它的简单应用。

我认为,这种具备了基本分析问题素质的人才是人工智能时代最稀缺的人才!

也许你会说,我不需要理解原理,只要懂得如何调用那些机器学习平台不就可以玩转深度学习吗?为什么非要懂得里面的原理呢?如果你真的实践过深度学习项目就会发现,编写一个深度学习算法最主要的工作就是把数据转换成神经网络能够处理的张量,而你所要做的就是根据不同的实际问题选择不同的数据形式。这一看似不起眼的步骤,在很大程度上决定了你模型的效率。就比如说,给你一串字符,你用什么张量形式喂给神经网络呢?你可以选择独热编码的方式,也可以先将字符嵌入为向量,还有可能简单的采用词带模型来描述它。不同的方法会因条件、问题而异,也会深刻影响到后续问题的解决效率。

在《火炬》课中,我会突出另一个重点是,要学会将表面不相关的问题全部转化成标准的机器学习问题,从而用现成的模型来解决。未来,我甚至想专门设计一门课就叫做“机器学习建模”,它与传统的数学建模课很像,但不同的就是我们的模型全部都采用机器学习。

也许你会嘲笑我说,这种教学方法过于书生气。真正热爱研究探索的人才不会用你来教,人家早就自学成才了;抑或是那些工程师需要的就是混口饭吃的技术,而不需要更多理解理论层面的东西,所以你的课不会有市场。

从我接触到的学生、学员还有更多的集智粉丝来看,事实并不是这样的。有很多高校中的研究生甚至博士生完全学不到类似人工智能、大数据这样的知识。高校中的课堂内容绝大部分还是相当陈旧的课本知识,而且大部分都过于强调理论而不是实战。所以,这些中国的“精英学子”并不像我们想象的那样风光,他们对业界的最新技术与工程师们一样渴求。

另一方面,我接触过的好学的工程师比比皆是。有太多的人不满足于掌握简单的技术,他们更对基础科学充满了好奇和兴趣。现在这个时代技术更新太快,无论是多么高的高手都会有一种焦虑感,这种焦虑促使他们开始反思从工程化思维到科学思维的跃迁。

我们的课程满足了这些人的需求,而我认为这样的人必将会成为未来中国创新式社会的主流。

我坚信就像人工智能时代终将取代互联网时代一样,未来的高科技行业会越来越多地体现出基础研究和应用研究再到市场的无缝融合。这意味着,科学研究的能力将会更加平民化。未来,小学生就足以撰写像模像样的科研论文。我力图做的事,也正是将这种科研能力尽可能地赋予更多的人。

 微信公众号:swarmAI

集智AI学园QQ群:426390994

学园网站:campus.swarma.org

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,924评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,902评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,716评论 0 239
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,783评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,166评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,510评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,784评论 2 311
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,476评论 0 196
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,196评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,459评论 2 243
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,978评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,321评论 2 252
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,964评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,046评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,803评论 0 193
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,530评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,420评论 2 265

推荐阅读更多精彩内容