谷歌大牛发利市,缺师少友这边请~

原文:Free Office Hours for Non-Traditional ML Researchers
作者:Eric Jang
译者:尹肖贻

由同事Colin的启发,我萌生了助人的念头,所以写了这篇文章。他在推特中说:“近来的邮件,多来自国外新入行的研究者。信中说,他们科研态度热忱,但因缘弄人,或硕博无门,或良师难觅,或膏火难凑。除学习公开课程,揣摩开放资源之外,还有其他方法吗?”


看到他们的困厄,我不由得同病相怜。我是一名Google研究人员,也是“非传统背景”,即“没有相关的博士学位”。人们通常先获得博士学位,才能被雇用从事相关的工作。就人工智能 / 机器学习的某些职位而言,资质更为严苛。申请者可能须是大学教授,或是Google这样大公司的研发科学家,有时甚至兼而有之。

Google招聘研究人员时,尽管并不容易成功,但是申请人可以在没有博士学位时发起申请,对他们而言主要有两种途径[1]:

一是加入“AI Residency Program”(人工智能在地培养计划),该计划是非大学机构(FAANG公司,AI2等)提供的定期工作,旨在启动参与人员的人工智能 / 机器学习的研究生涯。但是,这个计划通常只有一年的时间,参与人员还不足以证明自己“真正成为”为研究人员。(译注:FAANG代表Facebook、Apple、Amazon、Netflix、Google五家科技巨擘公司,AI2代表Allen Institute for AI,艾伦人工智能研究院)

另一种途径是加入偏重机器学习的团队中,从软件工程师(SWE)开始,建立同事对你研究能力的信任。这就是我走的路。我在2016年加入Google,担任Google Brain Robotics团队的软件工程师。虽然按职位说工程师是专职写代码的,但是我平时专注于“最重要的问题”,这个问题就是要思考为什么机器人没有按照最初的设计意图完成命令,我们怎样训练深层神经网络来解决问题。围绕这个主题,我做了一个研究项目又一个研究项目,以致于我现在一直做研究,并发表论文。

在过去的几年中,随着人工智能 / 机器学习领域井喷式的发展,进入研究领域正变得越来越困难(请参阅Colin的推文)。如BAIR这样顶级的博士课程,甚至通常要求学生在申请之前,就要在ICML、ICLR和NeurIPS之类的顶级会议上发表论文。可以肯定,要是今年刚大学毕业,我将不会被任何博士学位课程录取,最终可能成为定量金融的分析师。

对于非传统背景的研究人员来说,本领域更如棘地荆天。他们中具有博士学位的不乏其人。正如科林(Colin)所暗示的那样,由于美国政府的话语主导,国际人士在美国科技公司工作,或在美国学校学习,难度也越来越大。

在机器学习/人工智能领域,劳动力的供求曲线正走向扭曲。一方面,大量来自全球的有志之士涌入,希望解决棘手的工程问题,为科学知识做出贡献,与世界公开分享成果。另一方面,他们似乎缺乏正规的培训或成长的环境,比如:

  1. 导师的研究指导,学习从术语到行规的内容。更重要的是,学习如何提出好问题,并设计实验来回答这些问题;
  2. 在公司环境中,领导鼓励软件工程师承担项目的环境,工程师可以大胆主导自己的研究(而不仅为研究人员打打下手)。

免费研讨时间

目前,我没有能力为(2)做什么,但是我绝对可以为(1)提供帮助。为此,我将通过电子邮件和视频会议为来自非传统背景的有志研究人员,提供免费的机器学习研究指导。

我对实用机器学习技术、机器人技术和生成模型最熟悉。就我个人而言,最有资格在这些领域提供建议。除此之外,我有很多相关兴趣,例如量化金融、计算机图形学和神经科学。无论技术主题是什么,我都可以帮你撰写学术论文,降低较为激进的项目失败的风险,或选择研究方向。对于我不熟悉的领域,我将虚心向你求教,开阔视野,学习更多知识。

如果你有兴趣使用此资源,请发送电子邮件至<myfirstname> <mylastname> <2004> <at> <g ****.com>。在你的电子邮件中,包括:

  1. 你的简历;
  2. 你想得到什么建议;
  3. 几句话总结你很酷的研究想法。

有关这些研讨的时间,我还有几句话要说:

  1. 每周或每两周预定一次Google Meet[2]电话,以检查你的进度并提问。我们将通过Google日历安排15分钟的时段。
  2. 你在研讨时间的重点,不是要我回答“如何在Google Research找工作”,而是要我扮演类似于导师或助教的角色,来代替博士课程。如果你的研究更深入了,我们可以讨论一下事业上升的路径和机会;但是大多数情况下,我们只进行入门级别的研讨内容。
  3. 我可能不会替你写代码或做实验。
  4. 我不想成为幕后大佬之类的角色,在学生的所有论文上印上自己的大名——我提供的大多数建议都是免费的,没有任何附带条件。如果我为你的工作做出了重大贡献,或者与你一起花费了O(10)个小时或以上的时间来取得可发表的结果,我可能要求成为出版物的共同作者。(译注:O(10)是计算机复杂度中大O计数法的戏谑用法)
  5. 如果我觉得不能为你提供有效的帮助,或者有其他优先事项必须完成,我保留拒绝会议的权利。
  6. 我不能透露我在Google着手进行但尚未发表的工作,或任何Google的机密信息。
  7. 我不为企业提供机器学习咨询服务,因此你的研究必须与你目下的工作无关。
  8. 重申第2点,我不提供职业建议,而是教初学者设计实验、引用和撰写论文,以及有效地发表研究成果。

我从中得到什么?首先,扩展人际网络;其次,我目下的研究工作,人单力薄,不如众人拾柴;第三,我试水扩展学术界的体制,师徒相传不如星火燎原,也许我们的做法更好。

四年前,我曾梦想有人提供类似的机会,使那时的我得以凿壁借光,一窥科研门径。今天,我想给其他踌躇满志的研究界的新人一个机会,引领大家向着梦想不断向前。

脚注

[1] 克里斯·奥拉(Chris Olah)写过一篇不错的博客,介绍了非传统教育的多重选择和利弊。
[2] Zoom服从中国的内容审查要求 ,所以我较少使用Zoom。