尴尬了,腾讯报告AI人才30万,然而实际只有两万

本文由 「AI前线」原创,原文链接:尴尬了,腾讯报告AI人才30万,然而实际只有两万

译者|核子可乐

编辑|Tina

AI 前线导读:”过去几年以来,全球市场对于 AI 专业人士的需求正呈现出指数级增长趋势。随着各类企业越来越多地利用人工智能方案为自身业务提供支持,其对具备丰富经验、博士学位且技术娴熟之人才的旺盛需求也一直保持着强劲的提升势头。”

此份报告总结了我们对全球 AI 人才储备在范围与广度层面的研究结果。尽管这些数据以可视化方式反映了 2018 年年初全球人才市场的分布情况,但我们必须承认,其中体现的仍然是以西方世界为主的人工智能人才市场模式。

我们所发布的内容与腾讯公司近期整理的《2017 年全球人工智能人才白皮书》较为类似,但涵盖范围更为广泛。腾讯公司在研究当中发现,目前人工智能行业当中存在“30 万活跃研究人员与从业人员当中,已经有 20 万”拥有稳定的雇佣关系,另外约 10 万人则正在学术界进行研究或学习。他们公布的人数远远超过我们得出的 22000 这一最高估值,这种差异主要是由于腾讯方面计入了整个技术地段,而不仅仅是接受过培训的技术专家。然而,我们的报告着重于发现目前这部分规模相对更小的“AI 专家”在世界各地的具体分布情况。

我们在本次调查当中共采用了两大流行数据源。首先,我们使用了来自领英的搜索结果,其根据我们设定的专业参数显示出技术专家总数。此外,为了构建起一套更高级的子集,我们还整理出领导各 AI 内不同层级主要 AI 会议的高影响力专家姓名。最后,我们将这些数据同来自全球社区的其它报告及调查结论进行结合,希望借此了解这部分人才发展趋势将在不久的未来呈现出怎样的发展态势。

由于我们主要依赖于英语数据源,因此我们对于人才储备的观点可能不具备良好的全球代表性。因此,报告的后半部分将重点对亚洲及非洲的人才与资金情况进行评估——在这些区域内,我们统计数据的可靠性出现明显下降,且与行业或学术产出热点并不匹配。

根据我们对领英数据进行的广泛调查,我们发现目前世界范围内共有约 22000 名拥有博士学位的研究人员能够从事 AI 研究与应用工作,而其中只有 3074 位人才正在寻找工作。而在规模更小的高级子集当中,我们发现目前全球有 5400 名 AI 专家曾经在全球领先的人工智能大会上发表演讲,且他们精确技术与团队合作事务,能够切实将相关成果引入研究与应用层面。

我们如何定义“人才”

为企业构建个性化 AI 应用程序要求相关人才队伍具备对机器学习 / 深度学习技术的深刻理解,拥有多年工作经验,且能够在跨学科环境当中进行协作与开发。

目前人工智能就业市场中“人才”严重短缺的现实表明,当下有能力立足商业、学科与工程领域实现学术研究与应用软件开发工作的人才数量仍极为有限。

这类技术团队应该有能力发现可利用现代机器学习技术解决的问题,从零开始构建并实施相关解决方案,而后优化该解决方案以提升工作效率。

在我们的调查当中,我们所定义的“专家”必须极具才能或实践经验,以确保其能够代表这一领域当中最为顶尖的领导者、前辈或者顶尖后起之秀。我们使用两种不同方式以准确确定全球人才群体的数量:领英搜索结果加学术会议参与者。

领英

通过使用领英结果,我们设定以下搜索标准,从而全面了解成为 AI 专家的具体定义。总体来讲,这些参数的设定为了能够找到不迟于 2015 年获得博士学位的候选人,从而体现出其工作经验 1。虽然博士学校从技术层面讲并不是认定人工智能专家的必要条件(因为在真实应用环境当中,人工智能解决方案对经验的要求要高于学位),但我们发现获取博士学位无疑是评估不同国家人才储备量的重要前提 2。

为了符合这一子集的具体要求,除了一项或多项高级概念之外(包括深度学习、人工神经网络、机器学习、计算机视觉、自然语言处理或机器人技术),配置参数还必须提及“AI”或“人工智能”等明确表述。另外,这些候选人亦必须在技术层面拥有熟练的水平:我们对数字进行了过滤,确保结果中只包含对 Python、TensorFlow 或者 Theano 拥有深入了解,因此具备真实世界中应用程序开发经验的人群。利用这些广泛的搜索参数,我们共找到总计 22064 名专家。

我们还运行了一套更高级的子集,其中不包含“AI”或“人工智能”等限定符,省略了“Python”,但包含更多仅限于 AI 领域的特定框架。这一搜索的基本思路,在于发现候选人所掌握的、我们在自身工作当中经常使用的具体框架(包括 torch、caffe 以及 nltk),且不再使用“AI”这类热门词汇进行候选人筛选 3。在这一轮搜索当中,我们找到的数字非常接近于我们的会议主讲者调查数量:我们发现了 6138 名相关专家,其中 1735 名表示其可以接受新的工作岗位。

在可视化方面,我们决定选择不太保守的统计结果,从而尽可能多地涵盖具备潜在跨学科技能的人才。

学术会议

除了较为狭义的领英搜索结果之外,我们还统计了已发表论文或文章的作者,以评估其他高层级影响力人士以及这一领域中的“后起之秀”。从理论层面讲,这些候选人需要能够在受控环境当中建立起 AI 理论应用,且适用于其它更为复杂的现实环境。在这一人才库当中,我们发现了曾经在过去几年当中发表过研究论文的 5400 名专家。

在我们的研究当中,将以下会议列为优先关注对象:神经信息处理系统会议(简称 NIPS)、国际机器学习学会(简称 ICML)大会,以及国际学习代表会议(简称 ICLR)。我们从这些会议当中整理出研究人员姓名,并使用 Mechanical Turk 查找到其居住地、经历以及教育背景。

数据集偏向

根据我们的数据结果,欧洲与亚洲国家的研究人员在数量上要远低于美国、英国或加拿大研究人员。但我们必须承认,这很可能主要因为领英是一套专注于西方国家的平台。我们的搜索结果显示,中国拥有 413 名候选人,新加坡有 291 名,日本有 204 名,韩国则有 147 名。

根据 Meenakshi Chaudhary 整理的最新领英用户国家分布清单显示,即使是在各发达国家当中,领英用户的普及度也存在巨大差异。Chaudhary 提到,“美国、印度、巴西、英国以及加拿大的领英用户数量最为可观”,这表明领英的具体使用比例在某些国家及市场当中对样本信息以及由此分析出的结论产生着重要影响。因此,虽然领英统计结果中的亚洲专家数量远低于北美或欧洲,但考虑到领英的使用普及水平在亚洲相对较低,因此这些数字其实已经相当之高。

对学术会议上的演讲进行整理而得出的结论也存在类似的情况。由于我们将关注重点放在了西方世界内以英语为主体语言的会议当中,因此相关搜索范围很可能未能涵盖各研究中心、私有实验室、智库、高校与研究机构、独立研究人员及顾问等其它机构。这些人才虽然确实属于专家甚至是人工智能领域的领导者,但其小规模或个人工作成果可能并不会被纳入全球社区。

(‘深度学习’或‘人工神经网络’或‘机器学习’或‘神经网络’或‘语音识别’或‘计算机视觉’或‘图像处理’或‘自然语言处理’或‘自然语言理解’或‘机器人’)以及(‘Python’或‘Tensorflow’或‘Keras’或‘Theano’)以及(‘AI’或‘人工智能’)。

如果不设定 2015 年或之前毕业这一条件,则人才储备量将增加到 9 万人——这一结果开始与腾讯的统计数字趋近,也显示也很大一部分自认为属于 AI 人秀的群体实际上缺乏真正的工作经验或深厚的专业知识。

(‘深度学习’或‘人工神经网络’或‘机器学习’或‘神经网络’或‘语音识别’或‘计算机视觉’或‘图像处理’或‘自然语言处理’或‘自然语言理解’或‘机器人’)以及(‘Tensorflow’或‘Keras’或‘Theano’或‘pytorch’或‘torch’或‘caffe’)。

全球 AI 人才热点

北美地区

在我们统计的 22000 份领英个人资料当中,近半数候选人(9010 名)在美国生活及工作。大多数领英专家在其研究领域当中提到计算机科学(12856 名)或计算机工程(3879 名),其它不太常见的学习领域则包括数学(2592 名)、物理学(2157 名)以及 IT(1175 名)。这些专家中有相当一部分曾经效力于谷歌(756 名)、微软(357 名)或者 IBM(265 名),且拥有 3 到 10 年的工作经验。

美国在 AI 人才市场上的主导地位并不令人意外。Paysa 最近对人工智能人才储备情况进行的一项研究发现,仅在美国本土每年的人工智能相关薪酬支出就高达近 6 亿 5 千万美元 ; 与此同时,数家美国企业还共同筹集另外 10 亿美元用于资助人工智能开发工作——这意味着小国很难在这一领域与美国开展竞争。

尽管如此,加拿大仍在领英与会议主讲人数量层面位列第三,这意味着其凭借着 1154 份高级个人资料成为美国强有力的竞争对手——特别是考虑到加拿大相对有限的人口与 GDP 总量。加拿大的人工智能人才库当中包含众多原在校学生以及新晋国际研究人员,在具体位置方面蒙特利尔一马当先(Facebook、谷歌、优步、三星以及 DeepMind 等都在这里设有实验室),多伦多、埃德蒙顿与温哥华则紧随其后。

欧洲地区

英国是仅次于美国的人才储备亚军,共拥有 1861 名高级候选人。英国一直是人工智能领域的一大重要参与方,而这也引发了严重的人才流失现象:根据 Ian Sample 在《卫报》上发表的文章,众多 AI 教授由于人才需求“严重超过供应量”而积极转投回报更为丰厚的其它领域。

在另一方面,德国则面临着截然相反的状况。正如博世人工智能中心人工智能研究人员负责人 Yasser Jadidi 在接受《金融时报》采访时所指出,德国在“年轻专家与学者”方面拥有强大的影响力,且这些人仍然“保持低调”。凭借着 276 位会议主讲人构成的强大学术力量,德国一直在考虑如何将人工智能专业知识商业化。德国南部的 Cyber Valley 等新兴技术中心正在寻求与行业及学术界实现资源共享的空间。

其它欧洲国家同样拥有着可观的专家数量:法国拥有 797 份符合筛选条件的领英个人资料,西班牙则拥有 606 份。总体而言,近年来欧洲已经稳定成为寻找人工智能人才的有利竞争地点。

亚洲地区

不过,我们迄今为止所发现的以北美与欧洲为主体的人工智能全球态势,并不足以准确描绘世界范围内的 AI 人才分布情况。亚洲在我们统计的领英与会议主讲数据中并不具备正确的代表性,这主要是由于我们采取了以英语为中心的搜索方法。尽管我们搜索发现的亚洲候选人数量相对较低,但纸质出版物与资金投入额度却给出了完全不同的结论。

下面,我们对中国、新加坡、日本以及韩国在各自市场上取得了令人难以置信的发展成就加以总结。我们还将介绍为何人才市场会呈现出如此突出的东西方鸿沟,且这一问题难以解决的具体原因。

总体而言,我们发现亚洲国家更注重 AI 技术的实际应用,而非投资于学术研究。

中国

中国的 AI 市场发展速度相当惊人。根据美中经济与安全评估委员会在其 2017 年的年度报告当中所指出,“中国政府已经承诺在人工智能领域投入超过 70 亿美元资金,而以深圳为代表的多个城市亦为人工智能初创企业提供 100 万美元启动支持。相比之下,美国联邦政府于 2015 年投入 11 亿美元用于未明确分类的人工智能研究,且主要以竞争性补助形式发放。”

根据这份报告,以百度、阿里巴巴以及腾讯为代表的中国技术企业已经成为“AI 领域的全球领导者”,这一趋势亦在中国政府的有力推动下成为一种主流趋势。就在去年 7 月,CNN 报道称中国国务院正计划在未来几年内建立起总价值高达 1500 亿美元的人工智能产业。

尽管资金投入迎来了大幅度飞跃,但西方世界在很大程度上仍不了解中国正在人工智能领域进行哪些工作。正如吴恩达在采访当中所提到,“中国对英语世界所发生的一切都拥有着相当深刻的认识,但西方对中国的了解则恰恰相反“。虽然中国研究人员能够用英语进行表达并涉足西方的研究领域,但由于语言障碍的存在,英语社区与中国的研究方向仍然存在着巨大差异。正因为如此,中国在西方世界的视野之外取得了巨大的学术飞跃。根据奥巴马政府于 2016 年年末整理得出的一份人工智能报告,尽管我们在领英当中仅搜索到 413 份符合条件的个人资料以及其中的 206 位会议主讲人,但中国近期在人工智能的纸质刊物论文发表数量上已经领先于美国。从传统角度来看,论文发表数量正是特定地区研究活动活跃度与人才成长良好性的主要指标——不过也有一些人对中国发表论文的影响力与质量抱有质疑。

在发表于《The Aleph》上的一篇文章中,Alex Barrera 指出中国之所以近年来快速实现教育水平提升,主要是源自其拥有北京大学与清华大学这两所全球前三十强一流学府(根据泰晤士高校排名)。Barrera 认为这种趋势还将继续持续下去,“虽然像斯坦福大学这类顶尖学术机构仍然在全球范围内保持领先地位,但像北京大学这样的高校正在缩小差距。斯坦福大学在特定领域拥有更高的评价分数,但在技术转化等方面事实上却落后于其它大学。”

尽管中国的人工智能教育一直在快速发展,但人工智能教学人员仍存在严重短缺。中国的众多人工智能从业人员主要来自电气工程或计算机科学等其它分支领域。总而言之,尽管中国人才库的增长势头仍将继续保持下去,但中国显然还需要一段时间才能建立起真正能够与美国正面对抗的完善市场体系。

新加坡

最近的报告也强调称,新加坡正迅速成为全球范围内的一大人工智能研究中心。根据亚洲新闻频道于 2017 年发布的报道,新加坡国家研究基金会将投资 1.1 亿美元,用于“建立旨在提升新加坡未来五年内人工智能技术水平的国家计划”。

我们整理出的数据已经确定,新加坡全国至少拥有 291 名高素质人工智能人才,以及 21 位在全球领先会议当中发布研究结果的高级专家。Kaishi Partners 公司总监 Michael James Milne 在来信中估计,目前新加坡与整个东南亚地区约有 1500 名合格的人工智能专家。

数量快速增加的数据中心也从另一个侧面给这些数字提供着支持。而这些研究中心正在这座国际化大都市当中快速扎根。Marvelstone Ventures 公司的 Joel Ko 最近在采访中证实,Marvelstone 方面正计划建立一座新的人工智能中心,其将“每年孵化 100 家相关初创企业”。

日益增长的政府与私人资金注入再次证明:新加坡的人工智能技术必将在未来几年内实现显著提升,而这些变化也将吸引到更多人才的加入。

韩国

在谷歌旗下 DeepMind 团队打造的“AlphaGo”项目成功击败韩国前围棋冠军李世石之后,韩国政府立即宣布将在未来五年当中投资 8.63 亿美元用于人工智能研究。

自那里开始,我们对韩国的相关新闻报道进行了持续追踪(感谢 Rufina K. Pakr 的翻译),其中显示韩国政府正在人工智能基础设施方面倾注大量投资。2017 年 12 月 22 日,韩国科学技术部公布创新发展计划,政府方面承诺向 AI 及相关领域投入 1.56 万亿韩元(约合 15.3 亿美元),甚至将其标榜为韩国的“第四次产业革命”。同样的,智能知识学会理事会设定的 2018 年发展目标是在 13 个创新增长领域投入 7.96 万亿韩元。韩国目前的计划是到 2025 年,凭借创新部门创造 55 万个新的工作岗位。

《自然》杂志的 Mark Zastrow 指出,这笔资金将被投入到两大现有 AI 研究项目当中——其具体工作包括:利用 Exobrain 与 IBM 的沃森计算机开展竞争 ; 外加计算机视觉研究项目 Deep View。作为这一领域的行业领导者,韩国已经取得领先地位,并在 2017 年获得了全球人工智能专利数量榜上的第三名。

在我们整理出的数据当中,我们发现目前在韩国工作的 147 名 AI 专家当中有相当大的一个子集——21 名——曾在最近的学术会议当中担任主讲人。不过尽管在人工智能方面拥有强大的行业影响力,但韩国的人工智能论文数量仅排名全球第七,这意味着其学术研究力量还远不及中国与日本。

日本

与中国不同,日本在机器人与人工智能研究方面拥有着悠久的历史——这一点在很大程度上已经得到了媒体的充分报道。而正如人们所广泛了解到的那样,日本目前面临的主要难题在于臭名昭著的行业隔离状况——这主要源于严重的“语言障碍与严格的商业惯例约束”。然而,日本的人工智能学术规模明显强于韩国以及新加坡,其目前拥有约 117 名曾出席 NIPS 及其它全球领先技术会议的活跃研究人员。

人工智能学校们已经注意到日本与其它亚洲国家开展相关合作当中面临的挑战:东京大学退休 AI 教授 Mitsuru Ishizuka 指出,日本的研究速度严重落后于“中国目前的推进态势”。尽管日本拥有可观的人才规模,但其中相当一部分仍然明显偏向学术领域:117 名会议主讲人与 204 名领英用户这一数字,要远低于中国、新加坡以及韩国。加拿大驻日本二等秘书兼贸易委员 Anta Pan 在一封电子邮件中指出,日本的 AI 人才短缺问题已经众所周知:“在先进信息技术专业研究生招收到的 15659 名学生当中,只有 619 名与 AI 技术存在紧密关联,且其中 123 人有意继续攻读博士学位。”

不过去年 8 月,日本政府宣布“计划投资数十亿日元资助下一代半导体与其它对人工智能发展至关重要的技术。”Pan 先生预计,2018 财年相关资金投入很可能达到 2017 年 517 亿日元(折合 5.75 亿加元)的一倍,这意味着届时将有超过 1000 亿日元(折合 11 亿加元)的资金配套上马。如此可观的资金倾注很可能刺激到更多本土人才投向于研究领域当中。事实上,可观的资金投入已经取得了一些成果:就在去年 8 月,深度学习初创企业 Preferred Networks 就从丰田手中筹集到 9500 万美元,致力于研究自动驾驶技术。

非洲地区

尽管不像东、西两大世界那样多产,但非洲国家近年来在人工智能研究与开发方面的成果也同样值得肯定。

非洲机器智能研究所(简称 MIIA)主席 Jacques Ludik 估计,其协会目前约有 1500 名成员,其中 70% 可被归类为所在领域的专家。Ludik 指出其面临的主要挑战在于资金获取难度太高,而非洲大陆的农业与移动领域急需人工智能技术成果的引入。

微软研究院博士后研究员兼 FATE(人工智能公平透明度问责与道德)小组成员 Timnit Gebru 在信件中指出,非洲机器学习的资金来源多种多样:以 B4 Capital Group 为例,其专门为非洲及南美洲的人工智能项目提供援助。这种灵活资金的支持使得非洲能够打造出针对各个领域特定需求的个性化 AI 解决方案。举例来说,埃塞俄比亚拥有 88 种活跃与小范围语言,因此其一直在积极开发自然语言处理解决方案以改善沟通能力。

Nouha Abardazzou 在其文章当中明确证实了 AI 技术在非洲农业及医疗卫生方面作出的贡献(部分通过移动开发实现)。近期上线的人工智能驱动应用 ECX 电子交易平台就利用物联网设备及 AI 以建立起咖啡追踪解决方案,并贯穿整条供应链中的所有环节。在医疗卫生行业,SOPHiA 人工智能方案则可分析“基因组数据以鉴定患者基因组谱中的致病性突变”。

2017 年当中,公众对于非洲在人工智能领域扮演的角色有了更为明确的认知。Gebru 最近在 NIPS 2017 大会中组织起首届非洲人工智能研讨会。该项研讨会不仅高度关注非洲区域内进行的各项相关研究,同时亦重视黑人研究人员为全球人工智能发展作出的努力。同样的,MIIA 也于 2017 年 10 月于南非约翰内斯堡举办了第一届 AI 非洲会议。此次会议取得了巨大成功,吸引到来自非洲乃至世界各地的专业研究人员的参与,并深入讨论了深度学习技术在非洲大陆上的实际应用。

全球趋势分析结论

美国规模最大的出入境人才交流趋势

“大动作”

我们整理出的会议研究人员参与数据,也能够在一定程度上反映出研究人员在工作或学术研究当中的往来趋势。通过观察候选人母校与其当前工作地点之间的差异,我们发现学生们可能会前往美国接受教育,而后转移到其它国家进行工作。

以上曲线图显示,来自加拿大、英国、德国、法国以及中国的候选人们更有可能移居美国以从事 AI 专业工作。此外,这些国家也拥有最为旺盛的人才交流趋势:“入境”代表研究人员移民至美国并从事相关工作的研究人员数量 ; “出境”则表示在美国获取博士学位后,转而在其它国家进行就业的研究人员数量。

通过曲线图可以看到,美国正充当着世界范围内的人工智能研究与教育“中心”,并成为全球人工智能学术与商业领域间的桥梁。根据我们此前根据领英个人资料作出的评估,以色列与日本学者在整体 AI 从业者中的比例分别高达 75% 与 57%,这也直接体现出跨国与全球合作已经成为行业与学术领域共享 AI 及专业知识的关键所在。

有趣的是,亚洲与欧洲之间几乎不存在人才往来。就目前来看,AI 人才现象的全球化面貌主要反映着西方世界的实际倾向。

学术界对相关行业

将领英个人资料与会议主讲人数据进行比较,我们得出了一些有趣的观察结论。假定这一子集当中的会议主讲人们都拥有我们从领英处搜集到的个人资料,那么几乎可以肯定的是,大概三分之一的 AI 专家会在特定时间点上通过大型学术会议展示自己的研究成果。

学术人士参与技术大会并进行演讲自然容易理解,但这类情况在相关行业当中同样存在。NIPS 主讲人统计结果表明,2017 年的大会由 88% 的学术人士与 12% 的行业主讲人组成。另外,虽然三比一这一比例看起来已经很高,但我们还发现了另一种明显的趋势:像以色列以及日本这样的国家在 AI 学术层面的人员占比实际上还要更高。

德国等国的学者与行业专家间比值同样较高,其中 44% 的领英候选人可能曾经担任技术大会主讲人 ; 相比之下英国等国家的比例则较低,只有 14% 的 AI 专家积极参加技术会议。这些趋势再次反映出我们在前文当中提及的趋势性结论:在德国,大多数人工智能研究工作立足学术机构进行 ; 而在英国,人工智能则更多由行业进行驱动,并在此期间由学术界进行人才输送。

以色列(75%)与日本(57%)在会议主讲人与领英个人资料总量的比值层面分列前两位,这意味着其 AI 研究工作主要由学术界负责推动——这一结论也符合相关趋势性研究报告。尽管如此,但着眼于全球市场,行业似乎仍然是支持人工智能技术发展的核心推动力。

爱尔兰(1.7%)、巴西(3.3%)以及西班牙(4.4%)在会议主讲人与领英个人资料数量间的比值最低,这表明这些国家中的大多数候选人都在行业驱动型 AI 研究部门当中工作。

结论

尽管人工智能人才主要以美国为中心,但欧洲、非洲以及亚洲市场明显也拥有着自己的可观全球 AI 人才热点。与此同时,这些领域正逐渐与西方英语国家的学术会议以及领英求职社区建立起愈发紧密的联系,且这一趋势有望在未来几年中继续保持调整增长。

http://www.jfgagne.ai/talent?imm_mid=0fb92f&cmp=em-data-na-na-newsltr_ai_20180219

更多干货内容,可关注AI前线,ID:ai-front,后台回复「AI」、「TF」、「大数据」可获得《AI前线》系列PDF迷你书和技能图谱。

推荐阅读更多精彩内容