【呆鸟译Py】2019年数据科学职场报告~Python一路飙升

2019年数据科学职场报告

原文作者:Bob Muenchen
原文链接:Data Science Jobs Report 2019: Python Way Up, Tensorflow Growing Rapidly, R Use Double SAS

本文基于我之前的文章,数据科学软件流行趋势报告,只是更新了职场方面的分析,为了节约读者的时间,在此只列出了这部分内容。

招聘广告

统计岗位需求数量是衡量数据科学软件流行趋势与市场份额最好的方法。招聘广告中包含的信息很多,并且还有工资数据加持,所以说招聘广告可能是当前衡量软件流行趋势最好的度量手段,甚至我们可以从岗位需求可视图的变化预知未来哪种软件会变得更流行。

Indeed.com 是美国最大的求职网站,分析该网站招聘广告数据是最好的选择。正如该公司联合创始人及前任 CEO,Paul Forster 所述,Indeed.com 囊括了“Monster、CareerBuilder、HotJobs、Craigslist 等主流招聘网站及数百家报纸、协会、公司网站等上千个独立来源的所有工作岗位。” Indeed.com 的搜索能力也超级强悍,它曾提供过一个岗位趋势图工具,但这个工具后来被停用了。

Indeed.com

用 Indeed.com 搜索职位很容易,但要想搜索这些软件数据,确保搜索出来的数据能实现公平比对就有些挑战了。SPSS 与 Apache Spark 只用于数据科学,SAS、Tableau 等则既适用于数据科学岗位,又广泛应用于报告编制任务。Python、C、Java 这些通用编程语言虽然在数据科学工作中应用广泛,但很多与数据科学无关的岗位也会使用。为了公平起见,我设计了一个专门用于搜索数据科学软件的协议,这个协议的详细内容在另一篇文章里,如何搜索数据科学工作岗位。本文图片调用的数据都是那篇文章中所列协议流程查询所得的结果。

本文采用的是 2019 年 5 月 27 日与 2017 年 2 月 24 日的数据。有人可能会质疑只选择单日样本是不是很不稳妥,但考虑到 Indeed.com 的岗位数量已经足够大,而且它的数据一直以来都很稳定,我认为这样对比是可行的。

图 1a 显示 Python 以 27,374 个岗位遥遥领先,SQL 以 25,877 个岗位紧随其后。Java 与亚马逊机器学习工具位列第二梯队,岗位数量比前两名低差不多 25%,为 17000 个左右。R 语言及各种 C 语言变种在第三梯队,约有 13,000 个左右的岗位。R 语言经常被人拿来与 Python 对比,但从数据科学岗位需求来看,R 语言还不及 Python 的一半。当然,这两个软件的使用者做的工作并不完全一样。我还注意到统计学家大多偏爱 R 语言,搞机器学习的人则倾向于 Python,但不管怎么说,Python 绝对是独领风骚!从 Hadoop 往下,岗位需求的下降趋势变缓。同样,大家还经常拿 R 语言与 SAS 两相比较,但 SAS 的岗位需求只有 8,123 个,R 语言的岗位需求则有 13,800 个。

图 1a 的数据规模比较大,最下方的 H20 看似近乎于 0,但实际上,它有 257 个岗位需求。

图 1a. 主流软件数据科学岗位需求数量

下面,我们点评一下图 1b 里单独列出的小众软件。Mathematica 与 Julia 是这一系列软件的领头羊,这两个软件都有约 219 个岗位需求。从图中可以看到,上古流传下来的 Fortran 仍有 195 个岗位需求。排在 Fortran 后面是开源软件 WEAK 与 IBM 的 Watson ,大约有 185 个岗位需求。XGBoost 以后,岗位需求缓步下降。

这一系列软件中还有几个工作流工具:Enterprise Miner、KNIME、 RapidMiner 与 SPSS Modeler,这些工具的岗位需求大多在 50 到 100 之间。虽然从其它流行指标来看,RapidMiner 击败了与之极为相似 KNIME,但 KNIME 的岗位需求比 RapidMiner 多约 50%。Alteryx 也是一个工作流工具,不过它有 901 个岗位需求,因此它出现在图 1a 中,没与这些小众软件列在一起。

图 1b. 低于 250 个岗位需求的小众数据科学软件岗位数量

图 1b 的数据规模比较小,看起来近似于 0 的数据其实就是 0。Systat 以下的软件岗位需求都未超过 10 个。

特别需要说明的是,图 1a 与 1b 里显示的都是单时间点上的值。即便最流行的软件,其岗位需求的数字每天变化也不是非常显著。因此,图 1a 里显示的排名在未来一两年内发生变化的可能性不大。对于图 1b 中的小众软件而言,它们的岗位需求数量很少,每个月的排名都可能会有变化,但相对于主流软件而言,它们会一直留在低位。

图 1c. 2017年 至 2019 年岗位需求变化百分比(仅为 2017 年岗位需求大于 100 个的软件)

接下来,我们看一下 2017 年到 2019 年的岗位数据变化。图 1c 显示了 2017 年至少有 100 个岗位需求的软件的变化百分比。没有这种限制的话,所列的软件数量会增加 5 倍,但其绝对值极小,就算列出来也没有什么意义。岗位需求升温的软件在图中显示为红色,反之,需求减少的颜色为蓝色。

谷歌推出的深度学习框架 TensorFlow 增长最快,共增长了 523%。增长第二快的是 Apache Flink,这是一种分析流数据的工具,增长了 289%。位列第三的是 H2O,增长了 150%。Caffe 是另一种深度学习框架,增长了 123%,这点反映了人工智能算法的流行趋势。

Python 虽然只有 97% 的增长率,但这是因为它的基数大。Python 增加了 13,471 个岗位,这一数字超过了所有其它软件的增量总和!

Tableau 的增长率与 Python 类似,不过它的岗位增加数量较少,只有 4,784 个。

从 Julia 向下,可以看出增长幅度缓慢下降。让我感到诧异的是 SAS 与 SPSS 的岗位需求虽然仅有 6% 与 1% 的增长,但居然仍有增长。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,425评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,058评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,186评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,848评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,249评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,554评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,830评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,536评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,239评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,505评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,004评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,346评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,999评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,060评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,821评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,574评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,480评论 2 267

推荐阅读更多精彩内容