成为一名数据分析师,应该掌握怎样的技术栈?

数据分析师是不易被人工智能取代的新兴职业,相比算法工程师、人工智能工程师而言比较好入门。学好数据分析,也可为进一步的数据科学、机器学习打下一定的基础。

最近我知乎了各种如何学习数据分析之类的话题,get到了许多打开数据分析的正确姿势,现在就好好归纳总结一哈。

一:编程能力

是否会编程是区别初级数据分析师和高级数据分析师的分水岭。在这里,我定位的是高级数据分析师,所以编程能力尤为重要,我把它放在了第一位。

有关数据分析的编程语言有Python和R语言。R语言倾向于统计分析、绘图等。统计学家或者学统计学的喜欢用R语言,而我推荐学习Python,因为Python是面向未来的语言,无论从流行度、可用性还是学习难度来讲,Python都是最好的入门语言。

当然,如果可以的话,再掌握一下R语言是最好不过的,学习嘛,永无止尽。

零基础学习Python可以看看:

廖雪峰老师的Python(入门)教程:http://www.imooc.com/learn/177

廖雪峰老师的Python(进阶)教程:http://www.imooc.com/learn/317

或者菜鸟教程上的Python教程:http://www.runoob.com/python/python-tutorial.html

或者W3Cschool上的Python教程:https://www.w3cschool.cn/python/

购买书籍的话,推荐《Python编程:从入门到实践》 豆瓣评分:9.0

当然,只有Python基础肯定是不够的,既然是学习数据分析,肯定就要有数据才行,数据从哪里来,肯定是从互联网上来。互联网上的信息何其之多,必须要对其加以过滤处理,提取我们想要的信息。这就要用到Python爬虫,这也是学Python一个很重要的目的和作用。

学习Python爬虫肯定比学习Python基础要困难一下,但好在网上的学习资源十分丰富,努力学习必定会有收获的。

关于Python爬虫的学习资源网上有很多,这里我推荐:

爬虫大神崔庆才的个人博客:http://cuiqingcai.com/,博客里面满满的Python爬虫教程,相当的厉害。

知乎大V:路人甲 ,他的专栏《学习编程》,关注人数达114k,里面有很多学习Python的资源和总结,相当的给力。

关于Python爬虫的书籍,目前我还没有较好的书籍推荐,如果说实在要推荐的话,我推荐三本书:

《Python网络数据采集》 豆瓣评分:7.7

《Python爬虫开发与项目实战》 豆瓣评分:8.1

《精通Scrapy网络爬虫》 这是十月份出的新书,豆瓣上还没有评分。

知乎里面有很多爬虫大神,没事多逛逛知乎总会有收获的。

关于编程能力,是一个很深的概念,需要靠大量的撸代码积累经验。先暂且说到这些。

二:SQL

学习数据分析,最难最重要的就是编程能力,熬过去了,后面的就稍微简单一些了。

既然是跟数据打交道,就免不了要使用数据库。

目前主要有四种数据库:

1:SQLite 是一个文件型轻量级数据库,它的处理速度很快,在数据量不是很大的情况下,可以使用SQLite。

2:MySQL 是一个应用极其广泛的关系型数据库,它是开源免费的,可以支持大型数据库,很多中小型企业都是用的MySQL。

3:MongoDB 是一个面向文档的非关系型数据库,它功能强大、灵活、易于拓展。

4:Redis 是一个使用ANSI C 编写的高性能key-value数据库,使用内存作为主存储器。

它们各有优点,可以灵活使用,如果说非要选一个的话,我建议使用MySQL,因为它使用最广泛。学习最主流的技术,可以在一定程度上发挥更大的作用。

关于SQL的学习资源:

推荐W3Cschool的SQL教程:https://www.w3cschool.cn/sql/

W3Cschool的MySQL教程:https://www.w3cschool.cn/mysql/

购买书籍推荐《SQL基础教程》作者:MICK

豆瓣评分:9.0,好像这本书出了第二版了,建议购买最新版的。

三:数据分析能力

前面说了那么多,都是为了数据分析做准备。数据分析就好比亲手做一顿美食,现在食材有了(通过Python爬虫采集),盛放美食的容器也有了(数据库)。现在就差开火做饭了,写到这感觉肚子饿了,哎呀,忍住。

对于数据分析,我还没有过多的涉足,总之,多看书,多做项目。

这里我推荐几本书(都是放在我购物车里还没有买的书)

学习数据分析必看的书单:

《Python数据分析基础》八月份的新书,豆瓣上还没有评分。

《利用Python进行数据分析》2013年的老书,豆瓣评分:8.5

《Python数据处理》六月份的新书,豆瓣上没有评分。

《用数据讲故事》 豆瓣评分:8.7

虽然我还没来得及看这几本书,但是我想认真看了之后,对于数据分析的理解肯定会更加深刻的。

四:数据可视化

现在美食做好了,但不能一股脑的装在碗里吧,美食讲究色香味俱全。所以要给它作一个漂亮的造型,呈现在客人面前。这就是数据可视化。

数据可视化需要借助工具,什么工具呢?那就是大名鼎鼎的tableau!

什么?你没有听说过tableau?现在听我说了也不迟,哈哈。

tableau是一款世界级的商业智能工具软件,tableau可以帮助我们快速的分析、可视化并分享信息。在福布斯2017年公布的《10大需求增长最快的职场技能》报告中,tableau高居第三,成为数据分析和可视化的职场必杀技。

说了这么多,咱们还是好好聊聊怎么学习tableau吧。tableau是一款收费软件,先看一下它的价格吧:

image

果然优秀的软件都是收费的,而且还贵的要死。

但是,tableau的良心之处在于:学生和教师可以免费使用tableau,只需要用我们的学生证信息去免费申请一个序列码,然后就可以下载激活该软件,有效期为1年,如果一年后还是学生的话,还可以用学生证再去申请一个序列号,然后再免费用一年。

tableau的下载地址:https://www.tableau.com/zh-cn/products/desktop/download

也可以自行百度,在其官网上利用学生证获取序列码。

如何学习使用tableau呢?这里我推荐两种方式:

1 观看其官网上的入门教学视频

image

共计80个学习视频。

2 购买书籍来学习:

推荐书籍《人人都是数据分析师:tableau应用实战》 豆瓣评分:7.3

努力通过以上学习,成为一名优秀的数据分析师就指日可待了。上面谈到的四点倾向于商业数据分析,对于数据挖掘方向,需要掌握更多的数学和统计知识。

学习之路漫漫,切记不可懈怠!

五:GitHub技能

GitHub可以说是每个程序员必须掌握的技能,在面试找工作的时候,有GitHub项目,或者为某GitHub开源项目贡献过源码都是面试的加分项。之所以把GitHub放在最后讲,是因为这不关乎数据分析的基础学习,而是每个从事IT行业的程序员的必备技能。

GitHub的学习可以看廖雪峰老师的GitHub教程:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000

讲的特别精炼。易于上手。

说了这么多,如果对你有一点的触动或者启发,那我写的这些就是很有意义了。

对于编程方面的书籍,我建议购买图灵丛书系列的,质量很高。对于各大出版社,个人认为:人民邮电出版社>清华大学出版社>机械工业出版社。买得一本好书,会让自己的学习更加顺畅,所以要仔细甄别。

当然:纸上得来终觉浅,绝知此事要躬行。一定要多练,多撸代码,不懂就看文档,问度娘。

共勉!

每天学习一点点,每天进步一点点。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,425评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,058评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,186评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,848评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,249评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,554评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,830评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,536评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,239评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,505评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,004评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,346评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,999评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,060评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,821评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,574评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,480评论 2 267

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 170,565评论 25 707
  • 【日精进打卡第134天】 姓名:潘艳 企业名称:青柠养车 组别271期谦虚1组 【知~学习】 《六项精进》大纲1遍...
    潘潘_8030阅读 204评论 0 0
  • 嗯哼,说好的一个月一篇还是没有做到啊,八月份的没有写出什么东西。也不能这么说吧,八月很忙,也写了一些,只是...
    你听得到K阅读 298评论 3 4
  • setTimeout("函数/代码",毫秒数,函数传递的参数) 只会执行一次 setInterval("函数/代码...
    Lucien_d70a阅读 198评论 0 0
  • 朗读《夜莺颂》节选,选自珍藏版《英国诗歌选集》 王佐良 金立群选编,金立群注释 选自约翰﹒济慈(1796-1821...
    Roena阅读 549评论 0 1