初学数据分析不得不看的书有哪些?

最近有不少同学反应书单也看了很多了,但是还是不知道如何来开始,这是因为没有告诉初学者如何来使用这些书单,所以来小小的补充下。这里对于初学者来学习,我们分为六个阶段来进行,另外推荐的书单和辅助视频都给大家准备好了,大家可以在文中获取哈

第一阶段:EXCEL

这个是适合对数据分析刚产生萌芽并且从来没有接触过数据分析的同学,来入门是比较合适的。刚开始学习的时候需要先理解数据分析的思维,然后多观察生活周边的事务尝试着自己来分析。经典入门书,主要是用excel来处理的数据、进行的可视化,很方便大家直接来操作


在这个阶段顺便给大家一个辅助学习的excel 视频,大家可以跟着多多练习下。跟王佩丰学Excel视频教程

第二阶段:SQL

我们对excel 有个初步了解并且使用之后,接下来快来学习下工作中常用的SQL技能,这是因为公司里的数据都是放到数据库中的,如果大家面试了数据分析职位,只是使用excle来用处理,甚至数据库权限都没有的话,建议不要去就职,这样的职位含金量是不高。

一般大家使用最多的是下面两本《MySQL必知必会》和《SQL必知必会》。这里大家选择一本就好了,给大家找到了《MySQL必知必会》,可以先从这个来开始

刚学习下SQL的时候,建议大家还是要看些视频的,因为一开始肯定对书本上的内容感觉到枯燥,毕竟是没有操作哈,所以还是跟着视频来模仿进行比较好,这样也是有成就感的

另外大家工作之后或者感觉上面的sql内容没有难度的话,就看看最贴近工作中sql查询的书籍把


sql视频快来拿走吧!

第三阶段:业务知识

先来给大家推荐一本运营书籍,为什么这里给大家来推荐运营书籍呢?其实数据分析师在工作中打交道最多的就是运营同学了,我们要和他们一起努力提高运营效果,提高业绩。比如说运营同学做一个促销活动,但是要知道活动的效果是怎么样的,就是需要我们来分析下了呢。


这个是有两本的,分为上下两册。第一册是运营的入门以及运营和数据的关系;第二册是讲了用户运营、活动运营和会员运营。建议大家第一册只阅读数据相关的就好,第二册阅读用户运营、活动运营和会员运营部分,主要目的是让我们能够理解运营的一些数据指标

《数据化管理:洞悉零售及电子商务运营》讲述了两个年轻人在大公司销售、商品、电商、数据等部门工作的故事,通过大量案例深入浅出地讲解了数据意识和零售思维。作者将各种数据分析方法融入到具体的业务场景中,最终形成数据化管理模型,从而帮助企业提高运营管理能力。对于这本书建议大家要放到床头慢慢来读,越品越有价值,符合真香定理

近来又帮助大家找到一个好书籍《如何用数据解决实际问题》。这个书通过一个生活中很常见的案例来和大家阐述数据分析的过程:
a.找到分析问题的关键;b.锁定原因;c.指定对策;d:如何用数据讲个故事向领导汇报

业务书籍快来拿走吧!

第四阶段:可视化

学习数据库的操作大家能够知道如何进行查询和处理数据,学习业务知识大家能够有分析体系来衡量业务的发展情况,为了能够展示我们的分析结果,一个顺手的可视化软件是必不可少的。一般大家经常用的是tableau 和powerbi 这两款软件。对于初者先学习一个为好,因为powerbi 的免费版的能够发布自己做的内容到官网上,这对我们找工作展示给面试官很有帮助的,所有给大家推荐下powerbi 的使用。本来想和大家推荐使用这方面的书籍的,但是官网写的太棒了,有一步步的学习指导、有关键知识视频讲解,最重要的还有分析案例让大家来把玩一下

powerbi下载链接

powerbi学习链接

第五阶段:python

第五阶段主要来学习python的内容,至于为什么要学习这个呢,大家可以暂时理解为有些复杂操作是用sql和excel 处理实在是太麻烦了。人生苦短,快用python哟!下面给大家推荐两本数据分析同学常用的python书籍。这个和学习sql是一样,一上来就看书本不一定能够消化,建议和视频来一起学习


python视频快来拿走吧!

第六阶段:统计学和机器学习

统计学有什么用呢?给大家一个学习统计学的理由就是面试的时候要求统计学和机器学习内容。
最后再给大家一个学习的动力,通过学习统计学能够明白生活中的更多真相,来把,先从下面的这本来开始喽。


如何深入学习统计学?
前面的书让你知道了学习的意义是什么,具备了统计学思维。接下来,就可以进一步学习统计学在数据分析中是如何使用的

如果你是零基础,《深入浅出统计学》可以让你轻松愉快的学会,书里面有通俗易懂的案例,图文并茂,学习统计学不会那么枯燥

统计学方法详细介绍支持向量机、Boosting、最大熵、条件随机场等十个统计学习方法。

机器学习全书共16 章,大致分为3 个部分:第1 部分(第1~3 章)介绍机器学习的基础知识;第2 部分(第4~10 章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等.建议大家先学习前两部分

上面两本书基本是学习机器学习或者数据挖掘的同学人手一本的书籍。大家学习的时候先学习一个就好

上面四本书籍快来拿走吧!

推荐阅读更多精彩内容