数据分析师的必读书单

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

有不少人留言希望我推荐数据分析的书单,刚好即将春节,无论是假日学习还是年后,都值得充电。读书最好的时候是学生时期,其次是现在。内容按照 《如何七周成为数据分析师 》 的顺序。

数据分析师的必读书单

数据分析是一门专业且跨越多个领域的学科,虽然我每篇公众号都足够篇幅(乃至我自己觉得啰嗦),可我还是得承认存在缺漏。如果有好书作为参考,对数据分析能力的成长更有帮助。

这份书单权作入门级推荐,如果大家有更好的欢迎留言说明。我不能保证全部看过,毕竟基础书没必要看几本,但我尽量做到客观。建议大家根据自己基础挑选,不要贪多。

大家多支持正版。

Excel

《谁说菜鸟不会数据分析》

数据分析师的必读书单

知名度比较高的一套书,适合新手,优点是它和数据分析结合,而不是单纯地学习函数。学会函数适用的场景和过程比它本身更重要。

是否需要学习VBA是仁者见仁的答案。我个人不建议。Excel VBA的最大优势是适用性广,哪怕去其他行业其他职位,都离不开Excel,这时候它就是一个工作加分的亮点。但是在互联网行业,对数据分析师,VBA的性价比就不高了。

这里只推荐一本,因为我就翻过上面这本,还没全看…

数据可视化

数据可视化的书不多。市面上多以编程为主,面向新手和设计的教程寥寥无几。 如果只是了解图表,看Excel的书籍也管用。

数据分析师的必读书单

内容很丰富,涉及可视化的方方面面,也囊括更类编程语言和设计软件:Python+JS+R+Excel。作者还有另外一本书《数据之美》。

可视化是一门侧重灵感的学科,有一种入门技巧是从他人设计中学习,从模仿开始,了解他人是如何设计的,这个网络上有大量的信息图可以参考。当然数据分析师更需要的是如何发现,别只学习展示。

英文足够好,可以看Edward Tufte的著作:《The Visual Display of Quantitative Information》、《Envisioning Information》、《Beautiful Evidence》。他是数据可视化的领军人物,他的理念是反对为艺术效果而混淆或者简化数据。暂时没有中文版。

分析思维

《金字塔原理》

数据分析师的必读书单

分析思维首推《金字塔原理》,金字塔原理有些人说它晦涩难懂,我认为是芭芭拉这个老太有骗稿费之嫌,本书包含了报告、写文、演讲等诸多内容。可以细看可以快看。另外还有一本同名案例集,有兴趣可以买。

另外麦肯锡相关的书籍还有《麦肯锡意识》《麦肯锡工具》《麦肯锡方法》等。

《深入浅出数据分析》

数据分析师的必读书单

深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。

《精益数据分析》

数据分析师的必读书单

国外的精益系列一直以互联网创业作内容导向,本书也属于此类。如果是互联网行业相关,可以看看。它介绍了不同领域的指标,以及产品不同时期的侧重点。案例都是欧美,这部分做参考用。

接下来的几本,是兴趣向读物。《黑天鹅》能拓展思维,讲叙了不确定性。《思考的技术》,大前研一的著作,也是咨询类经典。如果对咨询向的分析感兴趣,还可以看BCG系列,或者刷CaseBook。《批判性思维》,则是教你如何形成理性思维。

SQL

数据库有很多种,常见有Oracle,MySQL,SQL Server等。我推荐学习MySQL,这是互联网公司的主流数据库。以后学习Hadoop生态时,MySQL也是最接近Hive语法的语言。

MySQL不需要专门看书学习,因为数据分析师以查询为主,不需要考虑数据性能、数据安全和架构的问题。使用搜索引擎能解决90%的问题,我就是w3cschool学的。

《MySQL必知必会》

数据分析师的必读书单

如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的。

如果想深入,可以看《高性能MySQL》,对分析师没啥用。至于另外一个方向NoSQL,对入门者还是小众了些。

如果有余力,就学习正则表达式吧,清洗数据的工作就靠它了。

统计学

统计学是比较大的范围,分析师往后还需要学线性代数和矩阵、关系代数等。初学者不需要掌握所有公式定理的数学推导,懂得如何应用就行用。

《深入浅出统计学》

数据分析师的必读书单

大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。书本注重应用和趣味性,数学推理一般。

《商务与经济统计》

数据分析师的必读书单

国外的经典教材,已经出到第十二版了。国外教材都有丰富有趣的案例,所以读起来会比国内的轻松不少。如果你还在读书,不妨买这本看一看。

名字既然有商务与经济,所以书中辅以了大量的相关案例。书内容很多,看起来不会快,适合细读。

《The Elements of Statistical Learning》

数据分析师的必读书单

稍微有一些难度的英文书籍,属于进阶版统计学,国外很推崇。如果要往机器学习发展,这本书可以打下很好的基础。

以上书籍的难度是逐步递增的。统计学是机器学习的基础,是概率、矩阵等实际应用。现在已经有很多统计工具,Excel的分析工具库、传统行业的SPSS、SAS以及R、Python等,使用过程都不用计算推导,大学考试才会考,现在都是计算机解决,轻松不少。

业务知识

不同领域的业务知识都不一样,这里以互联网举例。

《增长黑客》

数据分析师的必读书单

增长黑客的概念就是随着这本书的畅销传播开来。增长黑客在国内即是数据分析+运营/产品的复合型人才。这本书好的地方在于拓展思路,告诉我们数据能够做什么,尤其是连AB测试都不清楚的新人。

实际涉及的业务知识不多,我推荐,是希望新人能够了解数据驱动的概念,这本算是我走上数据化运营的启蒙读物了。

《从零开始做运营》

数据分析师的必读书单

知乎亮哥的书籍,互联网所有的数据都是和运营相关的,如果是新手,就以此学习业务知识。如果已经工作很多,就略过吧。

《网站分析实战》

数据分析师的必读书单

互联网不再是网站的天下,但是移动端依旧有Web,我们在朋友圈看到的所有H5活动、第三方内容等,都是依托网页实现。网站的数据分析依旧有存在空间,网站的数据指标还是能够指导我们运营。

《数据挖掘与数据化运营实战》

数据分析师的必读书单

这本书涉及了数据挖掘,但是比较浅,可以作为数据分析师视野的承上启下,了解数据化运营的高级应用。特点是以阿里的实际工作相结合,可又因为保密原则不够详尽。

《数据实践之美》

数据分析师的必读书单

是各领域专家众筹完成的书本,比起传统的书籍,囊括范围更广。虽然没有深度讲解技术,但是各领域的案例都是一手资料,对业务的触类旁通理解有帮助。

业务知识我不再多推荐,以后我会通过公众号文章的形式讲解。因为从我看来,市面上也没有详尽介绍数据角度下的用户行为、产品运营的书籍,都是点到为止。这一块内容,尽量从工作中去学,收获才是最大的。

Python/R

欢迎来到数据分析的最后殿堂,Python和R都是大分支,基本是前面所有内容的实现。Python的学习以PY3为前提,毕竟2017年了,我实在想不出不用Python3的理由。

除了书籍,Python/R更多依靠博客和文档学习。Python的学习路径不陡峭,新手水平取决于查询能力,所以也请学会如何高效搜索。

《深入浅出Python》

数据分析师的必读书单

还是深入浅出系列,完全适合零基础的新人。需要注意的是,编程学习不同于其他知识,如果计算机基础不稳固,在使用中会遇到各类问题。知其然不知其所以然,这是本书缺点:能掌握,但是Bug比较多。

《Python学习手册》

数据分析师的必读书单

对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。这是纸质书比电子书好的优势之一。

《利用Python进行数据分析》

数据分析师的必读书单

非新手向的书籍,成书较早,部分内容比较老旧。虽然学习中不会有问题,但很多Pandas函数已经有更优雅的写法了,例如df.query。每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。

《Python Cookbook》

数据分析师的必读书单

Python的进阶书,如果想要掌握更好的编程能力,这是一本经典,值得时时翻阅。注意,它更偏向程序员。

《R语言实战》

数据分析师的必读书单

R语言的入门书籍,从数据读取到各类统计函数的使用。虽然没有涉及机器学习,依靠这本书入门R是绰绰有余了。

《统计学:从数据到结论》

数据分析师的必读书单

这本书是将R语言和统计学结合的教材,可以利用这本书再复习一遍统计知识。缺点是书本后面的内容质量不如前部分。

到这里,入门书籍推荐完毕,当然好书不嫌多,例如《数学之美》、《集体智慧编程》、《统计学习方法》等,有兴趣不妨阅读。

上面的内容都吃透,不论是成为一名数据分析师,还是往后向机器学习、数据科学家、数据产品发展、都有了良好的基础。

希望你能沉下心阅读。


本文作者:秦路

来源:51CTO

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3月前
|
机器学习/深度学习 算法 搜索推荐
数据分析师的职业规划与参考资料
数据分析师的职业规划与参考资料
|
SQL 分布式计算 搜索推荐
3道数据分析师面试题实录
今天参加了一场数据分析师面试,遴选3道记录以资后鉴。
153 0
3道数据分析师面试题实录
|
SQL 数据挖掘 大数据
数据分析转型大数据开发,说说我的求职心酸之路
数据分析转型大数据开发,说说我的求职心酸之路
|
SQL 数据采集 人工智能
Interview:人工智能&大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略(一)
Interview:人工智能&大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略
|
人工智能 数据挖掘 大数据
Interview:人工智能&大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略
Interview:人工智能&大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略
Interview:人工智能&大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略