利用Python进行数据分析（第二版）早鸟版介绍-阿里云开发者社区

利用Python进行数据分析（第二版）早鸟版介绍

2017-08-06 2604

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 暑期回家学车的时候，我为了保持自己的学习状态，于是去看《利用Python进行数据分析》。为了能够运行书上的代码，我去GitHub上下载它们随书数据，不经意间发现这本书要在今年10月份出第二版了，图书地址是http://shop.oreilly.com/product/0636920050896.do。

暑期回家学车的时候，我为了保持自己的学习状态，于是去看《利用Python进行数据分析》。为了能够运行书上的代码，我去GitHub上下载它们随书数据，不经意间发现这本书要在今年10月份出第二版了，图书地址是http://shop.oreilly.com/product/0636920050896.do。感谢搜索引擎，我下载到了early bird version，等出正式版的时候，我再去美亚买.

第一版发行的时候是2012年，差不多5年前了，这期间Python的开源数据分析库发展势头迅猛，作者开发的pandas也增加了许多新的功能。为了适应这种变化，他对第一版进行了大刀阔斧的修改，于是就有了第二版。

作者简介

Wes McKinney 资深数据分析专家，对各种Python库（包括NumPy、pandas、matplotlib以及IPython等）等都有深入研究，并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章，被各大技术社区争相转载，是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库——pandas，广获用户好评。在创建Lambda Foundry（一家致力于企业数据分析的公司）之前，他曾是AQR Capital Management的定量分析师

第一版的评价

《利用Python进行数据分析》中文版第一版由机械工业出版社发行在2013年，到现在已经4年过去。豆瓣评分8.5分，京东好评率98%，摘取一段豆瓣书评，

总的来说Python提供了很多方便，但是这种方便还是需要付出一定的学习成本的。使用Pandas可以把Python基本当作R用用NumPy和SymPy还有SciPy把Python当作Matlab用。但是目前所有这些模块都还在开发阶段所以有很多问题需要解决，用户体验并不是非常友好，尤其是数据类型和能否改变数据值等等细节会让人特别累

四年过去了，书评说的问题大部分都被解决了。但是我个人建议，最好是一边学习概率论和统计分析的同时学习R和Python，毕竟工具都是类似的，解决问题的思路或许更重要。

主要变动

所有代码（包括Python教程）都升级到了Python3.6。第一版用的是Python2.7
更新Python安装介绍，改用Anaconda以及其他所需包，之前是Enthought Python Distribution
更新为2017年释放的pandas 1.0
新增了“pandas高级应用”，之前只有“Numpy高级应用”
简单介绍了如何使用statsmodel和scikit-learn

全书框架：

整本书大框架没有太多修改，部分章节与时俱进的被淘汰了，部分章节由于内容增加被拆分了。

前言：缅怀John D. Hunter, 他开发了matplotlib，建立了良好的Python社区。
PS: 早鸟版还没有写致谢呢。
第一章：准备工作，介绍为什么使用Python，以及如何在不同机器上安装Python。
第二章：Python语法基础： IPython和Jupyter notebook. 这一节介绍Python的基本语法（原本是放在附录）和Ipython基本用法（高级用法被放在附录了）
第三章：内置数据结构，函数和文件系统
第四章： Numpy基础
第五章： pandas起步
第六章：数据加载，存储和文件格式
第七章：数据清洗和准备
第八章：数据规整化：Join（连接）, combine（合并）, reshape（重塑）
第九章：绘图和可视化
第十章：数据聚合和分组运算
第十一章：时间序列
第十二章： Numpy高级应用

放弃第一版的引言一章，对于初学者这是一个巨大的改进，我当年没基础一看就懵了。在介绍Numpy之前放了Python语法基础，更加的新手友好了。第七章和第八章是由之前的一章拆分出来。

我的感想

仅仅从目录上看，这一版本其实对于初学者而言，其实是更加友好的，当然目前是英文，对于英文不好的同学不太友好。不过如果你想从事数据分析，那么英文水平必然要提高，不然等别人翻译官方文档，新的特性也就过时了。

纠结Python2和Python3的初学者也不需要太纠结，如果你要进行数据分析，你要用的Python包都已经有python3版本，也就是说整个Python社区正在慢慢向Python3迁移。

利用Python进行数据分析（第二版）早鸟版介绍

作者简介

第一版的评价

主要变动

全书框架：

我的感想

热门文章

最新文章

相关课程

相关电子书

相关实验场景