从零开始用Python3做数据分析

  1. 云栖社区>
  2. 博客列表>
  3. 正文

从零开始用Python3做数据分析

异步社区 2018-05-19 13:36:46 浏览1054 评论0

摘要: 欢迎来到Python数据分析的世界!如今,Python已成为数据分析和数据科学事实上的标准语言和标准平台之一。我们将为读者展示一张思维导图,图1-1中将给出Python生态系统为数据分析师和数据科学家提供的各种程序库。

​点击关注 异步图书,置顶公众号

每天与你分享 IT好书 技术干货 职场知识


9ccc0ca9gy1frek2a8bl4j20u00f6jsv.jpg

参与文末话题讨论,每日赠送异步图书

——异步小编

​欢迎来到Python数据分析的世界!如今,Python已成为数据分析和数据科学事实上的标准语言和标准平台之一。我们将为读者展示一张思维导图,图1-1中将给出Python生态系统为数据分析师和数据科学家提供的各种程序库。NumPy、SciPy、Pandas和Matplotlib库共同构成了Python数据分析的基础,当前它们已经成为SciPy Stack 1.0的组成部分。在本文中,我们不仅会学习如何安装SciPy Stack 1.0和Jupyter Notebook,还将编写一些简单的数据分析代码,为后面的学习做好热身。

下面是Python生态系统为数据分析师和数据科学家提供的常用程序库。

●NumPy:这是一个通用程序库,不仅支持常用的数值数组,同时提供了用于高效处理这些数组的函数。

●SciPy:这是Python的科学计算库,对NumPy的功能进行了大量扩充,同时也有部分功能是重合的。Numpy和SciPy曾经共享基础代码,后来分道扬镳了。

●Pandas:这是一个用于数据处理的程序库,不仅提供了丰富的数据结构,同时为处理数据表和时间序列提供了相应的函数。

●Matplotlib:这是一个2D绘图库,在绘制图形和图像方面提供了良好的支持。当前,Matplotlib已经并入SciPy中并支持NumPy。

●IPython:这个库为Python提供了强大的交互式Shell,也为Jupyter提供了内核,同时还支持交互式数据可视化功能。我们将在本文稍后介绍IPython shell。

●Jupyter Notebook:它提供了一个基于Web的交互式shell,可以创建和共享支持可实时代码和可视化的文档。Jupyter Notebook通过IPython提供的内核支持多个版本的Python。本文稍后将会为读者进一步介绍Jupyter Notebook。 

对于本文而言,当需要安装软件时,我们会在恰当的时机给出相应的安装说明。在安装软件的过程中遇到困难或者不能断定最佳方案时,读者可以参考图1-1,这里提供了寻找解决问题所需辅助信息的指南。

9ccc0ca9gy1frgkd4mkkhj20u00pwgnt.jpg

​图1-1

本文将涉及以下主题。

●安装Python 3

●将IPython用作shell

●阅读手册页

●Jupyter Notebook

●NumPy数组

●一个简单的应用

●何处寻找帮助和参考资料

●列出Python库中的模块

●利用matplotlib可视化数据 

1.1 安装Python 3

本文所用软件都是基于Python 3的,所以必须首先安装Python 3。不