带你和Python与R一起玩转数据科学: 探索性数据分析

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

带你和Python与R一起玩转数据科学: 探索性数据分析

技术小能手 2018-07-31 14:51:57 浏览2623
展开阅读全文

内容简介

本系列将介绍如何在现在工作中用两种最流行的开源平台玩转数据科学。本文先来看一看数据分析过程中的关键步骤 – 探索性数据分析(Exploratory Data Analysis,EDA)。

探索性数据分析发生在数据收集和数据清理之后,而在数据建模和分析结果可视化展现之前。然而,这是一个可反复的过程。做完某种EDA后,我们可以尝试建立一些数据模型或者生成一些可视化结果。同时,根据最新的分析结果我们又可以进行进一步的EDA,等等。所有的这些都是为了更快地找到线索,而不用纠结在数据细节和美观上。EDA的主要目的是为了了解我们的数据,了解它的趋势和质量,同时也是为了检查我们的假设甚至开始构建我们的假设算法。

了解了以上内容,我们将解释如何用描述统计学、基本绘图和数据框来回答一些问题,同时指导我们做进一步的数据分析。

准备数据

我们将继续使用

网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 数据派THU