独家 | 一文读懂R中的探索性数据分析(附R代码)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

独家 | 一文读懂R中的探索性数据分析(附R代码)

技术小能手 2018-11-20 16:35:28 浏览909
展开阅读全文

探索性数据分析(EDA)是数据项目的第一步。我们将创建一个代码模板来实现这一功能。

简介

EDA由单变量(1个变量)和双变量(2个变量)分析组成。在这篇文章中,我们将回顾一些我们在案例分析中使用的功能:

 ●  第1步:取得并了解数据;
 ●  第2步:分析分类变量;
 ●  第3步:分析数值变量;
 ●  第4步:同时分析数值和分类变量。

基本EDA中的一些关键点:

 ●  数据类型
 ●  异常值
 ●  缺失值
 ●  数值和分类变量的分布(数字和图形的形式)

分析结果的类型

结果有两种类型:信息型操作型

 ●  信息型:例如绘图或任何长变量概要,我们无法从中过滤数据,但它会立即为我们提供大量信息。大多数用于EDA阶段。
 ●  操作型:这类结果可直接用于数据工作流(例如,选择缺失比例低于20%的变量)。最常用于数据准备阶段。

准备开始

如果您没有这些扩



网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 数据派THU