《R语言数据分析》——第3章 数据筛选和汇总 3.1 去掉多余的数据

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《R语言数据分析》——第3章 数据筛选和汇总 3.1 去掉多余的数据

华章计算机 2017-05-02 12:11:00 浏览5822
展开阅读全文

本节书摘来自华章出版社《R语言数据分析》一书中的第3章,第3.1节,作者盖尔盖伊·道罗齐(Gergely Daróczi),潘怡 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第3章

数据筛选和汇总

当我们从平面文件或数据库(第1章),或直接通过某些API从Web(第2章)完成数据导入后,在开始实际的数据分析操作之前,经常会有必要对原始数据展开聚集、转换及筛选操作。

本章,我们将关注以下内容:

对数据框对象进行行或列筛选

对数据进行汇总和聚集

除了基础的R方法,掌握通过dplyr和data.table等包来优化数据预处理操作的性能

3.1 去掉多余的数据

尽管提前去掉多余数据能实现性能优化(参考1.3节以及1.4节),我们仍然会面临对已经导入到R的原始数据集进行筛选的需求,可以借助subset、which和[或[[操作符等R自带的传统

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属云栖号: 华章计算机