独家 | 用于数据清理的顶级R包(附资源)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

独家 | 用于数据清理的顶级R包(附资源)

子夜初商南 2019-08-22 23:41:24 浏览278
展开阅读全文

作者:Anna Kayfitz,CEO of StrategicDB Corp

文章来源:微信公众号 数据派THU

翻译:顾宇华

校对:杨光

----

确保数据干净整洁应该始终是数据科学工作流程中首要也是最重要的部分。

数据清理是数据科学家最重要和最耗时的任务之一。以下是用于数据清理的顶级R包。

image.png

每天有数百万或数十亿的数据元素进入您的企业,其中不可避免的存在一些缺乏建立高效业务模型的必要质量的数据元素。然而,确保数据干净整洁应该始终是数据科学工作流程中首要也是最重要的部分。因为没有它,您将很难看到重要的内容,并可能由于数据重复,数据异常或缺少信息等原因做出错误的决策。

R,作为一种能够应用于统计计算和图形的开源语言,是最常用和最强大的数据编程工具之一。R提供了创建数据科学项目所需的所有工具,但是不管利用任何一种工具,它只能做到提供它接受到的数据相

网友评论

登录后评论
0/500
评论
子夜初商南
+ 关注
所属云栖号: 数据派THU