数据科学究竟是什么?

  1. 云栖社区>
  2. 翻译小组>
  3. 博客>
  4. 正文

数据科学究竟是什么?

【方向】 2018-09-10 09:50:51 浏览1256
展开阅读全文

screenshot

数据科学是一门将数据变得有用的学科。它包含三个重要概念:

  1. 统计
  2. 机器学习
  3. 数据挖掘/分析

数据科学的定义

如果你回顾一下数据科学这个术语的[早期历史](),会发现有两个主题密切相连:

  1. 大数据意味着计算机的使用频率增加。
  2. 统计学家很难将纸张上所写算法用计算机实现。

由此,数据科学得以出现。早先,人们将数据科学家视作会编码的统计学家。如今看来,这种说法并不准确,首先让我们回到数据科学本身。

screenshot
推特给出的定义circa 2014

2003年,《数据科学杂志》曾提出:“所谓的‘数据科学’,指的是那些任何与数据相关的内容”。对此,我表示赞同,现在一切都无法与数据分割。

之后,对数据科学的定义便层出不穷,例如Conway的维恩图,以及Mason和Wiggins的经典观点。

screenshot
Drew Conway对数据科学的定义

维基百科上对数据科学的定义更接近于我给学生讲授的内容:

数据

网友评论

登录后评论
0/500
评论
【方向】
+ 关注
所属云栖号: 翻译小组