独家 | 2种数据科学编程中的思维模式,了解一下(附代码)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

独家 | 2种数据科学编程中的思维模式,了解一下(附代码)

技术小能手 2018-10-12 16:17:59 浏览862
展开阅读全文

数据科学的完整流程一般包含以下几个组成部分:

 ●  数据收集
 ●  数据清洗
 ●  数据探索和可视化
 ●  统计或预测建模

虽然这些组成部分有助于我们理解数据科学的不同阶段,但对于编程工作流并无助益。

通常而言,在同一个文件中覆盖完整的流程将会导致Jupyter Notebook、脚本变成一团乱麻。此外,大多数的数据科学问题都要求我们在数据收集、数据清洗、数据探索、数据可视化和统计/预测建模中切换。

但是还存在更好的方法来组织我们的代码!在这篇博客中,我将介绍大多数人在做数据科学编程工作的时候切换的两套思维模式:原型思维模式和生产流思维模式

原型思维模式强调

生产流思维模式强调

某部分代码的迭代速度

整体工作流程的迭代速度

更少的抽象

(直接修改代码和数据类型)

更多的抽象

(修改参数)

代码更松散

(模块化程度低)

代码更结构化

(模块化程度高)

帮助人们更

网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 数据派THU