独家 | 用Python Featuretools库实现自动化特征工程(附链接)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

独家 | 用Python Featuretools库实现自动化特征工程(附链接)

技术小能手 2018-11-02 13:52:04 浏览6305
展开阅读全文

简介

在机器学习黑客马拉松和竞赛中,特征工程的质量通常是进入排行榜10强和无缘50强的重要区别,因此,所有参赛过的人都可以证明特征工程的重要性。

自从我意识到特征工程具有巨大的潜力以来,我一直是它的大力倡导者。但当手动完成时,这可能是一个缓慢而艰难的过程。我必须绞尽脑汁来思考有哪些特征存在,并从不同的角度分析它们的可用性。现在,整个FE(Feature Engineering,特征工程)流程都可以实现自动化,我将在本文中向您展示。

0cb6c2e2ac08e83dc3b6e1061e2d63498acefc20

我们将使用一个名为Featuretools的Python特征工程库,来实现这一流程。但是在深入研究之前,我们首先了解下FE的基本组成部分,并用直观的示例理解它们,最后利用BigMart Sales数据集来深入了解自动化特征工程这一精彩世界。

目录

1. 什么是特征?

2. 什么是特征工程?

3. 为什么需要特征工程?


网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属团队号: 数据派THU