解决机器学习问题有通法!看这一篇就够了!

  1. 云栖社区>
  2. 大数据文摘>
  3. 博客>
  4. 正文

解决机器学习问题有通法!看这一篇就够了!

技术小能手 2017-09-19 16:48:13 浏览3480
展开阅读全文

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

大数据文摘作品

作者:Abhishek Thakur

编译:Cathy,黄文畅,姜范波,寒小阳

前言

本文由Searchmetrics公司高级数据科学家Abhishek Thakur提供。

一个中等水平的数据科学家每天都要处理大量的数据。一些人说超过60%到70%的时间都用于数据清理、数据处理及格式转化,以便于在之后应用机器学习模型。这篇文章的重点便在后者—— 应用机器学习模型(包括预处理的阶段)。此文讨论到的内容来源于我参加的过的数百次的机器学习竞赛。请大家注意这里讨论的方法是大体上适用的,当然还有很多被专业人士使用的非常复杂的方法。

接下来会使用到python。

数据

在应用机器学习模型之前,所有的数据都必须转换为表格形式。如下图所示,这个过程是最耗时、最困难的部分。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

转换完成之后,便可以将这些表格数据灌入机器学习模型。表格数据是在机器学习或是































网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 大数据文摘