数加平台在数据挖掘项目中的实践

  1. 云栖社区>
  2. 阿里云MVP>
  3. 博客>
  4. 正文

数加平台在数据挖掘项目中的实践

周公解闷 2019-01-24 13:45:15 浏览1648
展开阅读全文

目录

  1. 背景
  2. 数据源
  3. 数据处理
  4. 模型训练及预测
  5. 数据可视化
  6. 总结

1. 背景

返回目录

随着越来越多的公司开始重视数据的积累和产品的敏捷开发,数据量的不断增加和开发周期的不断缩短,就形成了一对明显的矛盾。所以一些列高效的开发工具,就变得尤为重要。

对于业务数据已经上云的企业来讲,阿里云的数加平台就提供了一套高效的云上开发平台。本文通过数据挖掘业务的处理流程,简单介绍一下数加平台中各主要工具在数据挖掘项目中的实践。

2. 数据源

返回目录

数加平台可以通过【数据集成】工具,将保存在阿里云上不同类型数据库中(例如RDS等)的数据同步到数加平台的【DataHub】中,也支持将本地客户端的数据上传到【DataHub】中。如下图所示。

数据集成工具
dataSource_1

3. 数据处理

返回目录

数加平台的数据处理工具相对比较丰富,喜欢使用IntelliJ这类静态编译IDE的小伙伴,可以使用Max

网友评论

登录后评论
0/500
评论
周公解闷
+ 关注
所属云栖号: 阿里云MVP