解锁云原生 AI 技能|在 Kubernetes 上构建机器学习系统

  1. 云栖社区>
  2. 阿里巴巴云原生>
  3. 博客>
  4. 正文

解锁云原生 AI 技能|在 Kubernetes 上构建机器学习系统

一绿舟 2019-07-23 17:44:13 浏览585
展开阅读全文

本系列将利用阿里云容器服务,帮助您上手 Kubeflow Pipelines.

介绍

机器学习的工程复杂度,除了来自于常见的软件开发问题外,还和机器学习数据驱动的特点相关。而这就带来了其工作流程链路更长,数据版本失控,实验难以跟踪、结果难以重现,模型迭代成本巨大等一系列问题。为了解决这些机器学习固有的问题,很多企业构建了内部机器学习平台来管理机器学习生命周期,其中最有名的是 Google 的 Tensorflow Extended, Facebook 的 FBLearner Flow, Uber 的 Michelangelo,遗憾的是这些平台都需要绑定在公司内部的基础设施之上,无法彻底开源。而这些机器学习平台的骨架就是机器学习工作流系统,它可以让数据科学家灵活定义自己的机器学习流水线,重用已有的数据处理和模型训练能力,进而更好的管理机

网友评论

登录后评论
0/500
评论
一绿舟
+ 关注
所属云栖号: 阿里巴巴云原生