1. 云栖社区>
  2. 全部标签>
  3. #Kubeflow#
Kubeflow

#Kubeflow#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

像Google一样构建机器学习系统 - 在阿里云上搭建Kubeflow Pipelines

谈到机器学习工作流平台,Google的工程经验非常丰富,它的TensorFlow Extended机器学习平台支撑了Google的搜索,翻译,视频等核心业务;更重要的是其对机器学习领域工程效率问题的理解深刻,

机器学习 集群 容器 云盘 控制台 google GPU github kubernetes 工作流 Kubeflow

像Google一样构建机器学习系统2 - 开发你的机器学习工作流

按照上篇文章搭建了一套Kubeflow Pipelines之后,我们一起小试牛刀,用一个真实的案例,学习如何开发一套基于Kubeflow Pipelines的机器学习工作流。 准备工作 机器学习工作流是一个任务驱动的流程,同时也是数据驱动的流程,这里涉及到数据的导入和准备,模型训练Checkpoint的导出评估,到最终模型的导出。

python 机器学习 code 容器 Image aliyun pipeline google 分布式存储 Commit curl kubernetes 工作流 Kubeflow

Kubeflow实战系列:阿里云上小试TFJob

`tf-operator`是Kubeflow的第一个CRD实现,解决的是TensorFlow模型训练的问题,它提供了广泛的灵活性和可配置,可以与阿里云上的NAS,OSS无缝集成,并且提供了简单的UI查看训练的历史记录。

配置 集群 metadata TensorFlow kubernetes Kubeflow

谷歌开发的 Kubeflow 工具集亮相 DockerCon ,机械学习从此开始!

DockerCon 的闭幕演讲通常是最精华的演讲。今年,我们将带来了三款非常优秀的工具,向所有 Docker 爱好者展示 Docker 的创新用途。

docker 机器学习 ScreenShot 创新 容器技术 Kubeflow

浅尝Kubeflow系列:阿里云上小试TFJob

## 介绍 本系列将介绍如何在阿里云容器服务上运行[Kubeflow](https://github.com/kubeflow/kubeflow), 本文介绍如何使用`TfJob`运行模型训练。 ## TFJob简介 模型训练是机器学习最主要的实践场景,尤其以使用机器学习框架TensorFlow进行模型训练最为流行,但是随着机器学习的平台由单机变成集群,这个问题变得复杂了。GPU

阿里技术协会 配置 集群 metadata Kubeflow

1
GO