kubernetes 运行AI任务实践 资料下载

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 分享嘉宾 徐晓舟 2015年加入阿里巴巴基础产品事业部-容器平台-容器服务高级开发工程师多年容器平台产品开发经验目前主要负责参与Kubernetes专有云与Kubernetes深度学习解决方案的研发工作 主题介绍 Kubernetes与深度学习介绍 阿里云的Kubernetes深度学习解决方.

分享嘉宾

徐晓舟 2015年加入阿里巴巴
基础产品事业部-容器平台-容器服务高级开发工程师
多年容器平台产品开发经验
目前主要负责参与Kubernetes专有云与Kubernetes深度学习解决方案的研发工作

主题介绍

  1. Kubernetes与深度学习介绍
  2. 阿里云的Kubernetes深度学习解决方案
  3. Kubeflow社区与阿里云的Kubernetes深度学习工具:Arena
  4. 场景最佳实践:

    1. GPU 共享
    2. GPU 监控
    3. GPU 与弹性结合

回放视频

观看地址:https://yq.aliyun.com/live/1004

PPT精彩一览

1

PPT下载

下载地址:https://yq.aliyun.com/download/3526

下期直播

直播主题:GitOps:Kubernetes多集群环境下的高效CICD实践

直播嘉宾:流生——阿里云容器服务高级开发工程师
直播时间:4月25日
直播主题:阿里云容器服务的优势和调优
直播嘉宾:郭旭东——云栖社区特邀嘉宾
直播时间:4月26日

Kubernetes社区大群欢迎你

进群方式:
1.点击链接即可入群:https://dwz.cn/G2EELckH
2.扫描下方二维码进群
k8_

相关实践学习
巧用云服务器ECS制作节日贺卡
本场景带您体验如何在一台CentOS 7操作系统的ECS实例上,通过搭建web服务器,上传源码到web容器,制作节日贺卡网页。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
打赏
0
0
0
0
79591
分享
相关文章
Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务
Multi-Agent Orchestrator 是亚马逊开源的多智能体框架,能够动态分配代理、维护上下文、支持多种代理类型,适用于客户服务、智能交通、物流配送等复杂场景。
71 9
Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务
Browser Use:40.7K Star!一句话让AI完全接管浏览器!自动规划完成任务,多标签页同时管理
Browser Use 是一款专为大语言模型设计的智能浏览器自动化工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。
561 21
Browser Use:40.7K Star!一句话让AI完全接管浏览器!自动规划完成任务,多标签页同时管理
打破资源边界、告别资源浪费:ACK One 多集群Spark和AI作业调度
ACK One多集群Spark作业调度,可以帮助您在不影响集群中正在运行的在线业务的前提下,打破资源边界,根据各集群实际剩余资源来进行调度,最大化您多集群中闲置资源的利用率。
ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践
本文介绍了如何利用阿里云容器服务ACK推出的ACK Gateway with AI Extension组件,在Kubernetes环境中为大语言模型(LLM)推理服务提供智能路由和负载均衡能力。文章以部署和优化QwQ-32B模型为例,详细展示了从环境准备到性能测试的完整实践过程。
Mahilo:多智能体实时协作框架开源!人类与AI无缝交互,复杂任务一键协同
Mahilo 是一个灵活的多智能体框架,支持创建与人类互动的多智能体系统,适用于从客户服务到紧急响应等多种场景。
99 2
Mahilo:多智能体实时协作框架开源!人类与AI无缝交互,复杂任务一键协同
ACK Gateway with AI Extension:大模型推理的模型灰度实践
本文介绍了如何使用 ACK Gateway with AI Extension 组件在云原生环境中实现大语言模型(LLM)推理服务的灰度发布和流量分发。该组件专为 LLM 推理场景设计,支持四层/七层流量路由,并提供基于模型服务器负载感知的智能负载均衡能力。通过自定义资源(CRD),如 InferencePool 和 InferenceModel,可以灵活配置推理服务的流量策略,包括模型灰度发布和流量镜像。
OctoTools:斯坦福开源AI推理神器!16项测试准确率碾压GPT-4o,一键搞定复杂任务
OctoTools 是斯坦福大学推出的开源智能体框架,通过标准化工具卡片和自动化工具集优化算法,显著提升复杂推理任务的解决效率,支持多领域应用。
88 3
OctoTools:斯坦福开源AI推理神器!16项测试准确率碾压GPT-4o,一键搞定复杂任务
Nanobrowser:开源版OpenAI Operator!AI自动操控浏览器,复杂网页任务一键搞定
Nanobrowser 是一款开源的 Chrome 扩展工具,基于多智能体系统实现复杂的网页任务自动化,支持多种大型语言模型,完全免费且注重隐私保护。
198 1
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明

相关产品

  • 容器服务Kubernetes版