萧元 + 关注
阿里云高级开发工程师

萧元 发表了文章:

基于Kubernetes的云上机器学习—GPU弹性扩缩容

发布时间:2019-04-22 10:12:57 浏览:2325 回帖 :0

### 前言 在深度学习中,要使用大量GPU进行计算。 而GPU往往价格不菲,随着模型变得越复杂,数据量积累,进行深度学习计算需要耗费极大的经济和时间成本。 ### 解决方案 阿里云容器...

深度学习 阿里技术协会 配置 集群 容器 Image GPU kubernetes

萧元 发表了文章:

Nvidia GPU如何在Kubernetes 里工作

发布时间:2019-03-07 16:40:15 浏览:951 回帖 :0

# Nvidia GPU如何在Kubernetes 里工作 本文介绍Nvidia GPU设备如何在Kubernetes中管理调度。 整个工作流程分为以下两个方面: * 如何在容器中使用GPU ...

阿里技术协会 容器 plugin type GPU github kubernetes

萧元 发表了文章:

Kubernetes 调度器实现初探

发布时间:2019-01-31 15:16:41 浏览:2171 回帖 :0

### Kubernetes 调度器 Kubernetes 是一个基于容器的分布式调度器,实现了自己的调度模块。在Kubernetes集群中,调度器作为一个独立模块通过pod运行。从几个方面介绍Ku...

阿里技术协会 index github

萧元 发表了文章:

构建Tensorflow RDMA的Docker镜像

发布时间:2019-01-29 12:05:57 浏览:1482 回帖 :0

RDMA是一个远程通讯技术,它通过Kernel bypass等方式降低数据传输中的延迟和CPU消耗。 在分布式训练中,由于多个Worker之间或者Worker和Paramater Server 之间...

深度学习 分布式 docker ubuntu 阿里技术协会 镜像 容器 source

萧元 发表了文章:

Kubeflow Pipeline — 基于Kubernetes 的机器学习工作流

发布时间:2019-01-02 10:48:27 浏览:3135 回帖 :0

#### 介绍 Pipeline是Kubeflow社区最近开源的一个端到端工作流项目,帮助我们来管理,部署端到端的机器学习工作流。Kubeflow 是一个谷歌的开源项目,它将机器学习的代码像构建...

mysql 阿里技术协会 模块 容器 Image 同步 pipeline Workflow kubernetes 工作流

萧元 发表了文章:

在Kubernetes上使用RDMA

发布时间:2018-11-05 16:16:16 浏览:2679 回帖 :0

### RDMA RDMA(全称RemoteDirect Memory Access) 它为了解决网络传输中服务器端数据处理的延迟而产生。 它的原理是将待传输的数据从一台计算机的内存,直接传输...

docker ECS 阿里技术协会 集群 容器 Image cdn 控制台 metadata plugin 协议栈 kubernetes

萧元 发表了文章:

阿里云容器服务Kubernetes 基于GPU指标自动伸缩

发布时间:2018-10-19 10:51:00 浏览:2178 回帖 :0

### 基于GPU的指标扩缩容 在深度学习训练中,训练完成的模型,通过Serving服务提供模型服务。本文介绍如何构建弹性自动伸缩的Serving服务。 Kubernetes 支持HPA模...

监控 docker 阿里技术协会 配置 容器 metadata GPU Bash kubernetes

萧元 发表了文章:

基于阿里云容器服务监控 Kubernetes集群GPU指标

发布时间:2018-10-08 04:25:57 浏览:13501 回帖 :8

### 简介 当您在阿里云容器服务中使用GPU ECS主机构建Kubernetes集群进行AI训练时,经常需要知道每个Pod使用的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等...

萧元 发表了文章:

阿里云容器服务Kubernetes实现应用自动部署

发布时间:2018-08-22 16:25:15 浏览:2773 回帖 :0

## 前言 CICD是研发效率提升必不可少的一环, 要提高迭代效率,就要减少开发到部署中等待和人工操作的时间与步骤。 通过容器以及周边产品集成,我们更能将代码开发完成到部署时间极大缩短, 并将一切手...

阿里技术协会 镜像 集群 容器 Image 控制台 aliyun kubernetes

萧元 发表了文章:

如何设置 Kubernetes 资源限制

发布时间:2018-07-10 13:08:38 浏览:6137 回帖 :0

Kubernetes 作为当下最流行的的容器集群管理平台,需要统筹集群整体的资源使用情况,将合适的资源分配给pod容器使用,既要保证充分利用资源,提高资源利用率,又要保证重要容器在运行周期内能够分配到...

阿里技术协会 容器 Image request OOM CPU metadata kubernetes

萧元 发表了文章:

在容器中使用AliSQL

发布时间:2016-10-31 11:25:14 浏览:5569 回帖 :1

### AliSQL容器 #### ALISQL AliSQL是基于MySQL官方版本的一个分支,由阿里云数据库团队维护,目前也应用于阿里巴巴集团业务以及阿里云数据库服务。该版本在社区版的基础...

docker 阿里云 mysql 阿里技术协会 http WordPress 数据库 镜像 电商 容器 kernel tokudb Registry ATA 数据库与存储

萧元 发表了文章:

记一次在webx中velocity新建自定义指令的过程

发布时间:2016-08-15 09:41:11 浏览:3017 回帖 :0

### 记一次在webx中velocity新建自定义指令的过程 ![screenshot](http://img2.tbcdn.cn/L1/461/1/b59c6597d3f90168126d63e...

java 阿里技术协会

萧元 发表了文章:

Redis源码学习——BIO

发布时间:2016-08-01 14:00:01 浏览:4849 回帖 :0

## Redis源码学习之BIO BIO顾名思义,background IO,是redis中运行的后台IO。 网上千篇一律的说法是redis是单线程单进程。 实际上redis运行过程中并不是严...

数据存储与数据库 阿里技术协会 云数据库Redis版

萧元 发表了文章:

Redis源码学习——基础数据结构之SDS

发布时间:2016-07-13 15:12:57 浏览:2807 回帖 :0

###Redis数据结构-SDS Redis是一个开源(BSD许可),内存存储的数据结构服务器,可用作数据库,高速缓存和消息队列代理。 首先介绍下Redis的基础数据结构 —— SDS...

数据存储与数据库 阿里技术协会

Hello

感兴趣or擅长的领域:

更多>
k8s小能手
k8s小能手
文章:26丨 粉丝:43187丨 话题:0
必嘫
必嘫
文章:33丨 粉丝:42679丨 话题:1
易立
易立
文章:52丨 粉丝:44430丨 话题:0
更多>
游客lqa72byg3wyhm
游客lqa72byg3wyhm
文章:0丨 粉丝:0丨 话题:0
游客s2t3jd52lbp2m
游客s2t3jd52lbp2m
文章:0丨 粉丝:0丨 话题:0
游客bklopfwgz6prk
游客bklopfwgz6prk
文章:0丨 粉丝:0丨 话题:0
游客iyophknnq2tri
游客iyophknnq2tri
文章:0丨 粉丝:0丨 话题:0
游客tcuyhawpjqvri
游客tcuyhawpjqvri
文章:0丨 粉丝:0丨 话题:0
游客mpan6mcanyahc
游客mpan6mcanyahc
文章:0丨 粉丝:0丨 话题:0