如何提升集群资源利用率? 阿里容器调度系统Sigma 深入解析

  1. 云栖社区>
  2. 阿里技术>
  3. 博客>
  4. 正文

如何提升集群资源利用率? 阿里容器调度系统Sigma 深入解析

技术小能手 2018-03-07 11:17:33 浏览2559
展开阅读全文

Sigma 是阿⾥巴巴全集团范围的 Pouch 容器调度系统。2017年是 Sigma 正式上线以来第⼀次参与双11,在双11期间成功⽀撑了全集团所有容器(交易线中间件、数据库、⼴告等⼆⼗多业务)的调配,使双11IT成本降低50%,是阿⾥巴巴运维系统重要的底层基础设施。

Sigma 已经是阿里全网所有机房在线服务管控的核心角色,管控的宿主机资源达到几十万量级,重要程度不言而喻,其算法的优劣程度影响了集团整体的业务稳定性,资源利用率。

Sigma-cerebro 系统是 Sigma 系统的调度模拟系统,可以在无真实宿主机的情况下,以最小成本,最快速度模拟线上1:1机器资源和请求要求的调度需求完成情况,从各个角度进行扩缩容算法的评测。在对抗系统资源碎片化,在有限资源条件下大批量扩缩容,预期外超卖等问题的过程中,系统一步步发展成现在的样子。

网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 阿里技术