载思 + 关注
阿里妈妈技术专家,负责阿里妈妈2W+规模的离线系统管理优化

载思 发表了文章:

阿里妈妈MaxCompute架构演进 - AON(MPI)集群

发布时间:2017-06-06 11:02:45 浏览:5035 回帖 :0

我们的集群规模不断地在加大, 与此同时我们却有着不同的感受,明显感觉到了各种任务的运行效率都在变低,其中AllOrNothing这类任务表现尤为明显

架构 集群 odps MPI MaxCompute AON AllOrNothing 超卖 全局调度

载思 发表了文章:

门道多:一次MaxCompute PS任务的问题排查之旅

发布时间:2017-06-05 11:03:17 浏览:1715 回帖 :1

关于PS是什么,可以参考一下以下两个介绍:基于参数服务器的大规模在线学习算法和Parameter Server。更多问题可以咨询玄乐。下面主要总结一下这回遇到一个PS任务跑不起来的问题排查过程。不想看...

阿里技术协会 集群 odps Server Core CPU 优化 MaxCompute ps 排查 AON

阿里妈妈技术专家,负责阿里妈妈2W+规模的离线系统管理优化

感兴趣or擅长的领域:

更多>
太公
太公
文章:19丨 粉丝:73505丨 话题:1
华仔爱技术
华仔爱技术
文章:123丨 粉丝:883丨 话题:2
易立
易立
文章:59丨 粉丝:75138丨 话题:0
丁奇
丁奇
文章:79丨 粉丝:9752丨 话题:0
德哥
德哥
文章:2050丨 粉丝:18789丨 话题:12
更多>
游客xrxljojz4jfvg
游客xrxljojz4jfvg
文章:0丨 粉丝:0丨 话题:0
游客ubz73u7fxrt6g
游客ubz73u7fxrt6g
文章:0丨 粉丝:0丨 话题:0
游客4vsbpjewbp5t6
游客4vsbpjewbp5t6
文章:0丨 粉丝:0丨 话题:0
游客vgx2fpgj5vnww
游客vgx2fpgj5vnww
文章:0丨 粉丝:0丨 话题:0
游客azxr3vximy5pw
游客azxr3vximy5pw
文章:0丨 粉丝:0丨 话题:0
游客zggvgqcy3fsfq
游客zggvgqcy3fsfq
文章:0丨 粉丝:0丨 话题:0