AIOps智能监控在阿里巴巴故障管理工作中的成功实践

  1. 云栖社区>
  2. 云栖大会>
  3. 博客>
  4. 正文

AIOps智能监控在阿里巴巴故障管理工作中的成功实践

止水如心 2018-06-26 10:45:00 浏览4136
展开阅读全文

摘要:在自动化运维还不普及的时候,运维人员更多的运用手动的方式完成运维工作,这种方式耗时长,效率低。由此,如何合理发挥人工智能技术辅助运维人员进行故障管理工作逐步成为了业界关注的焦点。阿里巴巴的GOC团队通过研究并使用AIOps系统到运维业务场景中的方式,积累了大量的智能运营的方法论和技术体系。


本场视频精彩回顾,戳这里!

本场视频PPT下载,戳这里!


演讲嘉宾简介:


王肇刚,阿里巴巴高级技术专家


本文内容根据演讲视频及PPT整理而成。



运维行业的发展


2009年,在自动化运维还不普及的时候,运维人员更多的运用手动方式完成运维工作,这种方式耗时长,效率较低。例如:运行业务的服务器有板卡故障时,运维人员往往需要将位于故障服务器上游及下游的服务器中对故障服务器的流量从配置文件中摘掉,再将出现故障的服务器中运行的应用全部停掉,最后将相关服务器的监控屏

网友评论

登录后评论
0/500
评论
止水如心
+ 关注
所属云栖号: 云栖大会