从DevOps到AIOps,阿里如何实现智能化运维?

  1. 云栖社区>
  2. 阿里技术>
  3. 博客>
  4. 正文

从DevOps到AIOps,阿里如何实现智能化运维?

技术小能手 2018-08-09 09:46:52 浏览6926
展开阅读全文

背景

随着搜索业务的快速发展,搜索系统都在走向平台化,运维方式在经历人肉运维,脚本自动化运维后最终演变成DevOps。但随着大数据及人工智能的快速发展,传统的运维方式及解决方案已不能满足需求。

基于如何提升平台效率和稳定性及降低资源,我们实现了在线服务优化大师hawkeye及容量规划平台torch。经过几年的沉淀后,我们在配置合理性、资源合理性设置、性能瓶颈、部署合理性等4个方面做了比较好的实践。下面具体介绍下hawkeye和torch系统架构及实现。

AIOps实践及实现

hawkeye——智能诊断及优化

系统简介

image

hawkeye是一个智能诊断及优化系统,平台大体分为三部分:

1.分析层,包括两部分:

1) 底层分析工程hawkeye-blink:基于Blink完成数据处理的工作,重点是访问日志分析、全量数据分析等,该工程侧重底层的数据分析,借

网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 阿里技术