阿里基础设施的智能监控

  1. 云栖社区>
  2. 博客>
  3. 正文

阿里基础设施的智能监控

初商南 2019-07-30 23:43:26 浏览290
展开阅读全文

IDC、网络、服务器等基础设施承载了一次又一次的双十一奇迹。随着阿里集团业务全球化、多元化发展,作为整个集团之根本的基础设施,其运营水平显得愈发重要,智能监控成为了重中之重。

阿里IDC承载着为全球业务提供基础服务的重担,服务的稳定性和可用性有着极高的业务要求,同时又面临全球机房环境迥异、设施链条复杂、业务负载不可预估等挑战性问题。如何做到从机房风火水电相关的基础设施到服务器的全链路感知,如何通过自动化的方式为机房现场人员定位环境异常原因、争取风险处理时间,这些都是阿里IDC监控必须解决的问题。

阿里的网络极其复杂,它运行于全集团近百个机房以及数万网络设备之间,承载着全集团所有服务器/虚机运行业务所产生的网络流量。阿里内部不同BU、安全域之间的隔离,内网外网隔离,公网和私网设备,带外与带内设备,海外与国内设备,丰富多样的自研设备,

网友评论

登录后评论
0/500
评论
初商南
+ 关注