可用性监控-先于客户知道您的应用挂了

  1. 云栖社区>
  2. 阿里云监控服务>
  3. 博客>
  4. 正文

可用性监控-先于客户知道您的应用挂了

江米 2018-01-16 09:50:46 浏览2036
展开阅读全文

背景

任何服务都避免不了出现以下问题,你的用户访问不了你的服务或者站点,用户偶尔碰到5xx,服务响应延迟比较慢,某台应用进程挂掉,导致访问时好时坏。问题在于,你是否要等你的用户来告诉你,你的程序是问题了。

出问题的原因很多,应用进程挂了,java应用大GC导致应用不响应,应用依赖的rds,redis响应慢或者干脆不响应。应用依赖的其他http服务响应慢或者不响应等。

困难

然而,当企业上云后,应用程序的运行环境也变得复杂。
也许你的应用程序跑在了ecs上,可能是在vpc的内网环境里,无法有效的触达到你的应用程序。
也许你的应用程序跑在docker容器里。
也许你的应用程序是直接run在serverless架构里。
也许你懒于自己维护了一个zabbix,需要付出较大的维护成本。
以上这些,都让应用程序的运行时可用性监控变得困难。

另外,出问题的原因很多

网友评论

登录后评论
0/500
评论
江米
+ 关注
所属云栖号: 阿里云监控服务