网站常见问题1分钟定位(二)- 如何使用阿里云ARMS诊断Java服务端报错问题

  1. 云栖社区>
  2. 阿里云分布式应用服务>
  3. 博客>
  4. 正文

网站常见问题1分钟定位(二)- 如何使用阿里云ARMS诊断Java服务端报错问题

中间件小哥 2018-08-10 09:48:51 浏览2747
展开阅读全文

1533625806953_28aeadd4_f9c8_4b76_8506_bd2ce62fcbcd

我的网站为什么一错再错

网页报错,尤其是5XX错误是互联网应用最常见的问题之一。5XX错误通常发生于服务端。服务端是业务逻辑最复杂,也是整条网络请求链路中最容易出错、出了错最难排查的地方。

运维工程师与研发工程师排查此类问题,通常要通过登录机器查看日志来定位问题。对于一般的Java应用错误日志,通常是这幅模样:

1533627938016_69333c17_98d0_4076_9931_b25ecac03303

一般来说,对于逻辑不算太复杂、历史不算“太悠久”的应用来说,登录机器看日志的方式能够很大程度上地解决网站报错的问题。但遇到下列情况时,使用传统的方式可能就有些困难:

  • 在一个分布式Java应用集群中,我想知道这类错误每分钟发生了多少次,什么时候开始发生的;
  • 系统太老,遗留异常我不想管了,我只想知道,今天和昨天相比,发布前和发布后相比,多了哪些异常;
  • 我想知道这个错误对应的是哪个Web请求,Web请求的参数是什么;
  • 客服给了我一个用户下单失

网友评论

作者关闭了评论
中间件小哥
+ 关注
所属云栖号: 阿里云分布式应用服务