分析网络超时问题的最佳实践

  1. 云栖社区>
  2. 阿里云支持与服务>
  3. 博客>
  4. 正文

分析网络超时问题的最佳实践

怀知 2019-05-13 14:04:02 浏览1949
展开阅读全文

对于云上的用户来说,业务日志里面报超时问题处理起来往往比价棘手,因为1) 问题点可能在云基础设施层,也有可能在业务软件层,需要排查的范围非常广;2) 这类问题往往是不可复现问题,抓到现场比较难。在本文里就分析下如何来分辨和排查这类问题的根本原因。

业务超时 != 网络丢包

由于业务的形态不同,软件实现语言和框架的不同,业务日志中打印出的信息可能是各不相同,比如如下关键字:

"SocketTimeOut", "Read timed out", "Request timeout" 等

从形式看都属于网络超时这一类,但是需要明确一个概念:这类问题是发生的原因是请求超过了设定的timeout时间,这个设置有可能来自客户端,服务器端或者网络中间节点,这是直接原因。网络丢包可能会导致超时,但是并不是充分条件。总结业务超时和网络丢包的关系如下:

网络丢包

网友评论

登录后评论
0/500
评论
怀知
+ 关注
所属云栖号: 阿里云支持与服务