如何高效排查系统故障?一分钱引发的系统设计“踩坑”案例

  1. 云栖社区>
  2. 阿里技术>
  3. 博客>
  4. 正文

如何高效排查系统故障?一分钱引发的系统设计“踩坑”案例

技术小能手 2017-11-27 17:39:04 浏览3048
展开阅读全文

阿里妹导读:阿里巴巴的电商业务十分复杂,一方面是市场多样化,业务多样化,另外是消费者,商家的影响面非常广,任何一个小故障都可能引发一些社会问题,所以阿里对产品的质量,对服务的连续性有严格的要求。阿里技术人员在日常的研发运维过程中,积累了丰富的实战经验。今天,阿里妹将为大家分享一个关于故障,排查,分析和改进的真实案例。他山之石可以攻玉,希望对广大开发和运维工程师带来帮助。

f0f6a14e82e33ce5c39109f2f78d078dbdb2014d

背景说明

某日,做产品X的开发接到客户公司电话,说是对账出了1分钱的差错,无法处理。本着“客户第一”的宗旨,开发立马上线查看情况。查完发现,按照产品X当日的年化收益率,正常情况下用户在转入57元后一共收益3分钱,合计是57.03元。但是该客户当日却有一笔消费57.04元,导致客户公司系统对多出的1分钱处理不了。再进一步分析,发现用户收益结转时多了1分钱的收益,并且已消



网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属团队号: 阿里技术