在 Ali Kubernetes 系统中,我们这样实践混沌工程

  1. 云栖社区>
  2. 阿里巴巴云原生>
  3. 博客>
  4. 正文

在 Ali Kubernetes 系统中,我们这样实践混沌工程

jessie筱姜 2019-03-13 15:39:32 浏览1907
展开阅读全文


作者| 阿里云智能事业群高级测试开发工程师 智妍


在传统的软件测试中,我们通常通过一个给定的条件来判断系统的反馈,通过断言来判断是否符合预期,测试条件和结果通常比较明确和固定。而混沌工程,是通过注入一些“不确定”因素,象放进了一群淘气的猴子,在系统资源、可用性、安全性、延迟、压力等方面进行捣乱,而此过程中,要求系统可以毫无影响的提供服务,用户无感知。


这其实对系统的自愈能力,健壮性都有很高的要求。故障注入一般是指比较受控的一些实验条件,通过注入一些相对极端的异常场景,为系统提供可靠性测试的过程。 整体来说,混沌是一种故障注入规则,强调了一些不确定性、随机性,比较常见的"猴子"有 Netflix 的"猴子军团",可以用来随机关闭系统实例,注入延时,回收资源,检查安全漏洞等等。

开源工具介绍

除了一般系统的 monkey,基于 Kuberne

网友评论

登录后评论
0/500
评论
jessie筱姜
+ 关注
所属云栖号: 阿里巴巴云原生