1. 云栖社区>
  2. 全部标签>
  3. #故障恢复#
故障恢复

#故障恢复#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

使用云监控和函数计算,秒级恢复故障

云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管理;同时,__可以实现在云产品异常事件发生的第一时间,对用户广播通知,同时打通了事件与函数服务,在事件发生时触发函数计算的执行,快速实现诸如eip迁移,slb带宽扩容,slb摘掉故障服务器等操作,以实现故障的快速恢复__。

架构 监控 函数 ECS 带宽 自动化运维 故障恢复 云监控 可用性

阿里搜索事业部故障快速恢复实践

    这篇文章中,我们将讨论面对故障时,我们为什么选择快速切流这种机制。如果选择快速切流,我们需要具备哪些条件,需要切流平台解决什么样的问题。最后,我们畅想故障快速恢复未来如何做的更好。   关于故障的几种解决思路 如何定义故障     我们一般从以下几个维度来定义故障。

阿里技术协会 故障恢复 故障 演习 切流

1
GO