十年CDP,专业治疗服务器“脑裂”问题

简介:

什么是“脑裂”?

脑残大家都知道,“脑裂”是个什么鬼?肯定不是那本惊悚故事集啦。“脑裂”是高可用方案(HA)中出现的一种服务器故障,在“双机热备”高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障,2个节点上的HA软件像“裂脑人”一样,“本能”地争抢“共享资源”、争起“应用服务”,就会发生严重后果:或者共享资源被瓜分、2边“服务”都起不来了;或者2边“服务”都起来了,但同时读写“共享存储”,导致数据损坏(常见如数据库轮询着的联机日志出错)。
服务器“脑裂”的危害

服务器“脑裂”容易引起服务器集群逻辑关系混乱,导致主、备服务器误认为对方宕机而同时接管对方的业务,同时占用共享的文件系统,造成数据库争抢资源,引起数据库表文件的损坏,从而导致数据库服务的中断,对外业务暂停。

据悉,2015年10月,某商业银行核心系统曾因服务器集群的心跳通信异常,引发“脑裂”故障,导致数据库文件损坏,数据库发生逻辑错误而停止对外服务,造成该行柜面和渠道业务较长时间中断。为了防止此类事件再次发生,银监会特意下发(2015)175号办公厅文件提醒各银监局和银行注意风险防范。
出现“脑裂”怎么办?

脑裂可以防范,经验丰富的运维工程师会建议采用下面的措施来防范“脑裂”的发生:1. 添加冗余的心跳线,例如双线条线。这样能够尽量减少“裂脑”发生的机会。2. 启用磁盘锁。3. 设置仲裁机制。

但是脑裂无法根除,发生脑裂时即使是所有的节点都可以工作,业务也会被迫中断。既然无法根除,那么我们就要面对。这就需要在脑裂之后可以有一种预案以最快的速度恢复业务!

有人会疑问:“都脑裂了,还咋最快的恢复业务?”,答案就四个字“任意回退”!HA系统正常时是同一个大脑在指挥,脑裂后的各自瞎指挥最终造成了数据的不可用。而业务的长时间中断就是因为这种数据的不可用所造成的。

找到问题的原因,就基本上有了解决问题的办法。既然脑裂所造成的业务停顿是因为数据的不可用,那么要想恢复业务让数据重新可用就行了。如何让数据重新可用?让时光回到脑裂前的那一刻,一切都会美好起来。那时候数据库还起的起来,最后一笔业务数据还在。

但是任何人都无法预知脑裂的发生,而脑裂前的那一刻是哪一刻也没有软件预先知道后在那里设置一个回退点。这就需要有一种保护机制将数据变化的所有点全部记录下来,这些所有点必然包含了“脑裂前的那一刻”这个点。这种保护技术就是CDP,通过持续的数据保护,可以做到任意时间点回退。

和力记易十年磨一剑,采用基于主机嵌入式分析的方式对结构化数据进行CDP保护,在记录所有回退点的同时还分析了数据库的内部逻辑结构,保证了每个回退点都是数据库的可用点。可谓居家旅行,专治脑裂,必备良品!

本文转自d1net(转载)

相关文章
|
2月前
|
弹性计算 编解码 运维
《雾锁王国》专业服务器开服教程(迁移存档,升级服务器)
阿里云活动服务器开《雾锁王国》游戏服务器教程
761 8
|
弹性计算 安全 Linux
很高兴在这里发表一篇文章来跟大家分享我最近使用ECS的体验感受。我是一名广东财贸职业学院云计算专业的一名学生,因为目前学习的内容我需要一台稳定安全的服务器,所以我迫切的想要入手一台服务器。我找到了ecs。并且在这款服务器里使用着我所学习的一些技术,并且通过这款服务器使用着ecs。在这款服务器里面使用ecs,我学习了Linux安装docker并使用docker实现项目的环境搭建。
我在这款服务器里面,可以使用任何的电脑,包括网络,包括手机,包括电视等等,可以说是无所不用其极,但是这款服务器的强悍之处在于,它可以让我随时随地的控制着服务器上的电脑,甚至可以随意的调节服务器上的电源。我可以在服务器上随意的调节服务器上的电源,让服务器不会出现任何故障。我在这款服务器里面使用ecs,我学习了Linux安装docker并使用docker实现项目的环境搭建。再就是关于远程访问的配置,这可让我琢磨了不少时间。我遇到的问题便是:将项目部署到服务器上后,在服务器本地能够运行,但在其他设备上通过服务器的外网IP进行访问时,却提示访问超时,经过多方查询后,我才知道原来是需要配置安全组以及在服
121 0
|
弹性计算 运维 Linux
我是一名软件专业的学生,目前本科。在校的时候通过朋友推荐了解到阿里云的飞天加速计划能够领取免费的学生服务器进行学习,初次试用时间为两周。通过这方面能力的学习,能够进一步提升我的业务能力和动手能力,无论是对我以后就业还是深造都受益匪浅。
我是一名软件专业的学生,目前本科。在校的时候通过朋友推荐了解到阿里云的飞天加速计划能够领取免费的学生服务器进行学习,初次试用时间为两周。通过这方面能力的学习,能够进一步提升我的业务能力和动手能力,无论是对我以后就业还是深造都受益匪浅。
|
弹性计算 网络协议 NoSQL
一枚非计算机专业学生的ECS使用体验
旅游管理也来薅阿里云羊毛了
|
弹性计算 安全 程序员
软件工程专业学生使用阿里云ECS初体验
本人为软件工程大四学生,正在做毕业设计,想将软件项目迁移到云服务器中,以便在公网中访问项目网站。本文针对本人初次使用阿里云ECS的体验进行分享,并介绍一些初次使用云服务器的安全注意事项。
软件工程专业学生使用阿里云ECS初体验
|
弹性计算 NoSQL 关系型数据库
一个计算机应用技术专业学生的ECS体验
一个计算机应用技术专业学生的ECS体验
|
弹性计算 大数据 Linux
广州大学网络工程专业学子的ECS使用体验
广州大学网络工程专业,大三在读学子,参加“云平台与大数据”课程需要学习云服务器,说说阿里云ECS使用体验。
|
物联网 Unix 程序员
用佳能单反运行我的世界服务器,Reddit点赞37.4K,本人:专业操作,切勿模仿,相机可能变板砖
用佳能单反运行我的世界服务器,Reddit点赞37.4K,本人:专业操作,切勿模仿,相机可能变板砖
204 0
|
弹性计算 监控 负载均衡
作为计算机专业的学生,怎么好好利用阿里云ECS!
出于对学习的目的,最主要的是在于体验各种结构,让体验变得简单。刚开始不要以开发者的角度去考虑阿里云,这样会局限自己。
189 0
|
弹性计算 人工智能 负载均衡
想提升专业技能?阿里云9月ECS和AI千人训练营为你助力!!
同学们,阿里云高校计划首次 ECS千人训练营要来了,9月高校计划ECS和AI训练营等你来!参加这次训练营你能收获云计算和AI项目经验和提升技术技能!【ECS高校训练营 9.23-9.28】入门班500人+进阶班500人共招1000人,进阶班的同学完成打卡+任务+作业就发ACA资格! 【AI训练营 9.24-9.28】仅招100人,高校的同学们一定不要错过这次机会!
想提升专业技能?阿里云9月ECS和AI千人训练营为你助力!!

热门文章

最新文章