HBase 备份恢复

本文涉及的产品
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 MongoDB,通用型 2核4GB
简介: Apsara HBase 备份恢复所有的数据库产品都有备份恢复,Apache HBase官方目前没有一个release版本的备份恢复功能,官网提出的方案和机制操作都是很复杂。所以阿里云赋能HBase的备份恢复能力并支持全量和增量的备份和恢复,同时具有高性能、低成本和低线上影响充分自动化。

Apsara HBase 备份恢复
所有的数据库产品都有备份恢复,Apache HBase官方目前没有一个release版本的备份恢复功能,官网提出的方案和机制操作都是很复杂。所以阿里云赋能HBase的备份恢复能力并支持全量和增量的备份和恢复,同时具有高性能、低成本和低线上影响充分自动化。而且备份恢复是独立于HBase之外的模块,不影响HBase的正常使用,并且备份恢复模块有自有failover的能力,保证备份恢复的持续性。

Apsara-HBase 备份恢复组成图
1

1.独立于Apsara-HBase的备份恢复模块,提供独立的模块支撑
2.支持全量/增量恢复以及全量/增量恢复,高数据恢复精确度
3.全量/增量备份有failover模块保证数据安全备份
4.支持冷热分离等统一文件系统接口,并支同时持HBase的1.x、2.x版本的接口
5.数据备份到oss,拥有极高的数据可靠性,且存储成本低廉,oss上备份数据不会存在冗余的情况

**云HBase备份恢复原理
整体组成**
2
1.备份包括全量备份和增量备份,全量备份是在某个时刻的全量备份,增量备份是从某个时刻起的Hlog的备份,同时也会对两种备份数据压缩。
2.恢复也包括全量恢复和增量恢复,增量恢复是指从最近的全量恢复的时间点到指定的时间点的Hlog的增量恢复,全量恢复是指定时间点最近的一次全量备份数据恢复。
如图所示,恢复全量备份点2和增量备份点4的数据: 全量恢复使用bulkload 增量恢复使用的是replay

3

相关指标

1.全量备份最长时间限制是4天
2.全量恢复最长时间是1.5天
3.RPO(Recover Pointobjective)业务系统所能容忍的数据丢失量是1小时,二期会支持秒级
4.数据可靠性高达11个9(99.9999999%)且OSS存储成本极低
5.定期清理过期备份数据,可以降低备份数据的冗余
备份部分:全量备份

全量备份的架构图如下:
4

RS和MASTER的调度身份有所不同,如上图master节点会做snapshot的备份,RS节点做的是Hfile的备份,上转任务切分实现了两种方案 a) round robin近均匀策略 b) 基于short-circuit read的切分策略。使用failover机制保证失败重试,且基于Hfilelink,追踪hfile路径,保证读到数据。

备份部分:增量备份

增量备份的架构如下:
5
正常情况下,各个hlogserver负责自己机器相关的hlog,并且实时收集备份hlog,备份精度在一小时以内。实现Hloglink,追踪hlog全链路的踪迹,保证读到数据;追踪WALs/oldWALs/splitting 3种状态,内存占用量只有20MB。 hlogserver采用了round robin takeover 策略保证不会漏备任何一条hlog。

下图是Hlogserver failover是的示意图:
6
当Hlogserver1服务和ecsdown机的时候,Hlogserver会把Hlogserver1当前的任务log13、log14转给Hlogserver2执行。如果Hlogserver1恢复服务的时候log1x相关的任务会继续在Hlogserver1上执行。

恢复部分

架构图如下:

7
服务会根据需要的时间点恢复最近的一次全量备份和全量备份的时间点到需要恢复的时间点的增量Hlog备份。并且Hfile和Hlog的恢复都是各节点分布式执行的。

阿里云HBase 备份恢复 vs 其他大数据数据库备份恢复

下面的表格是阿里Hbase和其它Hbase备份恢复的对比

DB备份恢复

备份

恢复

阿里云HBase

全量备份,增量实时备份,保证备份精度,备份目标端保证低数据冗余

全量bulkload+log replay,可以恢复任意合理的集群规模

Apache HBase

社区方案需要依赖mr,且一次全量,以后都增量,增量备份精度有限,且存在数据冗余

全部hfile bulkload模式,速度较快。

Apache Cassandra

全量组合增量模式,可能引入多份冗余增量log的出口带宽

需要恢复到备份对等的集群规模

image

文章来自:郭鹏——HBase生态+Spark社区大群 志愿者

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
存储 运维 安全
备份!备份!备份! 看阿里云HBase的企业级备份恢复如何设计
数据安全是生命线,一线人员辛苦一年的努力可能因为一时疏忽而废,升职加薪无望;一个公司或者团队辛苦几年的打拼可能一夜回到解放前。所以面对重要的事情要说三遍:备份!备份!备份!
1180 0
备份!备份!备份! 看阿里云HBase的企业级备份恢复如何设计
|
安全 大数据 分布式数据库
云HBase备份恢复,为云HBase数据安全保驾护航
介绍了阿里云HBase自研备份恢复功能的基本背景以及基本原理架构和基本使用方法。
22627 0
|
大数据 分布式数据库 数据库
hbase 备份恢复
讲师:阿里多模型数据库专家 ——玄陵 主要内容介绍:阿里云HBase 备份恢复的设计背景、原理、实现以及与业内大数据数据库的备份恢复机制的异同。 视频回看下载地址:https://yunqivedio.alicdn.com/od/3WfyH1543920819489.mp4 PPT下载地址:https://yq.aliyun.com/download/3126 ---- 每周二下午六点都会有阿里专家在【 HBase生态+Spark社区 钉钉大群】直播,交流HBase技术。
1478 0
|
4月前
|
Java Shell 分布式数据库
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
82 0
|
8月前
|
SQL 分布式计算 Hadoop
Hadoop集群hbase的安装
Hadoop集群hbase的安装
140 0
|
4月前
|
分布式计算 Hadoop 关系型数据库
Hadoop任务scan Hbase 导出数据量变小分析
Hadoop任务scan Hbase 导出数据量变小分析
53 0
|
3月前
|
存储 分布式计算 Hadoop
Hadoop中的HBase是什么?请解释其作用和用途。
Hadoop中的HBase是什么?请解释其作用和用途。
40 0
|
4月前
|
SQL 分布式计算 Hadoop
Hadoop学习笔记(HDP)-Part.16 安装HBase
01 关于HDP 02 核心组件原理 03 资源规划 04 基础环境配置 05 Yum源配置 06 安装OracleJDK 07 安装MySQL 08 部署Ambari集群 09 安装OpenLDAP 10 创建集群 11 安装Kerberos 12 安装HDFS 13 安装Ranger 14 安装YARN+MR 15 安装HIVE 16 安装HBase 17 安装Spark2 18 安装Flink 19 安装Kafka 20 安装Flume
82 1
Hadoop学习笔记(HDP)-Part.16 安装HBase
|
8月前
|
分布式计算 Hadoop 分布式数据库
开机时监听Hadoop和Zookpeer启动之后再启动Hbase
开机时监听Hadoop和Zookpeer启动之后再启动Hbase
|
8月前
|
存储 分布式计算 Hadoop
Hadoop之Hbase安装和配置
Hadoop之Hbase安装和配置
708 0