HBase TB级数据规模不停机迁移最佳实践

  1. 云栖社区>
  2. 阿里云HBase&Lindorm>
  3. 博客>
  4. 正文

HBase TB级数据规模不停机迁移最佳实践

侧田 2019-07-18 19:39:56 浏览4397
展开阅读全文

背景

有关HBase集群如何做不停服的数据迁移一直都是云HBase被问的比较多的一个问题,目前有许多开源的工具或者HBase本身集成的方案在性能、稳定性、使用体验上都不是很好,因此阿里云提供了BDS迁移服务,可以帮助云上客户实现TB级数据规模不停机迁移

支持场景

  • HBase大版本升级, 1.x升级2.x
  • 集群配置升级,8核16G升级为16核32G
  • 集群网络环境变更,经典网络迁移到VPC
  • 异地跨机房迁移
  • HBase业务拆分

方案介绍

开源方案

HBase不停机迁移主要包括三个部分:表结构的迁移、实时数据同步、历史全量数据迁移

表结构迁移

对于表结构迁移来说,开源的DataX还是HBase本身都不提供表结构迁移的功能,只能进行手动建表,手动建表会存在几个问题:

  1. 如果源集群表数据较多,客户手动建表比较麻烦
  2. 手动建表可能忽略表分区,导致目标表分区很不合理,迁移完之后

网友评论

登录后评论
0/500
评论
侧田
+ 关注
所属团队号: 阿里云HBase&Lindorm