自建ES通过OSS快照迁移至阿里云ES

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
简介: 在同一个VPC内使用3台ECS部署自建ES集群,可以通过给自建Elasticsearch打快照存储到OSS,在利用OSS中的快照进行数据库恢复,将自建Elasticsearch迁移至阿里云Elasticsearch。

在同一个VPC内使用3台ECS部署自建ES集群,可以通过给自建Elasticsearch打快照存储到OSS,在利用OSS中的快照进行数据库恢复,将自建Elasticsearch迁移至阿里云Elasticsearch。
TIM_20180411231841

安装OSS快照仓库插件,下载插件并解压到ES集群各节点Elasticsearch根目录下的plugins目录

# wget https://github.com/zhichen/elasticsearch-repository-oss/releases/download/v5.5.3/elasticsearch-repository-oss-5.5.3.zip
# unzip elasticsearch-repository-oss-5.5.3.zip -d /srv/elasticsearch-5.4.3/plugins/

修改配置文件中的版本号为当前ES集群的版本,完成后需要重启ES各节点。

# cat /srv/elasticsearch-5.4.3/plugins/elasticsearch/plugin-descriptor.properties |grep version |grep -v "^#"
version=5.4.3
java.version=1.8
elasticsearch.version=5.4.3

新购与自建ES集群在同一个region的标准存储类型OSS,(阿里云暂不支持归档存储类型OSS)。

在自建ES上创建仓库,OSS所属阿里云主账号AK信息,若使用子账号需要有管理OSS的权限。

PUT _snapshot/robin_backup
{
    "type": "oss",
    "settings": {
        "endpoint": "http://oss-cn-hangzhou-internal.aliyuncs.com", 
        "access_key_id": "Lxxxxxxxxxa",
        "secret_access_key": "Nxxxxxxxxxxxxxxxxxxpt",
        "bucket": "shasengtest", 
        "compress": true
    }
}

可以根据实际情况在setting中增加设置

        "chunk_size": "500mb", #限制snapshot过程中分块的大小,超过这个大小,数据将会被分块上传到OSS中
        "base_path": "snapshot/" #设置仓库的起始位置,默认为根目录

获取全部仓库信息,设置了robin_backup及robin_backup2两个仓库

# curl -XGET es1:9001/_snapshot/?pretty
{
  "robin_backup" : {
    "type" : "oss",
    "settings" : {
      "bucket" : "shasengtest",
      "compress" : "true",
      "endpoint" : "http://oss-cn-hangzhou-internal.aliyuncs.com"
    }
  },
  "robin_backup2" : {
    "type" : "oss",
    "settings" : {
      "bucket" : "robin7",
      "compress" : "true",
      "endpoint" : "http://oss-cn-hangzhou-internal.aliyuncs.com"
    }
  }
}

删除仓库

DELETE _snapshot/robin_backup1

获取指定仓库信息

# curl -XGET es1:9001/_snapshot/robin_backup?pretty
{
  "robin_backup" : {
    "type" : "oss",
    "settings" : {
      "bucket" : "shasengtest",
      "compress" : "true",
      "endpoint" : "http://oss-cn-hangzhou-internal.aliyuncs.com"
    }
  }
}

备份当前自建ES集群所有打开的索引到指定仓库,创建快照并命名为test

PUT _snapshot/robin_backup/test

获得test快照信息,可以看到备份了当前集群全部的索引test,test1,.kibana

# curl -XGET es1:9001/_snapshot/robin_backup/test?pretty
{
  "snapshots" : [
    {
      "snapshot" : "test",
      "uuid" : "oXtFY174RyeKRgYFi_dXKA",
      "version_id" : 5040399,
      "version" : "5.4.3",
      "indices" : [
        "test",
        "test1",
        ".kibana"
      ],
      "state" : "SUCCESS",
      "start_time" : "2018-04-10T12:44:26.027Z",
      "start_time_in_millis" : 1523364266027,
      "end_time" : "2018-04-10T12:44:27.204Z",
      "end_time_in_millis" : 1523364267204,
      "duration_in_millis" : 1177,
      "failures" : [ ],
      "shards" : {
        "total" : 11,
        "failed" : 0,
        "successful" : 11
      }
    }
  ]
}

备份指定test2索引到robin_backup下并命名快照为test2

PUT _snapshot/robin_backup/test2
{
  "indices": "test2"
}

获得单个快照test2信息,指包含了test2这一个索引

# curl -XGET es1:9001/_snapshot/robin_backup/test2?pretty
{
  "snapshots" : [
    {
      "snapshot" : "test2",
      "uuid" : "L6MknW92RGe55fZS1HIVUw",
      "version_id" : 5040399,
      "version" : "5.4.3",
      "indices" : [
        "test2"
      ],
      "state" : "SUCCESS",
      "start_time" : "2018-04-10T12:47:19.430Z",
      "start_time_in_millis" : 1523364439430,
      "end_time" : "2018-04-10T12:47:20.099Z",
      "end_time_in_millis" : 1523364440099,
      "duration_in_millis" : 669,
      "failures" : [ ],
      "shards" : {
        "total" : 5,
        "failed" : 0,
        "successful" : 5
      }
    }
  ]
}

删除索引test及test1,并关闭索引.kibana

# curl -XDELETE es2:9001/test
{"acknowledged":true}
# curl -XDELETE es2:9001/test1
{"acknowledged":true}
# curl -XPOST es2:9001/.kibana/_close
{"acknowledged":true}
# curl -XGET es2:9001/_cat/indices
green open  test3   YcU56zKqTNaTNH8Vcr6jpw 5 1 168 0 395.8kb 217.5kb
green open  test2   M-kOMZVkRcWwOwQlFRKRWw 5 1 139 0 343.1kb 171.5kb
      close .kibana Lcv2WmUPTxqPjoNJV2C7sQ                          

elasticsearch的索引快照与ECS快照不同,并不是打快照那一时刻的整个集群状态。这里可以把索引理解成ECS下挂载的数据盘之一,只需要对重要的数据盘打快照,并不是所有的磁盘都需要打快照,恢复时可以选择只恢复某一块盘的数据,而不是对所有的磁盘进行回滚。

从test快照恢复索引

# curl -XPOST es1:9001/_snapshot/robin_backup/test/_restore
{"accepted":true}

查看恢复效果

# curl -XGET es2:9001/_cat/indices
green open test    fEukT7eWQ-OjD3uzxKmXcg 5 1 211 0 507.6kb 253.8kb
green open test1   mw6MvvuZSlys0YLjo-UU-Q 5 1 277 0 611.3kb 305.6kb
green open .kibana Lcv2WmUPTxqPjoNJV2C7sQ 1 1   2 0  15.4kb   7.7kb
green open test3   YcU56zKqTNaTNH8Vcr6jpw 5 1 168 0 395.8kb 217.5kb
green open test2   M-kOMZVkRcWwOwQlFRKRWw 5 1 139 0 343.1kb 171.5kb

也可以安装cerebro插件查看已存在的索引快照,单击restore即可恢复索引。
cerebro

也可以选择只恢复部分索引

# curl -XPOST es1:9001/_snapshot/robin_backup/test/_restore
{
    "indices": "test1", #指定需要恢复的索引名称
}

在阿里云ES上创建相同的快照仓库,与自建的ES集群共享同一个oss仓库,完成后即可查看到快照信息
snapshot

查看当前阿里云ES集群的索引
snapshot2

在阿里云ES上恢复快照,可以看到已经恢复的test和test1
snapshot3

由于阿里云ES存在.kibana索引,恢复快照时需要先关闭.kibana索引,否则会报错

{
  "error": {
    "root_cause": [
      {
        "type": "snapshot_restore_exception",
        "reason": "[robin_backup:test/oXtFY174RyeKRgYFi_dXKA] cannot restore index [.kibana] because it's open"
      }
    ],
    "type": "snapshot_restore_exception",
    "reason": "[robin_backup:test/oXtFY174RyeKRgYFi_dXKA] cannot restore index [.kibana] because it's open"
  },
  "status": 500
}
相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
目录
相关文章
|
19天前
|
关系型数据库 Apache 流计算
手把手教你实现 OceanBase 数据到阿里云数据库 SelectDB 内核版 Apache Doris 的便捷迁移|实用指南
本文介绍了如何将数据从 OceanBase 迁移到阿里云数据库 SelectDB 内核版 Apache Doris。提供 3 种数据同步方法 1. 使用 DataX,下载 DataX 并编写配置文件,通过 OceanBaseReader 和 DorisWriter 进行数据迁移。 2. 利用 Apache Doris 的 Catalog功 能,将 OceanBase 表映射到 Doris 并插入数据。 3. 通过Flink CDC,设置 OceanBase 环境,配置 Flink 连接器,实现实时数据同步。
手把手教你实现 OceanBase 数据到阿里云数据库 SelectDB 内核版 Apache Doris 的便捷迁移|实用指南
|
12天前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之使用pyodps读取OSS(阿里云对象存储)中的文件的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1天前
|
安全 Linux 对象存储
数据备份到阿里云oss上,以防勒索病毒的破坏
数据备份到阿里云oss上,以防勒索病毒的破坏
15 0
|
17天前
|
网络协议 对象存储
阿里云oss配置自有域名
阿里云oss配置自有域名
22 1
|
19天前
|
存储 JSON 前端开发
Javaweb之SpringBootWeb案例之阿里云OSS服务集成的详细解析
Javaweb之SpringBootWeb案例之阿里云OSS服务集成的详细解析
18 0
|
19天前
|
存储 开发工具 对象存储
Javaweb之SpringBootWeb案例之阿里云OSS服务入门的详细解析
Javaweb之SpringBootWeb案例之阿里云OSS服务入门的详细解析
19 0
|
Java 对象存储 Perl
oss迁移以及校验
oss的数据迁移以及一致性校验
2265 0
|
2月前
|
Java API 开发工具
如何用阿里云 oss 下载文件
阿里云对象存储服务(OSS)提供了多种方式下载文件,以下讲解下各种方式的下载方法
1210 1
|
2月前
|
存储 安全 对象存储
手把手教你搭建阿里云图床(PicGo+Typora+阿里云OSS),新手小白一看就会
本文详细介绍了怎样帮助新手小白从注册,购买阿里云OSS,到一步一步配置OSS做为图床,和PicGo、Typora软件连接,配置好关联之后,在使用Typora写文章时,如果需要插入图片,只需要将图片复制粘贴到Typora的编辑区域,就会自动通过PicGo上传到指定图床,自动复制外网能访问的URL并展示,简直不要太方便,极大的解决了编辑文章时复制处理图片链接的痛点。
255 2
手把手教你搭建阿里云图床(PicGo+Typora+阿里云OSS),新手小白一看就会
|
2月前
|
弹性计算 前端开发 小程序
微信小程序上传文件至阿里云OSS直传(java后端签名+前端直传)
当前的通用文件上传方式是通过前端上传到服务器,再由服务器转存至对象存储。这种方式在处理小文件时效率尚可,但大文件上传因受限于服务器带宽,速度较慢。例如,一个100MB的文件在5Mbps带宽的阿里云ECS上上传至服务器需160秒。为解决此问题,可以采用后端签名的方式,使微信小程序直接上传文件到阿里云OSS,绕过服务器中转。具体操作包括在JAVA后端引入相关依赖,生成签名,并在微信小程序前端使用这个签名进行文件上传,注意设置正确的请求头和formData参数。这样能提高大文件上传的速度。