【最佳实践】阿里云Logstash JDBC实现Elasticsearch与关系型数据库保持数据同步

  1. 云栖社区>
  2. Elasticsearch技术团队>
  3. 博客>
  4. 正文

【最佳实践】阿里云Logstash JDBC实现Elasticsearch与关系型数据库保持数据同步

工程师甲 2020-05-22 15:33:48 浏览445
展开阅读全文

整体概述:

阿里云 logstash-input-jdbc 插件是实现阿里云 Elasticsearch 与 RDS 关系型数据库数据同步的关键,本质是通过 Logstash JDBC 输入插件,运行一个循环来定期对 RDS 进行轮询,从而找到在此次循环上次迭代后插入或更改的记录,如让其正确运行,必须满足如下条件:

1、 在将 RDS 中的文档写入 Elasticsearch 时,Elasticsearch 中的 "_id" 字段必须设置为 RDS 中的 "id" 字段。这可在 RDS 记录与 Elasticsearch 文档之间建立一个直接映射关系,如果在 RDS 中更新了某条记录,那么将会在 Elasticsearch 中覆盖整条相关记录。

注意,在 Elasticsearch 中覆盖文档的效率与更新操作的效率一样高,因为从内部原理




网友评论

登录后评论
0/500
评论