毫秒级相似搜索设计与实现 - 地址、QA、POI等文本相似搜索

  1. 云栖社区>
  2. 阿里云数据库ApsaraDB>
  3. 博客>
  4. 正文

毫秒级相似搜索设计与实现 - 地址、QA、POI等文本相似搜索

德哥 2018-02-02 20:09:00 浏览1979
展开阅读全文

标签

PostgreSQL , 文本相似 , 并行相似查询 , merge sort , 合并排序 , append scan 并行 , 相似地址 , 相似问题 , 相似兴趣 , 相似搜索


背景

在现实生活中,很多地方会用到相似搜索,例如

1、打车,要去某个地方,我们输入的目的地可能和数据库里面存的并不完全一致。所以只能通过相似搜索来实现。

2、搜索问题,同样的道理,我们搜的问题可能和存的问题不完全一致。只能通过相似搜索来匹配。

3、搜索兴趣点,等。

实际上PostgreSQL就可以支持相似搜索,包括图片、数组、文本等相似搜索。对于文本,可以使用pg_trgm插件来实现相似搜索。

这是纯英文字符串的测试,100亿量级(每行32个随机英文字母+数组的组合),模糊查询毫秒级别。

《PostgreSQL 百亿数据 秒级响应 正则及模糊查询》

相似查询使用同

网友评论

登录后评论
0/500
评论
德哥
+ 关注
所属云栖号: 阿里云数据库ApsaraDB