深入浅出搜索架构引擎、方案与细节(上)

  1. 云栖社区>
  2. 阿里云MVP>
  3. 博客>
  4. 正文

深入浅出搜索架构引擎、方案与细节(上)

初商 2019-08-14 00:07:58 浏览166
展开阅读全文

一、缘起

《100亿数据1万属性数据架构设计》文章发布后,不少朋友对58同城自研搜索引擎E-search比较感兴趣,故专门撰文体系化的聊聊搜索引擎,从宏观到细节,希望把逻辑关系讲清楚,内容比较多,分上下两期。

主要内容如下,本篇(上)会重点介绍前三章:

(1)全网搜索引擎架构与流程

(2)站内搜索引擎架构与流程

(3)搜索原理、流程与核心数据结构

(4)流量数据量由小到大,搜索方案与架构变迁

(5)数据量、并发量、策略扩展性及架构方案

(6)实时搜索引擎核心技术

可能99%的同学不实施搜索引擎,但本文一定对你有帮助。

二、全网搜索引擎架构与流程

全网搜索的宏观架构长啥样?

全网搜索的宏观流程是怎么样的?

image.png

全网搜索引擎的宏观架构如上图,核心子系统主要分为三部分(粉色部分):

(1)spider爬虫系统

(2)search&index建立索引与查询索引系统

网友评论

登录后评论
0/500
评论
初商
+ 关注
所属云栖号: 阿里云MVP