“搜索”的原理,架构,实现,实践,面试不用再怕了(值得收藏)!!!

  1. 云栖社区>
  2. 阿里云MVP>
  3. 博客>
  4. 正文

“搜索”的原理,架构,实现,实践,面试不用再怕了(值得收藏)!!!

初商 2019-08-08 00:02:33 浏览619
展开阅读全文

可能99%的同学不做搜索引擎,但99%的同学一定实现过检索功能。搜索,检索,这里面到底包含哪些技术的东西,希望本文能够给大家一些启示。

全网搜索引擎架构与流程如何?

image.png

全网搜索引擎的宏观架构如上图,核心子系统主要分为三部分(粉色部分):

(1)spider爬虫系统;

(2)search&index建立索引与查询索引系统,这个系统又主要分为两部分:

一部分用于生成索引数据build_index

一部分用于查询索引数据search_index

(3)rank打分排序系统;

核心数据主要分为两部分(紫色部分):

(1)web网页库;

(2)index索引数据;

全网搜索引擎的业务特点决定了,这是一个“写入”和“检索”分离的系统。

写入是如何实施的?

image.png

系统组成:由spider与search&index两个系统完成。

输入:站长们生成的互联网网页。

输出:

网友评论

登录后评论
0/500
评论
初商
+ 关注
所属云栖号: 阿里云MVP