《谷歌语义搜索》一2.2 知识图谱怎样工作

简介:

本节书摘来自异步社区《谷歌语义搜索》一书中的第2章,第2.2节,作者【英】David Amerland,更多章节内容可以访问云栖社区“异步社区”公众号查看

2.2 知识图谱怎样工作

谷歌语义搜索
一张图片胜过千言万语,那么就让我们通过图2.2来快速地理解基于数学的知识图谱的实际原理吧。这是当我们输入搜索查询“da vinci”时在背后所发生的。


04171b9935570c3e1bc3a87bbe1f2c31f7733031

例如,在图2.2中,词语“da vinci”不仅仅与诸如这个伟大的发明家的出生地点、出生日期等信息关联,也与他的当代艺术家和雕刻家、他的作品甚至是关于作品的一则艺术批评观点关联。

我希望你理解的是,一旦出现了这种关于一个主题的详尽的信息交叉引用,接下来需要的就是利用数学规则来得出推断(或进行演绎)的能力,那么各种问题就都迎刃而解了,例如:

“莱昂纳多是什么时候出生的?”

“莱昂纳多的画作有哪些?”

“莱昂纳多的笔记是什么?”

每次答案都会在页面上给出,或者作为顶部的知识传送带,或者像我们实际看到的知识图谱那样出现在右侧。

目前谷歌的语义搜索—如果愿意的话你可以称其为《星际迷航》计算机的极度年轻的版本,其弱点在于其知识和能力之间的缺口。例如,有很多其他问题是我想问并想要快速得到答案的,例如:

“莱昂纳多去世的时候是多大岁数?”

这条搜索查询仍会带来10条蓝色的链接,我不得不逐条点击访问,阅读打开的网页并找到我的问题的答案。一个更小的也使用了语义程序的搜索引擎是Wolfram Alpha(www.wolframalfa.com),它在一两秒内就在页面上给了我答案:67岁零8天。

语义搜索就其本身的定义而言,完全是关于可计算的答案的,而非仅仅去发现10个顶级网站来让你不得不自己去浏览并寻找问题的答案,并且随着它的不断成长和它的知识存储定义变得越来越好并越来越可靠,我们会逐渐看到更多的能在搜索页面上提供直接答案的实例。

这一切的辉煌,如果没有实际的日常应用,对我们而言就没有任何用处。值得庆幸的是,实际情况并非如此。在我们这个越来越快、时间越来越紧张的世界里,一个搜索引擎存在的真正价值在于无论你在世界的哪个角落,都可以自动识别并回答搜索查询“离我最近的餐馆”或者“城里面最好的披萨店”,而甚至无须你指明地点、国家或餐馆类型。

这一切发生所依赖的魔力很大程度上要归功于谷歌将所有不同的数据拧成一股绳的能力:我的地理位置、我手机上的GPS信号以及我附近披萨店的地址和一些关于他们的好评。

如果你在市中心的某个地方开着一家披萨店,而我碰巧在那儿,那么你的业务就会从我的习惯中受益,而无须我们努力吸引彼此。这就是语义搜索的真正价值。搜索引擎过去给我们的是需要我们费劲来阅读的“最佳选择”,而现在已经变成了一个答案引擎、一个推荐引擎甚至一个预测引擎,能理解我在有偏差的、模糊的问题背后的意图,并像我的挚友一样给我提供答案。

这种搜索引擎不仅仅会占据大部分市场份额,并且会很大程度上无形地、无处不在地这么做,就像《星际迷航》计算机一样。没有人需要去编程答案,不需要为了与它沟通而付出努力,它会得到像星舰企业号的舰长们给予他们的舰载计算机的同等权威的信任。

这种可以如此无缝连接顾客和服务的搜索引擎将会在世界上释放出一种新鲜的“最佳”价值——只有最佳的业务才能做得成,只有最佳的地方才会有访客,只有最佳的城市才会让聪明人决定去居住,只有最佳的信息才会显露出来。

如果这一思想让你兴奋,那么你这么兴奋是正确的。从业务的角度而言,它将显著降低你的广告和营销预算,从而允许你将时间和精力投入到你的业务中来做你想做的事:让它成为最佳。

传统的自顶向下的单向营销已经不合时宜了—它是上个世纪的遗物。营销作为对一个问题的回应发展着,即当业务已经在许多本地居民和国家中扩大规模,新的沟通手段还没有被发明来代替已被抛弃的我们过去在小城镇和村庄中拥有的那些方式时,我们是怎样做出购买决策的。

作为一项业务,你不得不投入巨大精力并真正努力地去尝试支配某个人的购买决策,这一古怪观点的一个合乎逻辑的结果是频繁地用包装来代替质量,用品牌价值来代替声誉,以及用规模来代替价值。在过去的村庄中,村庄的广场被摊位所环绕,根据信任、声誉和知识来引导你的购买决策。我们从信任的源头那儿买东西,我们从信任的源头那儿发现新的商人,我们从名声在外的新人那儿买东西,我们根据我们想要买什么和他们提供什么来选择怎样去买,我们不知道时,我们就去问某个知道的人。

这一模型在村庄广场的范围内运转得非常好。但是,这一小规模的、乡村般的世界被工业革命中指数规模的市场、人口和生产过程甩在了身后,由于其无法成功地应对这一规模,所引发的问题催生了现代营销。

语义搜索和知识图谱的动人之处在于它利用技术让世界再次变得小了起来。在一个地球村中,我们所说的“这儿”可能让我们在24小时内分处地球的两端,我们的村庄广场已经被一个不断变化的位置所替代—它由我们在乡村般的过去中做出购买决策时所使用的同样标准的信任、声誉和价值组成的那些选择构成;这一标准也被我们用来决定在涉及关于我们生活的敏感信息时我们应该信任谁,我们应该选择谁作为业务伙伴,以及当我们退休后我们应该请谁来购买我们的业务。

本书第一章的序言大胆地表明了搜索就是营销。我们面对的挑战是越过不够鲜明的SEO领域的技术术语,来理解是什么在何时何地以怎样的方式做了些什么,以一种不仅在现在,即便在莱昂纳多·达芬奇还活着的500年前以及500年后都说得通的方式—那时,“搜索”将会成为你眼角闪烁的小点,静静地在你的生活中为你提供数据覆盖,或者成为出生时在你脑袋里植入的一个耳语般的声音。

回归基本并不意味着剥夺我们取得的成就。它意味着剥夺我们的伪装,去除随着快速发展而形成的不可避免的傲慢,来理解事物原委的动态。

在这个“回归基本”的世界上,在搜索中表现不错的业务具有以下特征。

  • 理解使用搜索的主要目的是捕获并维持它们受众的注意力。
  • 试着与客户联系起来而非追求改变搜索算法。
  • 以成功营造社会舆论的那些方式来创造一致的价值。
  • 同步它们的线上和线下的存在来传递一幅单一的、深思熟虑过的营销画面。
  • 足够好地传达它们的核心价值来建立一种真实的线上身份(identity)。
  • 设法通过在线交流和互动来维护并提高它们的声誉。
  • 理解内容创建不仅仅是随意创建陈旧的内容只为将关键词放进去以帮助搜索排名的一种需求。
相关文章
|
7月前
|
机器学习/深度学习 自然语言处理 算法
自然语言处理算法与文档管理软件:提升搜索与分类效率的未来
如果想要让你的文档管理软件更智能、更易用,那就让我们聊一聊如何巧妙地应用自然语言处理(NLP)算法吧!这绝对是提升用户体验和工作效率的“绝佳利器”!下面是一些能帮你通过自然语言处理算法提升文档管理软件的搜索和分类效率的方法——
103 1
|
1月前
|
自然语言处理 搜索推荐 算法
ChatGPT可以取代搜索引擎吗?
ChatGPT可以取代搜索引擎吗?
27 0
|
1月前
|
人工智能 自然语言处理 搜索推荐
Jina AI新模型使搜索准确性提升20%
【2月更文挑战第17天】Jina AI新模型使搜索准确性提升20%
45 2
Jina AI新模型使搜索准确性提升20%
|
2月前
|
人工智能 自然语言处理 数据库
什么是人工智能领域的 RAG 搜索增强
什么是人工智能领域的 RAG 搜索增强
136 1
|
8月前
|
存储 前端开发 API
使用大型语言模型进行自主视觉信息搜索
在调整大型语言模型(LLM)以适应任务的多模态输入方面取得了很大进展,包括图像标题,可视问答 (VQA)和开放词汇识别.尽管取得了这些成就,但当前最先进的视觉语言模型(VLM)在视觉信息搜索数据集上表现不佳,例如信息搜索和OK-VQA,需要外部知识才能回答问题。
112 0
|
11月前
|
机器学习/深度学习 存储 人工智能
「智能企业搜索」:为什么知识图和NLP可以提供所有正确答案
「智能企业搜索」:为什么知识图和NLP可以提供所有正确答案
|
11月前
|
机器学习/深度学习 Web App开发 自然语言处理
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022
|
自然语言处理 算法
交互搜索中的自然语言理解技术
交互搜索 交互搜索是一种新的产品形态,可以和用户对话,记住用户的购物需求和偏好,提供购物知识和建议。在搜索页面下拉就可以进入了,类似于微信的小程序的进入方式。 自然语言理解 对话和搜索的最大区别就是对话是多轮的,而搜索是单轮的。
6138 0
|
机器学习/深度学习 自然语言处理 搜索推荐
深度语义模型以及在淘宝搜索中的应用
传统的搜索文本相关性模型,如BM25通常计算Query与Doc文本term匹配程度。由于Query与Doc之间的语义gap, 可能存在很多语义相关,但文本并不匹配的情况。为了解决语义匹配问题,出现很多LSA,LDA等语义模型。
10382 0
|
自然语言处理 算法 搜索推荐