1. 云栖社区>
  2. 全部标签>
  3. #信息检索算法/实践#
信息检索算法/实践

#信息检索算法/实践#

已有3人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

Cuckoo Hashing的应用及性能优化

Cuckoo Hash Table 使用了两个哈希函数来解决冲突。Cuckoo查询操作的理论复杂度为最差O(1),而Cuckoo的插入复杂度为均摊O(1)。我们引入Cuckoo是希望它在实际应用中,能够在较高的空间利用率下,仍然维持不错的查询性能。

信息检索算法/实践 算法 性能优化 函数 性能 Cache 测试 搜索引擎 性能测试

索引压缩算法New PForDelta简介以及使用SIMD技术的优化

New PForDelta算法介绍 倒排索引的数据包括docid, term frequency, term position等,往往会占用很大的磁盘空间,需要进行压缩。压缩算法需要考虑两点:压缩效果和解压缩效率。

信息检索算法/实践 算法 测试 索引 存储 数组

深度语义模型以及在淘宝搜索中的应用

传统的搜索文本相关性模型,如BM25通常计算Query与Doc文本term匹配程度。由于Query与Doc之间的语义gap, 可能存在很多语义相关,但文本并不匹配的情况。为了解决语义匹配问题,出现很多LSA,LDA等语义模型。

深度学习 信息检索算法/实践 淘宝

【技术实验】表格存储Tablestore准实时同步数据到Elasticsearch

TableStore是阿里云自研专业级分布式NoSQL数据库,Elasticsearch是著名的开源搜索引擎,本篇文章会介绍如何同步TableStore中的数据到Elasticsearch中,以便对部分字段支持搜索功能。

数据存储与数据库 大数据 信息检索算法/实践 TableStore 配置 同步 索引 ots stream Elasticsearch 数据同步 插件 表格存储

【技术分享】《深入理解Elasticsearch》读书笔记

Elasticsearch广泛应用于全文检索和实时日志分析场景。为了帮助开发者更好的理解和应用Elasticsearch和ELK相关技术,小编将甄选一系列技术干货分享给大家。本文作者在Elastisearch系统搭建和应用领域有深入的实践经验,现转载作者《深入理解Elasticsearch》读书笔记,梳理Elasticsearch使用过程中的一些技术难点。

云栖社区 数据存储与数据库 大数据 信息检索算法/实践 性能 日志服务 高可用 配置 集群 内存泄漏 node 搜索引擎 索引 Elasticsearch elastisearch

【技术实验】mysql准实时同步数据到Elasticsearch

Elasticsearch作为大数据场景下搜索和分析的引擎,广泛应用于实时数据分析等场景。本文作者梳理了从MySQL准实时同步数据到Elasticsearch的实操步骤,帮助开发者理解和快速上手。

云栖社区 数据存储与数据库 大数据 信息检索算法/实践 mysql HTTPS ECS 配置 logstash 同步 控制台 索引 Elasticsearch 插件 varchar

智能推荐:“相关性搜索”只给你最想要的

在过去十年里,搜索已经变得无处不在——搜索框已然成为各类网站、应用的基础标配。一个网站或者应用不提供搜索框,这是无法想象的事情。随着搜索在基础架构方面越来越多的难题得到解决,加之解决方案的商品化进程,搜索引擎的竞争已经从如何提供快速、可伸缩的搜索,转变成如何针对用户的信息需求提供最相关的匹配。

信息检索算法/实践 搜索引擎

8
GO