1. 云栖社区>
  2. 全部标签>
  3. #lucene#
lucene

#lucene#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

从业务需求到能力扩展 | 阿里云Elasticsearch向量检索能力的创变

阿里云 Elasticsearch 目前是公有云营收增长最快的大数据产品之一。随着客户数的增长,我们发现随着AI技术的不断普及,针对向量检索场景的需求量在逐步提升。从人脸识别、音/视频识别到商品智能推荐等场景,技术上都离不开向量检索的能力作为支撑,而本片文章从构思到实践为您全面了解阿里云 Elasticsearch 的向量检索能力。

大数据 性能 公共云 Image 索引 Elasticsearch lucene 数组 人脸识别

从业务需求到能力扩展 | 阿里云Elasticsearch向量检索能力的创变史

阿里云 Elasticsearch 目前是公有云营收增长最快的大数据产品之一。随着客户数的增长,我们发现随着AI技术的不断普及,针对向量检索场景的需求量在逐步提升。从人脸识别、音/视频识别到商品智能推荐等场景,技术上都离不开向量检索的能力作为支撑,而本片文章从构思到实践为您全面了解阿里云 Elasticsearch 的向量检索能力。

大数据 性能 公共云 Image 索引 Elasticsearch lucene 数组 人脸识别

Solr快速入门文档阅读推荐——官方文档常用章节推荐

本文整理了Solr常见用法涉及的基础章节列表,通过这些章节的阅读学习,同学可以零基础快速入门使用Solr,并能够满足大部分企业的业务检索需求开发,掌握了熟悉使用Solr的基本技能。

Cloud 配置 solr API xml schema demo index lucene ES 云hbase全文服务 全文引擎 solr使用手册 solr入门学习

5分钟了解lucene全文索引

本文通俗地介绍了Lucene全文检索的内容及工作原理,以及索引的结构,旨在让以前未了解过Lucene的读者在能在短时间内对Lucene有简单认知,未介绍具体代码,读完本文可知道Lucene是什么,有哪些具体应用,我们一直说的索引是什么。

Java核心技术 算法 数据库 排序 索引 lucene 存储

海量数据搜索---demo展示百度、谷歌搜索引擎的实现

百度、谷歌等网站之所以能很快在海量数据中找到需要的数据,得益于其搜索引擎,本文将介绍搜索引擎的基本知识及中文分词的方法,并通过demo演示如何进行数据检索。

大数据 算法 配置 Image solr 搜索引擎 索引 demo Other lucene 海量数据

后端技术杂谈2:搜索引擎工作原理

写在前面 Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。

hadoop 模块 solr 搜索引擎 索引 google lucene

后端技术杂谈3:Lucene基础原理与实践

一、总论 根据lucene.apache.org/java/docs/i…定义: Lucene是一个高效的,基于Java的全文检索库。

数据处理 spark 索引 string lucene

后端技术杂谈4:Elasticsearch与solr入门实践

阮一峰:全文搜索引擎 Elasticsearch 入门教程 阅读 1093 收藏 76 2017-08-23 原文链接:www.ruanyifeng.com 9月7日-8日 北京,与 Google Twitch 等团队技术大咖面对面www.bagevent.com 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。

分布式 数据库 配置 solr 搜索引擎 索引 Elasticsearch 插件 index lucene curl

Elasticsearch搜索调优权威指南 (2/3)

Elasticsearch搜索调优权威指南,是QBOX在其博客上发布的系列文章之一,本文是该系列的第二篇,主要介绍了索引预处理、mapping建立、避免脚本的使用、索引段合并等搜索性能相关的调优方法。

大数据 搜索 性能 Json 排序 脚本 索引 表达式 Elasticsearch index type lucene 存储 curl

突破Java面试(14)-分布式搜索引擎的架构

在搜索这块,曾经lucene 是最流行的搜索库. 几年前业内一般都问,你了解 lucene 吗?你知道倒排索引的原理吗? 但现在不问了,因为现在项目基本都是采用基于 lucene 的分布式搜索引擎—— ElasticSearch. 现在分布式搜索基本已经成为互联网系统的标配,其中尤为流行的就是 ES,前几年一般用 solr。

云栖社区 分布式 架构 java mysql 集群 搜索引擎 索引 分布式架构 Elasticsearch index type lucene mapping 存储

400+ 节点的 Elasticsearch 集群运维

Elasticsearch 用于支持我们的主要媒体监控应用,客户通过该应用可以检索和分析媒体数据,比如新闻文章、(公开的)Facebook帖子、Instagram帖子、博客和微博。我们通过使用一个混合API来收集这些内容,并爬取和稍作加工,使得它们可被 Elasticsearch 检索到。

数据存储与数据库 性能 集群 索引 数据节点 Elasticsearch 性能测试 lucene 集群运维

HanLP中文分词Lucene插件

基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。

配置 solr class 自然语言处理 插件 index type lucene hanlp分词

Elasticsearch学习笔记(一)之what?

一句话介绍 Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎,能够解决不断涌现出的各种用例。作为 Elastic Stack 的核心,它集中存储您的数据,帮助您发现意料之中以及意料之外的情况。

分布式 大数据 性能 solr 索引 Elasticsearch lucene zookeeper

什么是大数据?如何成为大数据工程师?

目前大数据相关工作可以粗分几类。有资料系统串接者, 设计大数据演算法实做的人,以及管理大型丛集 (cluster) 的工程师。 很多人对大数据工程师的理解还停留在资料系统串接者的程度, 以为只要将资料汇入某个神奇系统,就能将自己想要的结果生出来。

云栖社区 数据存储与数据库 linux python 深度学习 大数据 Java核心技术 架构 java hadoop reduce lucene

Lucene学习总结

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.

索引 string exception index lucene

28
GO