1. 云栖社区>
  2. 全部标签>
  3. #lucene#
lucene

#lucene#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

5分钟了解lucene全文索引

本文通俗地介绍了Lucene全文检索的内容及工作原理,以及索引的结构,旨在让以前未了解过Lucene的读者在能在短时间内对Lucene有简单认知,未介绍具体代码,读完本文可知道Lucene是什么,有哪些具体应用,我们一直说的索引是什么。

Java核心技术 算法 数据库 排序 索引 lucene 存储

海量数据搜索---demo展示百度、谷歌搜索引擎的实现

百度、谷歌等网站之所以能很快在海量数据中找到需要的数据,得益于其搜索引擎,本文将介绍搜索引擎的基本知识及中文分词的方法,并通过demo演示如何进行数据检索。

大数据 算法 配置 Image solr 搜索引擎 索引 demo Other lucene 海量数据

后端技术杂谈2:搜索引擎工作原理

写在前面 Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。

hadoop 模块 solr 搜索引擎 索引 google lucene

后端技术杂谈3:Lucene基础原理与实践

一、总论 根据lucene.apache.org/java/docs/i…定义: Lucene是一个高效的,基于Java的全文检索库。

数据处理 spark 索引 string lucene

后端技术杂谈4:Elasticsearch与solr入门实践

阮一峰:全文搜索引擎 Elasticsearch 入门教程 阅读 1093 收藏 76 2017-08-23 原文链接:www.ruanyifeng.com 9月7日-8日 北京,与 Google Twitch 等团队技术大咖面对面www.bagevent.com 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。

分布式 数据库 配置 solr 搜索引擎 索引 Elasticsearch 插件 index lucene curl

Elasticsearch搜索调优权威指南 (2/3)

Elasticsearch搜索调优权威指南,是QBOX在其博客上发布的系列文章之一,本文是该系列的第二篇,主要介绍了索引预处理、mapping建立、避免脚本的使用、索引段合并等搜索性能相关的调优方法。

大数据 搜索 性能 Json 排序 脚本 索引 表达式 Elasticsearch index type lucene 存储 curl

突破Java面试(14)-分布式搜索引擎的架构

在搜索这块,曾经lucene 是最流行的搜索库. 几年前业内一般都问,你了解 lucene 吗?你知道倒排索引的原理吗? 但现在不问了,因为现在项目基本都是采用基于 lucene 的分布式搜索引擎—— ElasticSearch. 现在分布式搜索基本已经成为互联网系统的标配,其中尤为流行的就是 ES,前几年一般用 solr。

云栖社区 分布式 架构 java mysql 集群 搜索引擎 索引 分布式架构 Elasticsearch index type lucene mapping 存储

400+ 节点的 Elasticsearch 集群运维

Elasticsearch 用于支持我们的主要媒体监控应用,客户通过该应用可以检索和分析媒体数据,比如新闻文章、(公开的)Facebook帖子、Instagram帖子、博客和微博。我们通过使用一个混合API来收集这些内容,并爬取和稍作加工,使得它们可被 Elasticsearch 检索到。

数据存储与数据库 性能 集群 索引 数据节点 Elasticsearch 性能测试 lucene 集群运维

HanLP中文分词Lucene插件

基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。

配置 solr class 自然语言处理 插件 index type lucene hanlp分词

Elasticsearch学习笔记(一)之what?

一句话介绍 Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎,能够解决不断涌现出的各种用例。作为 Elastic Stack 的核心,它集中存储您的数据,帮助您发现意料之中以及意料之外的情况。

分布式 大数据 性能 solr 索引 Elasticsearch lucene zookeeper

什么是大数据?如何成为大数据工程师?

目前大数据相关工作可以粗分几类。有资料系统串接者, 设计大数据演算法实做的人,以及管理大型丛集 (cluster) 的工程师。 很多人对大数据工程师的理解还停留在资料系统串接者的程度, 以为只要将资料汇入某个神奇系统,就能将自己想要的结果生出来。

云栖社区 数据存储与数据库 linux python 深度学习 大数据 Java核心技术 架构 java hadoop reduce lucene

Lucene学习总结

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.

索引 string exception index lucene

Lucene学习总结二

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.

java request string static exception class void page lucene 培训

Lucene学习总结三

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.

排序 索引 string exception void lucene

分库代价高的情况下,如何优化ES解决亿级数据量检索

数据平台已迭代三个版本,从一开始遇到很多常见的难题,到现在终于有片段时间整理一些已完善的文档,在此分享以供所需朋友的实现参考,但愿能帮助大家少走些弯路,在此篇幅中偏重于ElasticSearch的优化。

性能 线程 Apache 配置 集群 排序 测试 Image 索引 Elasticsearch 磁盘 lucene 存储

hanlp汉语自然语言处理入门基础知识介绍

自然语言处理是一门计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部分。这个星球上有许多生物拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。

大数据 人工智能 语音识别 c# Elasticsearch 自然语言处理 lucene github 神经网络 HanLP

28
GO