第一章 Lucene简介

简介:

1.1Lucene的使用

在全文索引工具中,都是由这样的三部分组成

1、索引部分(I am a boy)

2、分词部分

3、搜索部分

 

1.2 Lucene系统架构

索引过程的核心类:

  1. IndexWriter

  2. Directory

  3. Analyzer

  4. Document

  5. Field

 

搜索过程的核心类:

  1. IndexSearcher

  2. Term

  3. Query

  4. TermQuery

  5. TopDocs

  6. ScoreDoc

 

1.3 Lucene系统架构图

wKiom1PLShzhGgdKAAE7u4I6558778.jpg


本文转自 梦朝思夕 51CTO博客,原文链接:http://blog.51cto.com/qiangmzsx/1440486

相关文章
|
6月前
|
Java 索引
04Lucene入门程序
04Lucene入门程序
26 0
|
11月前
|
SQL JSON 自然语言处理
全文检索工具elasticsearch:第一章:理论知识
全文检索工具elasticsearch:第一章:理论知识
237 0
|
存储 自然语言处理 分布式计算
全文检索工具solr:第一章:理论知识
全文检索工具solr:第一章:理论知识
100 0
|
安全 算法 网络安全
虚拟专用网简介
本文重点讲解虚拟专用网的理论知识,后续文章对具体虚拟专用网进行讲解(包括原理和配置),欢迎持续关注和订阅专栏。
944 0
|
存储 人工智能 自然语言处理
看Lucene源码必须知道的基本概念
下面的一些基本概念不但有助于看源码,在使用像solr这样的搜索引擎框架的时候还可以知道自己的配置都做了些什么事情。我在定义这些概念的时候也都有自己的理解和思考。
看Lucene源码必须知道的基本概念
|
XML 分布式计算 算法
Rosetta | Rosetta简介
Rosetta | Rosetta简介
770 0
Rosetta | Rosetta简介
|
API 数据格式 JSON
Solr快速入门文档阅读推荐——官方文档常用章节推荐
本文整理了Solr常见用法涉及的基础章节列表,通过这些章节的阅读学习,同学可以零基础快速入门使用Solr,并能够满足大部分企业的业务检索需求开发,掌握了熟悉使用Solr的基本技能。
1683 0
|
存储 数据安全/隐私保护
TrueLicense简介
原文 TrueLicense是一个开源的证书管理引擎,官网 使用场景:当项目交付给客户之后用签名来保证客户不能随意使用项目 默认校验了开始结束时间,可扩展增加mac地址校验等。 其中还有ftp的校验没有尝试,本文详细介绍的是本地校验 license授权机制的原理: 生成密钥对,方法有很多。
8267 0
|
存储 Java Apache
Lucene7.2.1系列(一)快速入门
Lucene是一套用于**全文检索和搜索**的开放源代码程序库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程序接口,能够做全文索引和搜索,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论,**Lucene是现在并且是这几年,最受欢迎的免费Java信息检索程序库**。
2780 0
hcatalog简介和使用
转自:http://blog.csdn.net/lalaguozhe/article/details/9083905 转自:https://yq.aliyun.com/articles/37442
953 0

热门文章

最新文章