1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. M>
  5. moreLikeThis

当前主题:moreLikeThis

Lucene5学习之TermVector项向量

项向量在Lucene中属于高级话题。利用项向量能实现很多很有意思的功能,比如返回跟当前商品相似的商品。当你需要实现返回与xxxxxxxx类似的东西时,就可以考虑使用项向量,在Lucene中是使用MoreLikeThis来实现。 项向量其实就是根据Term在文

阅读全文

[Erlang 0104] 当Erlang遇到Solr

Joe Armstrong的访谈中有一段关于"打开黑盒子"的阐述,给我留下很深的印象:Joe Armstrong在做XWindows开发时没有使用对应的类库,而是在了解XWindows底层实现后选择了直接和套接字通信,"把这20条消息映射到Erlang术语上

阅读全文

Finding Similar Items 文本相似度计算的算法——机器学习、词向量空间cosine、NLTK、diff、Levenshtein距离

http://infolab.stanford.edu/~ullman/mmds/ch3.pdf 汇总于此 还有这本书 http://www-nlp.stanford.edu/IR-book/ 里面有词向量空间 SVM 等介绍 http://pages.cs

阅读全文

Apache Solr 5.4.0 发布,全文搜索服务器

Apache Solr 5.4.0 发布,现已提供下载: http://lucene.apache.org/solr/mirrors-solr-latest-redir.html 更新日志: https://lucene.apache.org/solr/5_

阅读全文

Solr的Scala客户端(scalikesolr)介绍

本文是scalikesolr的wiki的翻译 后边的代码片段使用了如下文档产生的索引"example/exampledocs/books.json". { "id" : "978-0641723445", "cat" : ["book","hardcover

阅读全文

Solr5之Schema.xml详解

schema.xml 是用来定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化即 Norms ,是否存储项向量等等。 schema.xml 配置文件的根元素就是 schema, 有个 name 属性, name 属性值可以随

阅读全文

solr配置文件之schema.xml

以下是针对schema.xml 配置文件的剖析: 1. <types></types>这个标签和它的意义一样,是用来表示数据有哪些类型,这些类型当然是solr内部定义的类型和自定义类型。 2. <!-- The StrField type is not an

阅读全文

Solr中Schema.xml中文版

1 <?xml version="1.0" encoding="UTF-8" ?> 2 <!-- 3 Licensed to the Apache Software Foundation (ASF) under one or more 4 contribut

阅读全文