1. 云栖社区>
  2. 全部标签>
  3. #分词#
分词

#分词#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

Elasticsearch结构化搜索_在案例中实战使用term filter来搜索数据

根据用户ID、是否隐藏、帖子ID、发帖日期来搜索帖子

搜索 分词 索引 Elasticsearch index type

机器学习中,使用Scikit-Learn简单处理文本数据

机器学习中,我们总是要先将源数据处理成符合模型算法输入的形式,比如将文字、声音、图像转化成矩阵。对于文本数据首先要进行分词(tokenization),移除停止词(stop words),然后将词语转化成矩阵形式,然后再输入机器学习模型中,这个过程称为特征提取(feature extraction)或者向量化(vectorization)。

算法 机器学习 函数 分词 自然语言处理 scikit-learn 向量化

聊一聊双十一背后的技术 - 分词和搜索

标签 PostgreSQL , 分词 , 全文索引 , rum , 搜索引擎 , 双十一 , tsvector , tsquery

PostgreSQL 阿里云 mysql 搜索 postgres HTTPS 双十一 数据库 分词 搜索引擎 aliyun phrase token lexeme 模糊查询

Tiny中文分词

算法 java 分词 TINY

关于中文处理方面的研究

java 分词 lucene 输入法 语义

1
GO