【Elasticsearch全文搜索引擎实战】之集群搭建及配置

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 文中Elasticsearch版本为6.0.11. 环境配置把环境配置放在第一节来讲,是因为很多人按官网的Getting Started安装运行会有各种错误。其实都是因为一些配置不正确引起的。首先,Elasticsearch不能以root账号运行,所以我们需要单独建立用户授权运行。

文中Elasticsearch版本为6.0.1

1. 环境配置

把环境配置放在第一节来讲,是因为很多人按官网的Getting Started安装运行会有各种错误。其实都是因为一些配置不正确引起的。
首先,Elasticsearch不能以root账号运行,所以我们需要单独建立用户授权运行。
对于非root账号Linux可以进行并发操作,但是文件、线程都有限制,所以,部署Elasticsearc的机器需要进行相应配置。

  • 修改文件限制
# 修改系统文件
vi /etc/security/limits.conf

# 增加的内容

* soft nofile 65536
* hard nofile 65536
* soft nproc 2048
* hard nproc 4096
  • 调整进程数
# 修改系统文件
vi /etc/security/limits.d/90-nproc.conf

# 调整成以下配置
*          soft    nproc     4096
root       soft    nproc     unlimited
  • 调整虚拟内存&最大并发连接
# 修改系统文件
vi /etc/sysctl.conf

# 增加的内容
vm.max_map_count=655360
fs.file-max=655360

保存之后执行 sysctl -p 生效

  • 创建Elasticsearch专用用户
useradd es
  • 创建ELK相关目录并赋权
#创建Elasticsearch APP目录
mkdir /usr/elasticsearch
#创建Elasticsearch日志目录 数据目录
mkdir var/lib/elasticsearch
#创建Elasticsearch日志目录
mkdir var/logs/elasticsearch


#更改目录Owner
chown -R es:es /usr/elasticsearch
chown -R es:es var/lib/elasticsearch
chown -R es:es var/logs/elasticsearch
  • 下载Elasticsearch包并解压
https://www.elastic.co/guide/en/elasticsearch/reference/current/zip-targz.html
#打开文件夹
cd /home/download

#下载
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.0.1.tar.gz

#解压
tar -zvxf elasticsearch-6.0.0.tar.gz

2. Elasticsearch 部署

本次一共要部署两个Elasticsearch节点,所有文中没有指定机器的操作都表示每个Elasticsearch机器都要执行该操作

  • 移动Elasticsearch到统一目录
#移动目录
mv /home/download/elasticsearch-6.0.1 /usr/elasticsearch
#赋权
chown -R elk:elk /usr/elasticsearch/
  • 开放端口(CentOS7+)
# 增加端口
firewall-cmd --add-port=9200/tcp --permanent
firewall-cmd --add-port=9300/tcp --permanent
  • 重新加载防火墙规则(CentOS7+)
firewall-cmd --reload
  • 切换账号
#账号切换到 es
su - es

2. Elasticsearch集群配置

  • 修改配置
#打开目录
cd /usr/elasticsearch

#修改配置

vi config/elasticsearch.yml
  • 主节点配置(192.168.180.1)
cluster.name: es 
node.name: node-1
path.data: /var/lib/elasticsearch
path.logs: /var/logs/elasticsearch
network.host: 192.168.180.1
http.port: 9200
node.master: true
node.data: true
discovery.zen.ping.unicast.hosts: ["192.168.180.1:9300","192.168.180.2:9300"]
discovery.zen.minimum_master_nodes: 2
  • 从节点配置(192.168.180.2)
cluster.name: es 
node.name: node-2
path.data: /var/lib/elasticsearch
path.logs: /var/logs/elasticsearch
network.host: 192.168.180.2
http.port: 9200
node.master: false
node.data: true
discovery.zen.ping.unicast.hosts: ["192.168.1.31:9300","192.168.1.32:9300"]
discovery.zen.minimum_master_nodes: 2
  • 配置参数说明
参数 说明
cluster.name 集群名
node.name 节点名
path.data 数据保存目录
path.logs 日志保存目录
network.host 节点host/ip
http.port HTTP访问端口
node.master 是否允许作为主节点
node.data 是否保存数据
discovery.zen.ping.unicast.hosts 集群中的主节点的初始列表,当节点(主节点或者数据节点)启动时使用这个列表进行探测
discovery.zen.minimum_master_nodes master选举最少的节点数,这个一定要设置为N/2+1,其中N是:N是具有master资格的节点的数量,而不是整个集群节点个数

3. 启动Elasticsearch

  • 运行
#进入elasticsearch根目录
cd /usr/elasticsearch
#启动 (-d 为后台运行)
./bin/elasticsearch -d
  • 验证

访问http://192.168.180.1:9200/,可以看到如下内容则表示成功:

{     
name: "node-1",    
cluster_name: "es",    
cluster_uuid: "Tum8l98uQfK0LdS-KnsWxg",    
version: {    
number: "6.0.1",    
build_hash: "601be4a",  
build_date: "2017-12-04T09:29:09.525Z",    
build_snapshot: false,    
lucene_version: "7.0.1",    
minimum_wire_compatibility_version: "5.6.0",    
minimum_index_compatibility_version: "5.0.0"    
},    
tagline: "You Know, for Search"    
}   
  • 健康状态检查

访问http://192.168.180.1:9200/,status返回green则表示正常。

{
cluster_name: "es",
status: "green",
timed_out: false,
number_of_nodes: 2,
number_of_data_nodes: 2,
active_primary_shards: 16,
active_shards: 32,
relocating_shards: 0,
initializing_shards: 0,
unassigned_shards: 0,
delayed_unassigned_shards: 0,
number_of_pending_tasks: 0,
number_of_in_flight_fetch: 0,
task_max_waiting_in_queue_millis: 0,
active_shards_percent_as_number: 100
}

4. Head插件

Elasticsearch head是一个用浏览器跟ES集群交互的插件,可以查看集群状态、集群的doc内容、执行搜索和普通的Rest请求等。
具体安装配置请参考另外一篇博文:http://www.cnblogs.com/mantoudev/p/8269345.html

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
3小时前
|
存储 自然语言处理 搜索推荐
分布式搜索引擎ElasticSearch
Elasticsearch是一款强大的开源搜索引擎,用于快速搜索和数据分析。它在GitHub、电商搜索、百度搜索等场景中广泛应用。Elasticsearch是ELK(Elasticsearch、Logstash、Kibana)技术栈的核心,用于存储、搜索和分析数据。它基于Apache Lucene构建,提供分布式搜索能力。相比其他搜索引擎,如Solr,Elasticsearch更受欢迎。倒排索引是其高效搜索的关键,通过将词条与文档ID关联,实现快速模糊搜索,避免全表扫描。
51 2
|
3小时前
|
存储 运维 监控
Elasticsearch 配置文件 path.data 中可以配置多个数据目录的路径吗?
Elasticsearch 配置文件 path.data 中可以配置多个数据目录的路径吗?
32 7
|
3小时前
|
存储 监控 安全
Elasticsearch 8.X 集群 SSL 证书到期了,怎么更换?
Elasticsearch 8.X 集群 SSL 证书到期了,怎么更换?
33 3
|
3小时前
|
人工智能 自然语言处理 开发者
Langchain 与 Elasticsearch:创新数据检索的融合实战
Langchain 与 Elasticsearch:创新数据检索的融合实战
31 10
|
3小时前
|
canal 自然语言处理 关系型数据库
Elasticsearch 线上实战问题及解决方案探讨
Elasticsearch 线上实战问题及解决方案探讨
17 0
|
3小时前
|
监控 API 索引
实战问题:Elasticsearch 2.X 数据如何迁移到 7.X?
实战问题:Elasticsearch 2.X 数据如何迁移到 7.X?
11 0
|
3小时前
|
存储 Serverless 定位技术
深度探索 Elasticsearch 8.X:function_score 参数解读与实战案例分析
深度探索 Elasticsearch 8.X:function_score 参数解读与实战案例分析
10 0
|
3小时前
|
Java Maven 开发工具
【ElasticSearch 】IK 分词器安装
【ElasticSearch 】IK 分词器安装
23 1
|
3小时前
|
数据可视化 索引
elasticsearch head、kibana 安装和使用
elasticsearch head、kibana 安装和使用
|
3小时前
|
Java Windows
windows下 安装 Elasticsearch报错warning: usage of JAVA_HOME is deprecated, use ES_JAVA_HOME
windows下 安装 Elasticsearch报错warning: usage of JAVA_HOME is deprecated, use ES_JAVA_HOME
43 0