阿里云ACE共创空间——大数据方案体验2 Elasticsearch

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介:

从阿里云的官方文档中先查看了下Elasticsearch这个产品的特点:

特点及优势

  • 分布式的实时文件存储,每个字段都被索引并可被搜索
  • 分布式的实时分析搜索引擎
  • 商业版X-pack插件,提供企业级权限管控、实时系统监控等强大服务
  • 可弹性扩展到上百台服务器规模,处理PB级结构化或非结构化数据
  • 支持IK analyzer插件
  • Elastic官方技术支持团队7*24小时技术支持

预置插件

阿里云Elasticsearch预置插件如下(包含但不完全包含):

  • IK Analyzer:IK Analyzer是一个开源的,基于java语言开发的中文分词工具包。是开源社区中处理中分分词非常热门的插件。

  • pinyin Analyzer:拼音分词器。

  • Smart Chinese Analysis Plugin:lucene默认的中文分词器。

  • ICU Analysis plugin:lucene自带的ICU分词,ICU是一套稳定、成熟、功能强大、轻便易用和跨平台支持Unicode 的开发包。

  • Japanese (Kuromoji) Analysis plugin:日文分词器。

  • Mapper Attachments Type plugin:附件类型插件,通过tika库将各种类型格式解析成字符串。


归纳下这个产品的几个特点供之后的试验中参考,这个产品最重要的特点是分布式和实时,在这个基础上可以做字段的搜索任务,搜索任务中的分词功能通过预置的插件完成的,按文档的说明目前支持中文、拼音和日文。因为实时是这个产品的重点所以对弹性的要求比较高,在之后的试验中也关注下这个弹性可以怎么配置。


进入管理控制台后首先需要创建实例,这个创建的过程和ECS非常类似,但是有个别地方还是有些区别,梳理了下整个实例创建过程如下:

1、付费方式:预付费和后付费,其中预付费方式只支持包月,和ECS不同。

2、地域和可用区的选择:按照自己的需求选择地域和可用区,不同的地域的费用可能会有不同。

3、X-Pack版本:按照文档对此产品的说明,商业版X-pack插件是提供企业级权限管控、实时系统监控等服务的插件,是本产品的核心插件,所以有两个版本可以供选择。

4、网络类型:只支持专用网络,也就是经典网络的架构方式是不支持的。既然是VPC下就需要选择虚拟交换机。

5、在实例挂载的数据盘选择上大部分的地域都能够选择云盘型和本地SATA盘型,仅有部分区域支持本地SSD盘。

6、实例的规格上有很多种可以选择,性能从低到高,但是目前1核2G规格的实例不提供售后保障,只能支持测试,不建议用于生产。

7、在实例的选择上可以选择专有主节点和协调节点来满足弹性需求,并且专有主节点和协调节点的实例规格可以不一样。

8、在存储方面只能选择云盘存储的方式,默认是SSD云盘,也可以选择高效云盘,根据IOPS可能的实际情况来进行选择。

9、按量付费的计算方式是按照小时来进行收费,收费根据地域、实例规格、存储、协调节点的数量而有差异。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
3月前
|
存储 数据库 Python
阿里云向量检索服务 | 全性能搜索方案
【1月更文挑战第13天】阿里云向量检索服务 | 全性能搜索方案
阿里云向量检索服务 | 全性能搜索方案
|
21天前
|
canal 消息中间件 关系型数据库
【分布式技术专题】「分布式技术架构」MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步
【分布式技术专题】「分布式技术架构」MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步
66 0
|
2月前
|
算法 搜索推荐 关系型数据库
Elasticsearch算分优化方案之rescore_query
Elasticsearch算分优化方案之rescore_query
27 0
|
2月前
|
存储 弹性计算 固态存储
阿里云服务器租用费用1t空间多少钱?全面解析
阿里云服务器租用费用1t空间多少钱?1T空间如果是系统盘SSD云盘价格是3686元一年、ESSD云盘1t空间是5222元一年,ESSD Entry云盘1024G存储空间价格是2580元一年。阿里云百科整理几款不同的云盘1t空间价格
|
2月前
|
存储 固态存储 块存储
阿里云服务器租用费用1t空间多少钱?
阿里云服务器租用费用1t空间多少钱?阿里云服务器租用费用1t空间多少钱?1T空间如果是系统盘SSD云盘价格是3686元一年、ESSD云盘1t空间是5222元一年,ESSD Entry云盘1024G存储空间价格是2580元一年。阿里云百科整理几款不同的云盘1t空间价格
461 1
|
2月前
|
云安全 弹性计算 Linux
2024年幻兽帕鲁服务器 阿里云部署方案(图文教程)
《幻兽帕鲁》是一部引人入胜的开放世界冒险游戏,让玩家与神秘生物建立紧密联系,展开多样化的战斗、建设和探险。通过与神奇生物“帕鲁”的互动,玩家在《幻兽帕鲁》中体验奇幻冒险,感受开放世界的精彩魅力。不少玩家都对如何搭建幻兽帕鲁服务器感到关心,下面小编整理了一份详尽的服务器搭建教程,让你轻松上手。
|
3月前
|
存储 边缘计算 人工智能
|
3月前
|
存储 边缘计算 人工智能
|
25天前
|
Ubuntu JavaScript 关系型数据库
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
在阿里云Ubuntu 20.04服务器上部署Ghost博客的步骤包括创建新用户、安装Nginx、MySQL和Node.js 18.x。首先,通过`adduser`命令创建非root用户,然后安装Nginx和MySQL。接着,设置Node.js环境,下载Nodesource GPG密钥并安装Node.js 18.x。之后,使用`npm`安装Ghost-CLI,创建Ghost安装目录并进行安装。配置过程中需提供博客URL、数据库连接信息等。最后,测试访问前台首页和后台管理页面。确保DNS设置正确,并根据提示完成Ghost博客的配置。
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
|
29天前
|
存储 分布式计算 网络协议
阿里云服务器内存型r7、r8a、r8y实例区别参考
在阿里云目前的活动中,属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y这几个实例规格,相比于活动内的经济型e、通用算力型u1实例来说,这些实例规格等性能更强,与计算型和通用型相比,它的内存更大,因此这些内存型实例规格主要适用于数据库、中间件和数据分析与挖掘,Hadoop、Spark集群等场景,本文为大家介绍内存型r7、r8a、r8y实例区别及最新活动价格,以供参考。
阿里云服务器内存型r7、r8a、r8y实例区别参考

热门文章

最新文章