一分钟了解阿里云产品:表格存储

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介:

一、             概述

 

阿里云产品种类繁多,今天让我们一起来瞧瞧表格存储(Table Store)吧。

 

什么是表格存储呢?

 

简单来说,表格存储是构建在阿里云飞天分布式系统之上的NoSQL数据存储服务,提供海量结构化数据的存储和实时访问。表格存储以实例和表的形式组织数据,通过数据分片和负载均衡技术,实现规模上的无缝扩展。应用通过调用表格存储 API / SDK 或者操作管理控制台来使用表格存储服务。

 

 

那么,表格存储有什么优势呢?

 

  • 表格存储具有很好的扩展性。应用在创建表的时候,需要根据业务访问的情况来配置预留读/写吞吐量。Table Store根据表的预留读/写吞吐量进行资源的调度和预留,从而保证应用获得可预期的性能。在使用过程中,应用还可以根据应用的情况动态修改预留读/写吞吐量。Table Store表的数据量没有上限,随着表数据量的不断增大,Table Store会进行数据分区的调整从而为该表配置更多的存储。
  •  表格存储在数据可靠性上也是值得信赖的。Table Store通过存储多个数据备份及备份失效时的快速恢复,提供极高的数据可靠性。
  • 表格存储具备高可用性。通过自动的故障检测和数据迁移,Table Store对应用屏蔽了机器和网络的硬件故障,提供高可用性。
  •  表格存储管理便捷,对应用的每一次请求都进行身份认证和鉴权,以防止未授权的数据访问,确保数据访问的安全性。
  •  表格存储保证数据写入强一致,写操作一旦返回成功,应用就能立即读到最新的数据。
  • Table Store的表无固定格式要求,每行的列数可以不相同,支持多种数据类型(Integer、Boolean、Double、String、Binary)。

 

此外,表格存储根据用户预留和实际使用的资源进行收费,起步门槛低。用户可以从Table Store控制台实时获取每秒请求数、平均响应延时等监控信息。

 

 

目前,施耐德、够快等都在使用表格存储。

 

 

表格存储典型特性介绍:

https://www.aliyun.com/product/ots/?spm=5176.383518.3.17.35dh1C

 

 

 

二、             技术点(表格存储五大热点技术问题分析)

 

在上一篇文章中,我们为大家介绍表格存储的概况,表格存储(Table Store)是构建在阿里云飞天分布式系统之上的NoSQL数据存储服务,提供海量结构化数据的存储和实时访问。那在使用过程中,经常遇到的热门技术问题有哪些呢?

 

控制台使用:

https://help.aliyun.com/document_detail/ots/Getting-Started/instance_management.html?spm=5176.docots/Getting-Started/ots_console.6.88.oeD7cV

 

数据表管理:

https://help.aliyun.com/document_detail/ots/Getting-Started/table_management.html?spm=5176.docots/Getting-Started/instance_management.6.89.g7Civ4

 

表格存储TableStore支持的操作:

https://help.aliyun.com/knowledge_detail/5974469.html?spm=5176.788315012.2.4.QxIe8D

 

表格存储Table Store-建表时的注意事项:

https://help.aliyun.com/knowledge_detail/5974484.html?spm=5176.788315012.2.5.QxIe8D

 

Table Store 表的最佳实践:

https://help.aliyun.com/document_detail/ots/BestPractice/table.html?spm=5176.docots/BestPractice/Tools.6.155.hgnvaw

 

 

希望上面的内容,能够对大家有所帮助。

 

 

 

三、             体验(表格存储结合Elasticsearch构建爬虫搜索引擎)

 

今天给大家带来一篇技术文章,结合表格存储和Elasticsearch构建一个爬虫搜索引擎,非常有意思。只需要简单的几个命令即可构建一个Demo,欢迎感兴趣的人尝试。

 

Elasticsearch是一个实时分布式搜索和分析引擎,它的索引和搜索功能非常强大,所以使用场景很丰富。Elasticsearch基于Lucene,Lucene是一个非常复杂的搜索引擎库,而Elasticsearch提供的是更易用的一体化的分布式实时搜索应用。

 

下面就来一起看一下吧。

 

目标:爬取特定网站的页面,将页面内容保存在TableStore中,在Elasticsearch中建立网站的索引,通过web页面搜索框的形式,对爬取的页面进行搜索。

 

以天涯论坛为例,一套简单的方案:

 

爬取天涯论坛的帖子页面,提取的信息包括Url,标题,帖子内容。数据首先存入TableStore中,主键为随机的一个UUID,同时将Url、标题、帖子内容、UUID导入Elasticsearch中建立索引,Elasticsearch只保存Url、标题和UUID,不保存帖子内容。同时构建一个网页,通过搜索框输入关键词,在Elasticsearch中搜索获取结果。

 

1. 整个方案涉及四个模块:TableStore、Elasticsearch、Spider、Web。

 

2. TableStore不需要搭建,只需要开通服务、建表即可。我们使用TableStore来存取页面数据,每个页面的数据保存为TableStore的一行,使用UpdateRow写入,使用GetRow读出。

 

3. Elasticsearch需要在ECS中搭建起来,搭建Elasticsearch非常简单,只需要下载下来运行启动脚本即可。与TableStore建表类似,在搭建完成Elasticsearch之后,需要在Elasticsearch中建立索引(Index),并需要在索引上建立映射(Mapping)。

 

4. Spider具体爬取页面,我们选取了一个简单易用的开源爬虫软件,WebMagic。使用WebMagic的接口,我们可以方便的把爬取的页面数据存入TableStore和Elasticsearch。

 

5. Web指网页搜索的前后端。出于开发效率的考虑,我们选择一些接口简单易用的工具进行开发,后端使用一个Python的web框架flask,前端使用vue.js。

 

 

快速部署与体验

 

1.       项目代码解压后结构如下所示, 请先阅读README.md文件:

ca928914876ffed133d9c1d0e391cdc447b3c894

 

2.执行以下命令生成配置文件:

cp config.ini.template config.ini

3.修改配置文件,填入endpoint, accessid, accesskey, instancename等信息,需要在阿里云官网开通表格存储服务,然后创建实例。

4. 安装相关软件。

5. 初始化:

启动Elasticsearch。

初始化TableStore表和Elasticsearch索引。

6. 运行爬虫。

7. 运行搜索Web界面。

8. 访问:

446cba1410d3f315f758cb23ed564088fee05187

 

以上就是我使用表格存储的部分经验,希望大家有所收获。

 

如果您想详细了解表格存储,请访问:

https://bbs.aliyun.com/read/267146.html?spm=5176.bbsl226.0.0.p5BHrb

 

 

深入浅出OTS

https://bbs.aliyun.com/read/261983.html?spm=5176.bbsl226.0.0.q8iF7R

 

OTS Java SDK优化实践:

https://bbs.aliyun.com/read/262760.html?spm=5176.bbsl226.0.0.aFLZz9

 

相关实践学习
阿里云表格存储使用教程
表格存储(Table Store)是构建在阿里云飞天分布式系统之上的分布式NoSQL数据存储服务,根据99.99%的高可用以及11个9的数据可靠性的标准设计。表格存储通过数据分片和负载均衡技术,实现数据规模与访问并发上的无缝扩展,提供海量结构化数据的存储和实时访问。 产品详情:https://www.aliyun.com/product/ots
目录
相关文章
|
22天前
|
关系型数据库 分布式数据库 数据库
成都晨云信息技术完成阿里云PolarDB数据库产品生态集成认证
近日,成都晨云信息技术有限责任公司(以下简称晨云信息)与阿里云PolarDB PostgreSQL版数据库产品展开产品集成认证。测试结果表明,晨云信息旗下晨云-站群管理系统(V1.0)与阿里云以下产品:开源云原生数据库PolarDB PostgreSQL版(V11),完全满足产品兼容认证要求,兼容性良好,系统运行稳定。
|
29天前
|
存储 NoSQL 数据库
阿里云数据库Cassandra的产品价格
阿里云数据库Cassandra提供多地域服务,如中国、亚太、欧洲、美洲及中东。计费分为实例主机节点规格费和存储费用,实例价格因节点数和副本数而异,存储费用按挂载云盘计算。生产系统建议配置多节点以确保冗余。公网流量目前免费,具体收费时间未定。详细价格以购买页面为准。
421 3
|
1月前
|
人工智能 监控 Cloud Native
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
|
22天前
|
SQL 存储 API
阿里云实时计算Flink的产品化思考与实践【下】
本文整理自阿里云高级产品专家黄鹏程和阿里云技术专家陈婧敏在 FFA 2023 平台建设专场中的分享。
110425 10
阿里云实时计算Flink的产品化思考与实践【下】
|
3天前
|
API
阿里云微服务引擎及 API 网关 2024 年 3 月产品动态
阿里云微服务引擎及 API 网关 2024 年 3 月产品动态。
|
4天前
|
安全 云计算
电子好书发您分享《阿里云产品手册2024版.阿里云产品手册2024版》
**《阿里云产品手册2024版》电子书分享:** 探索阿里云最新技术与服务,涵盖云计算、安全、移动研发等领域,详尽指南助您高效上云。[阅读链接](https://developer.aliyun.com/ebook/8326/116556?spm=a2c6h.26392459.ebook-detail.4.176b272aLerqlg)
12 1
|
9天前
|
云安全 数据采集 安全
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
阿里云提供两种关键安全产品:Web应用防火墙和云防火墙。Web应用防火墙专注网站安全,防护Web攻击、CC攻击和Bot防御,具备流量管理、大数据防御能力和简易部署。云防火墙是SaaS化的网络边界防护,管理南北向和东西向流量,提供访问控制、入侵防御和流量可视化。两者结合可实现全面的网络和应用安全。
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
|
10天前
|
消息中间件 人工智能 监控
|
18天前
|
消息中间件 Cloud Native Serverless
飞天发布时刻丨阿里云 ApsaraMQ 全面升级,携手 Confluent 发布全新产品
阿里云在3月29日的飞天发布时刻宣布ApsaraMQ全面升级,实现全系产品Serverless化,与Confluent合作推出新产品,强化云原生消息队列服务。
|
25天前
|
存储 弹性计算 Serverless
什么是阿里云FPGA云服务器?FPGA云服务器产品优势及应用场景介绍
FPGA云服务器是阿里云提供的实例规格,融合现场可编程门阵列的低延迟硬件加速与弹性资源。FaaS平台简化了FPGA开发,提供统一硬件、开发环境和丰富的IP生态。特性包括硬件虚拟化、联合仿真和动态互联配置。产品计费与ECS一致,支持多种计费模式。优势在于分钟级交付、高性能加速、经济性价比和设计复用。应用广泛,如视频转码、人工智能、基因测序等。FPGA云服务器通过FPGA镜像、OSS服务等工具进行管理。
什么是阿里云FPGA云服务器?FPGA云服务器产品优势及应用场景介绍

热门文章

最新文章