海量数据计算应该如何选择数据库

  1. 云栖社区>
  2. 博客>
  3. 正文

海量数据计算应该如何选择数据库

sunlovesi 2016-07-24 09:29:18 浏览1829
展开阅读全文

背景

随着大数据的应用越来越广泛,应用的行业也越来越低,我们每天都可以看到大数据的一些新奇的应用,从而帮助人们从中获取到真正有用的价值。在阿里云的云数据库RDS版中,提供了大数据计算服务(MaxCompute,原名ODPS),它是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。通过数据集成服务,可将 RDS 数据导入 MaxCompute,实现大规模的数据计算。下面以 MaxCompute RDS 搭配为例介绍大数据应用计算方案。

前提

需开通 MaxCompute 服务,并完成项目设置。

需开通数据集成服务

 

操作步骤

 

   1. 登录 RDS 管理控制台,选择目标实例。

   2. 在 RDS 实例上增加数据集成的白名单。

   67c5b5bee90935fcb1df49fb948365108635e50e

   3.登录 MaxCompute 管理控制台,创建 MaxCompute 数据表。

1adfbda6b9fd6f8844c678bb96c29910c09860bf

4. 登录 数据集成管理控制台,设置 RDS 源库和 MaxCompute 目标库信息。

b424c5088341f6c3ad38287dec20fc872ca052a2

5 设置数据集成同步字段。

488a8a4cc81f3dbf7f855260c40dd74c85df216a

6.设置数据集成速度与出错控制。

b17ff84f35fe7000353a180ae79b1ba1b4c7051f

7. 完成设置后,将数据导入 MaxCompute。

 

8.登录 MaxCompute 管理控制台,执行查询操作,如下图所示。

2c8ce99ba40a6e660b2a9477ebbc78b5fad4efcf


参考

基于MaxCompute的大数据计算


网友评论

登录后评论
0/500
评论
sunlovesi
+ 关注