EMR弹性低成本离线大数据分析

  1. 云栖社区>
  2. 博客>
  3. 正文

EMR弹性低成本离线大数据分析

最佳实践小文 2020-01-13 15:25:57 浏览17721
展开阅读全文

场景描述

布式计算框架系统分别为Hadoop、Spark和Storm, Hadoop可以运用在很多商业应用系统,可以轻松集成结构化、半结构化以及非结构化数据集,Spark采用了内存计算,允许数据载入内存作反复查询,融合数据仓库、流处理和图形计算等多种计算范式,Spark能够与Hadoop 很好地结合,Storm用于处理高速、大型数据流的分布式实时计算系用,为Hadoop添加可靠的实时数据处理能力。海量离线数据分析可以应用于多种商业系统环境,例如电商海量日志分析、用户行为画像分析;科研行业例如海量离线计算分析和数据查询;游戏行业的游戏日志分析、用户行为分析。

方案优势

  • 高性能、低成本
  • 快速部署
  • 高弹性
  • 多种计算模式
  • 无缝对接开源生态
  • 一站式管理平台

产品列表

  • E-MapReduce EMR
  • 日志服务 SLS
  • 对象存储 OSS
  • 弹性伸缩服务 ESS
  • 抢占式 ECS 实例

image

直达最佳实践 》》

image

网友评论

登录后评论
0/500
评论
最佳实践小文
+ 关注