备案控制台

开发者社区

开发者社区大数据与机器学习开源大数据平台 E-MapReduce 文章正文

钉钉群直播【Spark Relational Cache 原理和实践】

2019-06-24 8926

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 主要介绍Relational Cache/物化视图的历史和背景，以及EMR Spark基于Relational Cache加速Spark查询的技术方案，及如何通过基于Relational Cache的数据预计算和预组织，使用Spark支持亚秒级响应的交互式分析使用场景。

直播回看点我

直播主题：

【Spark Relational Cache 原理和实践】

时间：

6月26日 19：00-20：00

分享嘉宾：

李呈祥，阿里巴巴计算平台事业部EMR团队的高级技术专家，Apache Hive Committer， Apache Flink Committer，深度参与了Hadoop，Hive，Spark，Flink等开源项目的研发工作，对于SQL引擎，分布式系统有较为深入的了解和实践，目前主要专注于EMR产品中开源计算引擎的优化工作。

内容介绍：

主要介绍Relational Cache/物化视图的历史和背景，以及EMR Spark基于Relational Cache加速Spark查询的技术方案，及如何通过基于Relational Cache的数据预计算和预组织，使用Spark支持亚秒级响应的交互式分析使用场景。

_Spark_Relational_Cache___

文章标签：

开源大数据平台 E-MapReduce

分布式计算

Spark

SQL

关键词：

apache spark原理

apache spark实践

钉钉直播

apache spark cache

apache spark钉钉

相关实践学习

数据湖构建DLF快速入门

本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析，介绍数据湖构建DLF产品的数据发现和数据探索功能。

快速掌握阿里云 E-MapReduce

E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上，利用开源大数据生态系统，包括 Hadoop、Spark、HBase，为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。本课程主要介绍阿里云 E-MapReduce 的使用方法。

开源大数据EMR

目录

相关文章

热烈的马

|

4月前

|

存储分布式计算负载均衡

【大数据技术Hadoop+Spark】MapReduce概要、思想、编程模型组件、工作原理详解（超详细）

【大数据技术Hadoop+Spark】MapReduce概要、思想、编程模型组件、工作原理详解（超详细）

热烈的马

59 0 0

热烈的马

|

4月前

|

存储分布式计算 Hadoop

【大数据技术Hadoop+Spark】HDFS概念、架构、原理、优缺点讲解（超详细必看）

【大数据技术Hadoop+Spark】HDFS概念、架构、原理、优缺点讲解（超详细必看）

热烈的马

118 0 0

朱季谦

|

5月前

|

分布式计算 Java Spark

图解Spark Graphx实现顶点关联邻接顶点的collectNeighbors函数原理

图解Spark Graphx实现顶点关联邻接顶点的collectNeighbors函数原理

朱季谦

35 0 0

热烈的马

|

4月前

|

存储分布式计算大数据

【大数据技术Hadoop+Spark】Spark RDD设计、运行原理、运行流程、容错机制讲解（图文解释）

【大数据技术Hadoop+Spark】Spark RDD设计、运行原理、运行流程、容错机制讲解（图文解释）

热烈的马

67 0 0

热烈的马

|

4月前

|

分布式计算资源调度大数据

【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）

【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）

热烈的马

183 0 0

我是廖志伟

|

6月前

|

SQL 分布式计算算法

【大数据处理框架】Spark大数据处理框架，包括其底层原理、架构、编程模型、生态圈

【大数据处理框架】Spark大数据处理框架，包括其底层原理、架构、编程模型、生态圈

我是廖志伟

232 0 1

梦想new的出来

|

SQL 分布式计算 Java

五、【计算】Spark原理与实践（下） | 青训营笔记

五、【计算】Spark原理与实践（下） | 青训营笔记

梦想new的出来

173 0 0

五、【计算】Spark原理与实践（下） | 青训营笔记

auqbllxiu

|

分布式计算 Spark

《阿里巴巴Spark实践与探索》电子版地址

阿里巴巴Spark实践与探索

auqbllxiu

56 0 0

《阿里巴巴Spark实践与探索》电子版地址

bigtub

宜搭4.0发布-钉钉2022年度发布会低代码专场直播回放

宜搭4.0发布回放

bigtub

634 0 0

宜搭4.0发布-钉钉2022年度发布会低代码专场直播回放

azlr2a666ct4i

|

存储 SQL 分布式计算

Spark 原理｜青训营笔记

Spark Core：Spark核心组件，它实现了Spark的基本功能，包含任务调度、内存管理、错误恢复、与存储系统交互等模块。

azlr2a666ct4i

198 0 0

大数据与机器学习

开源大数据平台 E-MapReduce

热门文章

最新文章

阿里封神谈hadoop生态学习之路

Spark in action on Kubernetes - Playground搭建与架构浅析

梨视频：基于阿里云E-MapReduce搭建视频推荐系统的实践

基于Alluxio系统的Spark DataFrame高效存储管理技术

HIVE MapJoin异常问题处理总结

漫谈分布式计算框架

5W1H(六何分析法)全景洞察大数据

助力云上开源生态 - 阿里云开源大数据平台的发展

Apache Spark 3.0 将内置支持 GPU 调度

Flume NG 简介及配置实战

基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成（RAG）系统

通过阿里云向量检索 Milvus 版和通义千问快速构建基于专属知识库的问答系统

EMR Notebook 开启公测，提供交互式数据分析平台

Apache Hadoop入门指南：搭建分布式大数据处理平台

阿里云向量检索 Milvus 版开启公测，助力企业打造高质量 AI 服务

Paimon 与 Spark 的集成（二）：查询优化

阿里云 EMR Serverless Spark 版免费邀测中

实用工具推荐：适用于 TypeScript 网络爬取的常用爬虫框架与库

1688API接口推荐：1688口令转换真实链接接口

1688API接口推荐：1688按图搜索拍立淘数据接口

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

钉钉小程序——为工作方式插上翅膀

钉钉客户端自动化的应用

使命必达 —— 钉钉企业级消息服务的机遇与挑战

相关实验场景

更多

使用阿里云Elasticsearch体验信息检索加速

星轨-钉钉APP分发实训

基于MaxCompute的热门话题分析

钉钉群中如何接收IoT温控器数据告警通知

RocketMQ的常规运维实践应用

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）