备案控制台

开发者社区

开发者社区大数据文章正文

【Spark Summit EU 2016】快速数据处理最佳拍档：Spark+ Ignite

2017-02-14 1784

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Christos Erotocritou在Spark Summit EU 2016上的演讲，主要介绍了Apache的通用数据库缓存系统——Ignite项目，Apache Ignite允许用户将常用的热数据储存在内存中，它支持分片和复制两种方式，让开发者可以均匀地将数据分布式到整个集群的主机上。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Christos Erotocritou在Spark Summit EU 2016上的演讲，主要介绍了Apache的通用数据库缓存系统——Ignite项目，Apache Ignite允许用户将常用的热数据储存在内存中，它支持分片和复制两种方式，让开发者可以均匀地将数据分布式到整个集群的主机上。同时，Ignite还支撑任何底层存储平台，不管是RDBMS、NoSQL，又或是HDFS。

除此之外，Christos Erotocritou还介绍了Hadoop与Spark进行集成以及Spark与Ignite集成，以及内存文件系统等相关内容。

6e75de8dca6bd08ad11e8dcd8aa74f0cfe7002fe

25b2cbf83ee92e5a6bb29b4179f2a0dd57f2b087

08113c564610043caa32a347d65b293c9582cf9c

d5695a2b1103f4d53b87c9022e43530de666ae83

7aea63c67a613385084a7a1afd957e3b3287a249

4bb63c3b4b4e47d939236612a869ea73400bc240

1fc9f67f386caf527afd178510681b71b20203cd

55de5115ca9f74abfd80f41fdf6d2304b72a6ac2

61f2e08aa44e0989a2bb985231d37f30407cce42

6db1ac46ea471b1a6d5de5568e141c6f00287c5c

ebd41cd9ac16a7df66601c8644636f54ed08e091

759a906d4ad2bf2c379a562c51f5bc860e9012d4

f27eb007cc999f8a22e4b76b724b1a4a3d621891

a633bc3c01070a1a4641b159a554c5d70f0862b2

d8072ae9c31fce5ac26b7ee40ff77eee0af439c5

a729e500f0a15a579be6ef5b5cb3c176e01ada88

652f05a263042ec0ef63b770f72c87dd3cc7ab5c

31c76c9a4af5611a366cab4098f9aea3c8315287

184a9ad09f9e3a874540df38eb2c996f7ca47b76

ff31cff2c510ad6cb812db069b7af8fd47cf90ab

9cb8d10a0442bc8ce63df0c6bf238f302b637f7b

22458b55e117110cc04adb9c73b5da6f58e57cd5

c87b4775686859b1a643e611cca5eecb37b46f2f

1f101d4a49466426c79a637dd479ca60e7ac6b82

8f25a3cd68ae83cac986f3268f26c307720c83a6

文章标签：

Apache

数据库

存储

分布式计算

Spark

数据处理

Hadoop

缓存

开发者

MaxCompute

关键词：

apache spark数据处理

apache spark summit

apache spark ignite

apache spark summit eu

apache spark summit eu数据处理

小猫吃鱼569

目录

相关文章

晓之以理的喵~~

|

3月前

|

分布式计算 Hadoop 关系型数据库

Sqoop与Spark的协作：高性能数据处理

Sqoop与Spark的协作：高性能数据处理

晓之以理的喵~~

54 0 0

Sqoop与Spark的协作：高性能数据处理

晓之以理的喵~~

|

3月前

|

消息中间件分布式计算 Kafka

Spark与Kafka的集成与流数据处理

Spark与Kafka的集成与流数据处理

晓之以理的喵~~

225 0 0

晓之以理的喵~~

|

3月前

|

分布式计算监控数据处理

实时数据处理概述与Spark Streaming简介

实时数据处理概述与Spark Streaming简介

晓之以理的喵~~

40 0 0

故事未完·

|

9月前

|

分布式计算 Hadoop Java

Hadoop生态系统中的流式数据处理技术：Apache Flink和Apache Spark的比较

Hadoop生态系统中的流式数据处理技术：Apache Flink和Apache Spark的比较

故事未完·

272 0 0

auqbllxiu

|

分布式计算数据处理分布式数据库

《基于HBase和Spark构建企业级数据处理平台》电子版地址

基于HBase和Spark构建企业级数据处理平台

auqbllxiu

88 0 0

《基于HBase和Spark构建企业级数据处理平台》电子版地址

山顶夕景

|

分布式计算 Java 网络安全

【Spark】(task1)PySpark基础数据处理

）Scala 是一门多范式（multi-paradigm）的编程语言，设计初衷是要集成面向对象编程和函数式编程的各种特性。 Scala 运行在 Java 虚拟机上，并兼容现有的 Java 程序。

山顶夕景

297 0 0

【Spark】(task1)PySpark基础数据处理

ShowMeAI

|

机器学习/深度学习消息中间件 SQL

图解大数据 | Spark Streaming @流式数据处理

Spark Streaming是Spark核心API的一个扩展，可以实现实时数据的可拓展，高吞吐量。本文讲解Spark Streaming的架构、作业提交和工作原理，以及DStream的创建、转换和Graph，并通过案例代码展示应用的细节。

ShowMeAI

708 0 0

图解大数据 | Spark Streaming @流式数据处理

阿里云E-MapReduce团队

|

SQL 人工智能分布式计算

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

超乎你想象的干货合集打包带走！

阿里云E-MapReduce团队

22613 0 0

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

阿里云E-MapReduce团队

|

人工智能分布式计算 Spark

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

阿里云E-MapReduce团队

881 0 0

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

阿里云E-MapReduce团队

|

机器学习/深度学习人工智能分布式计算

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题介绍

阿里云E-MapReduce团队

1541 0 0

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题

热门文章

最新文章

【Flink】Flink跟Spark Streaming的区别？

大数据技术与Python：结合Spark和Hadoop进行分布式计算

bigdata-36-Spark转换算子与动作算子

图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例

Spark 源码分析 -- BlockStore

BR-MLP基于spark+Hadoop分布式数据挖掘解决方案功能剖析

地铁译：Spark for python developers --- 搭建Spark虚拟环境3

Spark RDD类源码阅读

7月24日晚Spark社区直播：【Apache Spark 基于 Apache Arrow 的列式存储优化】

【Flink】Flink跟Spark Streaming的区别？

大数据技术与Python：结合Spark和Hadoop进行分布式计算

bigdata-36-Spark转换算子与动作算子

Paimon 与 Spark 的集成（二）：查询优化

阿里云 EMR Serverless Spark 版免费邀测中

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark环境搭建与使用

Spark学习---day07、Spark内核（Shuffle、任务执行）

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）