备案控制台

开发者社区

开发者社区大数据文章正文

【Spark Summit EU 2016】一起聊数据：Elsevier的Spark观

2017-02-12 1716

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Emlyn Whittick在Spark Summit EU上的演讲，他分享了数据的价值与所面临的挑战，并且以烹饪这一形象化的比喻分享了从数据收集到、依靠Spark对数据进行加工、处理等一系列过程，并且在这一过程中也分享了Spark的发展历程。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Emlyn Whittick在Spark Summit EU上的演讲，他分享了数据的价值与所面临的挑战，并且以烹饪这一形象化的比喻分享了从数据收集到、依靠Spark和DataBricks对数据进行加工、处理等一系列过程，并且在这一过程中也分享了Spark的发展历程。

99d4ae0c588e8bb9d2ade2943d84c82946c664b0

1958d6e6a96b4b57905290ae805470ef75894764

500d5db6870adccf3f24ef652ef3eddcec8db9c3

0a65cdb2d2b9b9af2219768d526602882af59f34

cec1971be7560932c5af91662d0dac09878dd4d5

92ec5421aa4c4f6456cc3e9d88c00008d0e2d9d7

12ba5cc82c88dadd30e0740fd05b6ed51a23ea31

aa7a4ad75fbc0cfad68c24dad31c330076438549

6e386e710463bc943e021a3d43ff2fe8b62f7c27

9007752b7c9987ae46b2b580e6f6669a9ec9519d

2fa9431c95fa982924742816c956ab6625de333f

61af8304637c1c01871e4de0932225fadd53501d

119d4d289784e4607c77c3ed9f8083cca55319b5

2c9190f26f2127b37c38e2796e5cb905b77ea742

218b850c9a571478682b3f9aebc2eaa73c6c4d79

6d1d41466f7d7fd4cc6fd1655fd5f72301f5bbac

93c24ebcd3fa790d5aacee097f37ae5f82d57c6c

622dfb5f4aa070b7fda1e91c947bb5f5651cdba1

a8410ede489d4c43abc6600f91f2034fae101d82

eeb4852dfd1a7bc143bb64558487ae4cedf4916b

438aab0e12d87fedff1fa852ab5ab03250477fc8

f4e317f91981e22db1c4fa6d06f8bcf3f4225c06

d24b4e439c8a0a5b9fe326c864009cdaff857071

8806966d6797e70f635f611af90dbfa1c3e7f667

1a0374ce61d8832248f0fdcf58f308d33c2a1306

47d702c2f65b834892d10e19de0cbc66cc37e590

ff0895febb08ff163bb7db256eb52e8da641f5e2

9719bcfc19747bb06200200f559efcb086e408eb

0530aeafc8a4708a8f863fb1d38ad4366c79f6d3

25f023057d95d878ca59eb4afe3727eb8d91ba3d

15983afc1809f24bfaf52177b21b4c04a2a13e36 b7dfd0e5361fdc1aa16dfecafce3c9892406951a

文章标签：

分布式计算

Spark

关键词：

apache spark数据

apache spark summit

apache spark summit eu

apache spark summit eu数据

小猫吃鱼569

目录

相关文章

赵广陆

|

7月前

|

canal 分布式计算关系型数据库

大数据Spark Streaming实时处理Canal同步binlog数据

大数据Spark Streaming实时处理Canal同步binlog数据

赵广陆

112 0 0

建模sister

|

2月前

|

SQL 分布式计算 API

Spark学习------SparkSQL（概述、编程、数据的加载和保存）

Spark学习------SparkSQL（概述、编程、数据的加载和保存）

建模sister

50 2 2

热烈的马

|

4月前

|

分布式计算大数据 Apache

【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解（图文解释超详细）

【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解（图文解释超详细）

热烈的马

62 0 0

建模sister

|

1月前

|

SQL 分布式计算 Java

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

建模sister

75 1 1

sunrr

|

1月前

|

存储分布式计算 API

adb spark的lakehouse api访问内表数据，还支持算子下推吗

【2月更文挑战第21天】adb spark的lakehouse api访问内表数据，还支持算子下推吗

sunrr

107 2 2

晓之以理的喵~~

|

3月前

|

分布式计算分布式数据库 API

Spark与HBase的集成与数据访问

Spark与HBase的集成与数据访问

晓之以理的喵~~

70 0 0

晓之以理的喵~~

|

3月前

|

JSON 分布式计算关系型数据库

Spark中使用DataFrame进行数据转换和操作

Spark中使用DataFrame进行数据转换和操作

晓之以理的喵~~

96 0 0

晓之以理的喵~~

|

3月前

|

存储分布式计算调度

Spark任务调度与数据本地性

Spark任务调度与数据本地性

晓之以理的喵~~

31 0 0

诸葛子房

|

4月前

|

分布式计算 Java Spark

Spark Driver和Executor数据传递使用问题

Spark Driver和Executor数据传递使用问题

诸葛子房

30 0 0

Maynor

|

4月前

|

SQL 分布式计算 Apache

流数据湖平台Apache Paimon（六）集成Spark之DML插入数据

流数据湖平台Apache Paimon（六）集成Spark之DML插入数据

Maynor

76 0 0

热门文章

最新文章

Paimon 与 Spark 的集成（二）：查询优化

阿里云 EMR Serverless Spark 版免费邀测中

大数据技术与Python：结合Spark和Hadoop进行分布式计算

bigdata-36-Spark转换算子与动作算子

图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例

sparkRDD 算子的创建和使用

Spark 源码分析 -- BlockStore

BR-MLP基于spark+Hadoop分布式数据挖掘解决方案功能剖析

Spark RDD类源码阅读

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark环境搭建与使用

Spark学习---day07、Spark内核（Shuffle、任务执行）

Spark学习---day06、Spark内核（源码提交流程、任务执行）

Spark学习--day05、SparkCore电商网站实操、SparkCore-工程代码

Spark【Spark学习大纲】简介+生态+RDD+安装+使用（xmind分享）

Spark学习--day05、累加器

Spark学习--day04、RDD依赖关系、RDD持久化、RDD分区器、RDD文件读取与保存

Spark学习---day03、Spark核心编程（RDD概述、RDD编程（创建、分区规则、转换算子、Action算子））（二）

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

下一篇

阿里云oss简介和使用流程