【Spark Summit EU 2016】一起聊数据:Elsevier的Spark观

简介: 本讲义出自Emlyn Whittick在Spark Summit EU上的演讲,他分享了数据的价值与所面临的挑战,并且以烹饪这一形象化的比喻分享了从数据收集到、依靠Spark对数据进行加工、处理等一系列过程,并且在这一过程中也分享了Spark的发展历程。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps

本讲义出自Emlyn Whittick在Spark Summit EU上的演讲,他分享了数据的价值与所面临的挑战,并且以烹饪这一形象化的比喻分享了从数据收集到、依靠Spark和DataBricks对数据进行加工、处理等一系列过程,并且在这一过程中也分享了Spark的发展历程。


99d4ae0c588e8bb9d2ade2943d84c82946c664b0

1958d6e6a96b4b57905290ae805470ef75894764

500d5db6870adccf3f24ef652ef3eddcec8db9c3

0a65cdb2d2b9b9af2219768d526602882af59f34

cec1971be7560932c5af91662d0dac09878dd4d5

92ec5421aa4c4f6456cc3e9d88c00008d0e2d9d7

12ba5cc82c88dadd30e0740fd05b6ed51a23ea31

aa7a4ad75fbc0cfad68c24dad31c330076438549

6e386e710463bc943e021a3d43ff2fe8b62f7c27

9007752b7c9987ae46b2b580e6f6669a9ec9519d

2fa9431c95fa982924742816c956ab6625de333f

61af8304637c1c01871e4de0932225fadd53501d

119d4d289784e4607c77c3ed9f8083cca55319b5

2c9190f26f2127b37c38e2796e5cb905b77ea742

218b850c9a571478682b3f9aebc2eaa73c6c4d79

6d1d41466f7d7fd4cc6fd1655fd5f72301f5bbac

93c24ebcd3fa790d5aacee097f37ae5f82d57c6c

622dfb5f4aa070b7fda1e91c947bb5f5651cdba1

a8410ede489d4c43abc6600f91f2034fae101d82

eeb4852dfd1a7bc143bb64558487ae4cedf4916b

438aab0e12d87fedff1fa852ab5ab03250477fc8

f4e317f91981e22db1c4fa6d06f8bcf3f4225c06

d24b4e439c8a0a5b9fe326c864009cdaff857071

8806966d6797e70f635f611af90dbfa1c3e7f667

1a0374ce61d8832248f0fdcf58f308d33c2a1306

47d702c2f65b834892d10e19de0cbc66cc37e590

ff0895febb08ff163bb7db256eb52e8da641f5e2

9719bcfc19747bb06200200f559efcb086e408eb

0530aeafc8a4708a8f863fb1d38ad4366c79f6d3

25f023057d95d878ca59eb4afe3727eb8d91ba3d

15983afc1809f24bfaf52177b21b4c04a2a13e36b7dfd0e5361fdc1aa16dfecafce3c9892406951a

相关文章
|
7月前
|
canal 分布式计算 关系型数据库
大数据Spark Streaming实时处理Canal同步binlog数据
大数据Spark Streaming实时处理Canal同步binlog数据
112 0
|
2月前
|
SQL 分布式计算 API
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
50 2
|
4月前
|
分布式计算 大数据 Apache
【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解(图文解释 超详细)
【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解(图文解释 超详细)
62 0
|
1月前
|
SQL 分布式计算 Java
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
75 1
|
1月前
|
存储 分布式计算 API
adb spark的lakehouse api访问内表数据,还支持算子下推吗
【2月更文挑战第21天】adb spark的lakehouse api访问内表数据,还支持算子下推吗
107 2
|
3月前
|
分布式计算 分布式数据库 API
Spark与HBase的集成与数据访问
Spark与HBase的集成与数据访问
|
3月前
|
JSON 分布式计算 关系型数据库
Spark中使用DataFrame进行数据转换和操作
Spark中使用DataFrame进行数据转换和操作
|
3月前
|
存储 分布式计算 调度
Spark任务调度与数据本地性
Spark任务调度与数据本地性
|
4月前
|
分布式计算 Java Spark
Spark Driver和Executor数据传递使用问题
Spark Driver和Executor数据传递使用问题
30 0
|
4月前
|
SQL 分布式计算 Apache
流数据湖平台Apache Paimon(六)集成Spark之DML插入数据
流数据湖平台Apache Paimon(六)集成Spark之DML插入数据
76 0