【Spark Summit EU 2016】Spark——打造处理石油工业数据的全球化计算引擎

简介: 本讲义出自Yaroslav Nedashkovsky与Andy Starzhinsky在Spark Summit EU 2016上的演讲,主要介绍了从数据收集到预测分析的石油行业的数据分析过程,并且分享了如何利用Spark打造处理石油工业数据的全球化计算引擎。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps

本讲义出自Yaroslav Nedashkovsky与Andy Starzhinsky在Spark Summit EU 2016上的演讲,主要介绍了从数据收集到预测分析的石油行业的数据分析过程,分享了石油工业的概览,以及从数据源头到数据收集,再到数据分析的全过程,并且分享了如何利用Spark打造处理石油工业数据的全球化计算引擎。


4714cd9c5d0071a17f17c9f98230d0c3f4ecf8d5

c6a9864344264d7f3980ac32bb925b4aa64df484

915a34e95e4f5d0835f3af9e8fc9c35311789765

f8153a8ec2732d8740fe358cf6898de08d034e5e

40d9d42525bba861f44d499d2bc879e0f0ecdee1

d13fb8034823491e2e587251b33fea2babf772e2

80b89210a3a442f08abefa6c3d745556e0c86de6

6fb20c88c9d7c0743e4215f817a1d921f96115ac

623d0adb19427b5fe2dd42969f5dd3858a945784

e7d16bb934f0b20a6e9090db8c26ed73331116bc

f49f456a1b210ede871cb75b2d047a99de483af3

4c63deab233b76720f07bdf406482b71a7881b65

2be6fc9a432b47660a0df7947fecfbc2249c68c0

f27881ccd67af35b032041b7e8ad12547bdc3fb1

0bf4a8b9e53f0c0a4e87c5c1052694b894606b9f

e011fb96f38758a86f4fc96597332d1d44f5ea27

f3301e852c2019eab8ad5e9422376aa8609a8fe4

bf0734f0a401fec84f0b541670aeae1ed1267286

c6c2980f4615d2395e4adf7cfcb4da809934f1e8

3c3b9f2e883e072b4bee4ac09390bb1653608d22

041e4b3d94c827278e08a282b5fb12a0597a17f6

7c6ed63d8ca47635c385ebf7cdbd034128d7771b

69a83473ae386441a705bc89b28f2549ab366b5f

8ef354a67efe6ef03bb5a30a02543febfddcc0e0

9cfbe1fa44a8af1be2de76f4ea4f34a25085aac1

ec9f630f144ea15cc434a24131962425bd1f6831

b47c0b4c018c4aa3b87d115a7d91772d1bc76278

96dab471964c5ca8bdeeebb7ab5ae18b7a6dc5db

d1f1996e01bb8176cb304d1a2dfeb059b8f278cf

4ad2aeec7bdc4e36b1b9d6cbbe841c6da077035f

ce463a9b57fcbbed56934cdde1279744244c2ecd

856f72e28a064e79487190e55503372a6a3c460f

相关文章
|
7月前
|
canal 分布式计算 关系型数据库
大数据Spark Streaming实时处理Canal同步binlog数据
大数据Spark Streaming实时处理Canal同步binlog数据
112 0
|
2月前
|
SQL 分布式计算 API
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
52 2
|
4月前
|
分布式计算 大数据 Apache
【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解(图文解释 超详细)
【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解(图文解释 超详细)
62 0
|
1月前
|
SQL 分布式计算 Java
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
76 1
|
1月前
|
存储 分布式计算 API
adb spark的lakehouse api访问内表数据,还支持算子下推吗
【2月更文挑战第21天】adb spark的lakehouse api访问内表数据,还支持算子下推吗
107 2
|
3月前
|
分布式计算 分布式数据库 API
Spark与HBase的集成与数据访问
Spark与HBase的集成与数据访问
|
3月前
|
JSON 分布式计算 关系型数据库
Spark中使用DataFrame进行数据转换和操作
Spark中使用DataFrame进行数据转换和操作
|
3月前
|
存储 分布式计算 调度
Spark任务调度与数据本地性
Spark任务调度与数据本地性
|
4月前
|
分布式计算 Java Spark
Spark Driver和Executor数据传递使用问题
Spark Driver和Executor数据传递使用问题
30 0
|
4月前
|
SQL 分布式计算 Apache
流数据湖平台Apache Paimon(六)集成Spark之DML插入数据
流数据湖平台Apache Paimon(六)集成Spark之DML插入数据
77 0