备案控制台

开发者社区

开发者社区大数据文章正文

【Spark Summit EU 2016】Spark——打造处理石油工业数据的全球化计算引擎

2017-02-12 1935

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Yaroslav Nedashkovsky与Andy Starzhinsky在Spark Summit EU 2016上的演讲，主要介绍了从数据收集到预测分析的石油行业的数据分析过程，并且分享了如何利用Spark打造处理石油工业数据的全球化计算引擎。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Yaroslav Nedashkovsky与Andy Starzhinsky在Spark Summit EU 2016上的演讲，主要介绍了从数据收集到预测分析的石油行业的数据分析过程，分享了石油工业的概览，以及从数据源头到数据收集，再到数据分析的全过程，并且分享了如何利用Spark打造处理石油工业数据的全球化计算引擎。

4714cd9c5d0071a17f17c9f98230d0c3f4ecf8d5

c6a9864344264d7f3980ac32bb925b4aa64df484

915a34e95e4f5d0835f3af9e8fc9c35311789765

f8153a8ec2732d8740fe358cf6898de08d034e5e

40d9d42525bba861f44d499d2bc879e0f0ecdee1

d13fb8034823491e2e587251b33fea2babf772e2

80b89210a3a442f08abefa6c3d745556e0c86de6

6fb20c88c9d7c0743e4215f817a1d921f96115ac

623d0adb19427b5fe2dd42969f5dd3858a945784

e7d16bb934f0b20a6e9090db8c26ed73331116bc

f49f456a1b210ede871cb75b2d047a99de483af3

4c63deab233b76720f07bdf406482b71a7881b65

2be6fc9a432b47660a0df7947fecfbc2249c68c0

f27881ccd67af35b032041b7e8ad12547bdc3fb1

0bf4a8b9e53f0c0a4e87c5c1052694b894606b9f

e011fb96f38758a86f4fc96597332d1d44f5ea27

f3301e852c2019eab8ad5e9422376aa8609a8fe4

bf0734f0a401fec84f0b541670aeae1ed1267286

c6c2980f4615d2395e4adf7cfcb4da809934f1e8

3c3b9f2e883e072b4bee4ac09390bb1653608d22

041e4b3d94c827278e08a282b5fb12a0597a17f6

7c6ed63d8ca47635c385ebf7cdbd034128d7771b

69a83473ae386441a705bc89b28f2549ab366b5f

8ef354a67efe6ef03bb5a30a02543febfddcc0e0

9cfbe1fa44a8af1be2de76f4ea4f34a25085aac1

ec9f630f144ea15cc434a24131962425bd1f6831

b47c0b4c018c4aa3b87d115a7d91772d1bc76278

96dab471964c5ca8bdeeebb7ab5ae18b7a6dc5db

d1f1996e01bb8176cb304d1a2dfeb059b8f278cf

4ad2aeec7bdc4e36b1b9d6cbbe841c6da077035f

ce463a9b57fcbbed56934cdde1279744244c2ecd

856f72e28a064e79487190e55503372a6a3c460f

文章标签：

分布式计算

Spark

关键词：

apache spark数据

apache spark计算引擎

apache spark summit

apache spark summit eu

apache spark summit eu数据

小猫吃鱼569

目录

相关文章

赵广陆

|

7月前

|

canal 分布式计算关系型数据库

大数据Spark Streaming实时处理Canal同步binlog数据

大数据Spark Streaming实时处理Canal同步binlog数据

赵广陆

112 0 0

建模sister

|

2月前

|

SQL 分布式计算 API

Spark学习------SparkSQL（概述、编程、数据的加载和保存）

Spark学习------SparkSQL（概述、编程、数据的加载和保存）

建模sister

52 2 2

热烈的马

|

4月前

|

分布式计算大数据 Apache

【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解（图文解释超详细）

【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解（图文解释超详细）

热烈的马

62 0 0

建模sister

|

1月前

|

SQL 分布式计算 Java

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

建模sister

76 1 1

sunrr

|

1月前

|

存储分布式计算 API

adb spark的lakehouse api访问内表数据，还支持算子下推吗

【2月更文挑战第21天】adb spark的lakehouse api访问内表数据，还支持算子下推吗

sunrr

107 2 2

晓之以理的喵~~

|

3月前

|

分布式计算分布式数据库 API

Spark与HBase的集成与数据访问

Spark与HBase的集成与数据访问

晓之以理的喵~~

70 0 0

晓之以理的喵~~

|

3月前

|

JSON 分布式计算关系型数据库

Spark中使用DataFrame进行数据转换和操作

Spark中使用DataFrame进行数据转换和操作

晓之以理的喵~~

99 0 0

晓之以理的喵~~

|

3月前

|

存储分布式计算调度

Spark任务调度与数据本地性

Spark任务调度与数据本地性

晓之以理的喵~~

31 0 0

诸葛子房

|

4月前

|

分布式计算 Java Spark

Spark Driver和Executor数据传递使用问题

Spark Driver和Executor数据传递使用问题

诸葛子房

30 0 0

Maynor

|

4月前

|

SQL 分布式计算 Apache

流数据湖平台Apache Paimon（六）集成Spark之DML插入数据

流数据湖平台Apache Paimon（六）集成Spark之DML插入数据

Maynor

77 0 0

热门文章

最新文章

Paimon 与 Spark 的集成（二）：查询优化

阿里云 EMR Serverless Spark 版免费邀测中

大数据技术与Python：结合Spark和Hadoop进行分布式计算

bigdata-36-Spark转换算子与动作算子

图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例

Spark 源码分析 -- BlockStore

BR-MLP基于spark+Hadoop分布式数据挖掘解决方案功能剖析

Spark RDD类源码阅读

7月24日晚Spark社区直播：【Apache Spark 基于 Apache Arrow 的列式存储优化】

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark环境搭建与使用

Spark学习---day07、Spark内核（Shuffle、任务执行）

Spark读取变更Hudi数据集Schema实现分析

实战|使用Spark Streaming写入Hudi

adb spark的lakehouse api访问内表数据，还支持算子下推吗

Spark学习---day06、Spark内核（源码提交流程、任务执行）

Spark学习--day05、SparkCore电商网站实操、SparkCore-工程代码

Spark【Spark学习大纲】简介+生态+RDD+安装+使用（xmind分享）

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

下一篇

阿里云oss简介和使用流程