【Spark Summit East 2017】Bulletproof Jobs:大规模Spark处理模式

简介: 本讲义出自Sim Simeonov在Spark Summit East 2017上的演讲,主要介绍了Spark工作中的三个防弹原则以及他们的系统原则和设计模式。这三个原则分别是:幂等性、行级结构化日志以及不变的查询结构。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Sim Simeonov在Spark Summit East 2017上的演讲,主要介绍了Spark工作中的三个防弹原则以及他们的系统原则和设计模式。这三个原则分别是:幂等性、行级结构化日志以及不变的查询结构。


4410f9aad5bf63251ecd468972d517a969d3f6b5

156d11fd4ea146f4dbb36078a01df0060d172451

360a45a94eb24c11bd723ab3e3805cb8fd3a5518

5ac2afad491d77a1fd92e984cd8550673f01ee7b

128de0a865ca8634241f612594f7055d7b9c851c

7e8098289f02c6cb96b21e3467639d9641cd3243

4668ac335639738f9ba791e969b7da51373fcbff

64faae5c6b06b66d65bc4e104b8dee381fcb57b2

90b7ffae49761aa408e44f81adeb3560b52f23d3

7b558c8f67683b98ec725aa90dccb5f0a765c4ae

4e4f52be0fd01650a4f9b32fa36cb27903983910

b3ee8dc9c70dafcb7306fce7aa12b90c8a22b137

ca3ffb68b7c6bf3af292378e3ec3d96cf83032e5

6bd7fad7c2b2f2f39640b2fd7d786701aac8c17d

c11afb56c60b8d40256dd1831524adaddac4f3c6

38dcd27545f3711f37dfb636596ec3988e5abc4e

8bf68a2699cadb0b91e2913e6f6e6c5ee2049dfb

598f8c89067d61359d9d4d83bcde5f66dc656c13

e7fb28d8337f196bb51f829df3a1c07df6d2ebf8

8e180399f8575a92781a92482b2f14bdd4fefef5

1ddbe2a1d697650366c4a09d42f604376d2ee008

e1ccd03d4fe0869922e0f39911bb9017d11e20ba

31f7b4b236e7f384677e857cf0acac703618e9e3

7f169152833267b9693111eeb240f6b18bbc7cc3

509a81512a647acfebcbb39efdf2781850b89ba7

2ae922dc1c26beb99aab457135df47b0d491002a

617d4069ffa9cbe23543373f63618d917accb661

2e3bf582171a4afe7c78c597bb72d1a4dcfe4690

bc88fd621a36d8010bd83badc7c5d84a5aa4b43f

1a1d81a280b9c5882cdb7f4f55961ce7053329af

44909a8d29bc70105defcba232c64fa9c6ce4b1e

60e48ddf4ce1cb5c1900139d2f691e259de598fb


相关文章
|
4月前
|
分布式计算 监控 Java
Note_Spark_Day02:Standalone集群模式和使用IDEA开发应用程序
Note_Spark_Day02:Standalone集群模式和使用IDEA开发应用程序
51 0
|
2月前
|
分布式计算 资源调度 监控
Spark学习--1、Spark入门(Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式)(一)
Spark学习--1、Spark入门(Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式)(一)
90 1
|
6月前
|
SQL 分布式计算 资源调度
分享一个 hive on spark 模式下使用 HikariCP 数据库连接池造成的资源泄露问题
分享一个 hive on spark 模式下使用 HikariCP 数据库连接池造成的资源泄露问题
|
6月前
|
分布式计算 资源调度 Kubernetes
大数据问题排查系列 - SPARK STANDALONE HA 模式的一个缺陷点与应对方案
大数据问题排查系列 - SPARK STANDALONE HA 模式的一个缺陷点与应对方案
|
6月前
|
分布式计算 资源调度 Hadoop
Spark on Yarn集群模式搭建及测试
Spark on Yarn集群模式搭建及测试
153 0
|
7月前
|
分布式计算 资源调度 监控
Spark Yarn模式部署集群
Spark Yarn模式部署集群
49 1
|
7月前
|
分布式计算 资源调度 Java
大数据Spark部署模式DeployMode
大数据Spark部署模式DeployMode
89 0
|
8月前
|
存储 分布式计算 资源调度
Spark学习--1、Spark入门(Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式)(二)
Spark学习--1、Spark入门(Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式)(二)
|
8月前
|
SQL 分布式计算 资源调度
Spark学习--1、Spark入门(Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式)(一)
Spark学习--1、Spark入门(Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式)(一)
|
9月前
|
分布式计算 Ubuntu 算法
Spark 3.x各模式部署 - Ubuntu(下)
Spark 3.x各模式部署 - Ubuntu(下)
199 0