备案控制台

开发者社区

开发者社区大数据文章正文

【Spark Summit East 2017】Ernest：基于Spark的性能预测大规模分析框架

2017-02-19 1974

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Shivaram Venkataraman在Spark Summit East 2017上的演讲，近期使用Spark进行机器学习，基因组学和科学分析呈现增长的趋势，然而将这些应用部署在云计算平台上是有一定挑战性的，而应对上述挑战的关键在于有能力预测的应用程序在保持高性能的状态下所需要的资源配置，这样就可以自动选择最优配置。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Shivaram Venkataraman在Spark Summit East 2017上的演讲，近期使用Spark进行机器学习，基因组学和科学分析呈现增长的趋势，然而将这些应用部署在云计算平台上是有一定挑战性的，而应对上述挑战的关键在于有能力预测的应用程序在保持高性能的状态下所需要的资源配置，这样就可以自动选择最优配置。本讲义主要介绍了Ernest——性能预测大规模分析的框架。

db47ede01f502ed0e1880cb8009c20a0d1a2ce82

4ec09c23b5b97c201d5ad8500f1416f63a96086a

a4df004465122253d4fbff1034a95fd68c22c038

e228384f66a8ff9a4b4768ebbcd6cd63f3722c30

ec201c397c8b9df566f708e77131f1ced32d9c29

b7574a22585b0c2972a44730746144afed50b642

ad8c2da3d1f6467f8b565763c5d4886130224dba

f5ae8be3c355897a476a0d0ca020a6455026d581

97cc22fd1a3c42bbd445e5b11d82fc9c9a689b63

e0ba40062967b9ff6288e5ff2a4cc9ae3a7c4f0f

b411fb650b8c8f4e115d13c3bfc51eca9dedcbbd

184574876c472a25acc5c7556d04da0395afe0e9

3470ba9bc4b70403960a4384100d04d8bb87162b

4947a83c90b5a0c9d1d98a2f435ede1dccb8ba4a

190034bd3add12509cc59a75679af735a2ff15ad

fbbf2574d5fe1289c79833bc18f4e3db0127153e

2ce83482db6ddf485bdf620bcd19de9e59439d93

2b44da0b96ee30c27263b3108bdecb241aef65ed

7714cec67322632d9f7dda44582384ceb77d8fb3

dc20e39ec68e8c1330be97be04498750de71f870

4fb4ff2362dae0ac5be08749f7ce41eb59a9b71e

b264c154a4963ccf4c73b3e88de16b9d59f3a6fb

5e63a45304edd67bed94d071575f9e2eb3f39b03

725065175dd499454cd6b2df6c617c400f7955fb

dd94f7186d55cf69ab17a5301b462f9cd849a57c

9fd2fe644054fe8915b3e86e05afb3ae0df57987

f44df712835967c23804b48ef464fb3761d7a0d2

33c03f3bc399499ff664e2cd355505da19488ac0

4e759ae808421984cef5a2a45141fd36ec5e10e5

0ce5296f5170c74b14a74b8429e6e539067593ce

e40b154e1f6676f38addbd518b7804c3709980a4

4f059a07e9150e21cb173b4df3d920a5c1cc7cdc

70a0dafbf5402eb6a309bdf072c1f1281c1d6021

e43d2f0f29edd14546493be4e9d9915902546b80

c30705b3882f7b6d2988744b13d1093a12e25bce

文章标签：

大数据

分布式计算

Spark

关键词：

apache spark分析

apache spark性能

apache spark框架

apache spark大规模

apache spark summit

小猫吃鱼569

目录

相关文章

疯狂的猿

|

3月前

|

机器学习/深度学习 SQL 分布式计算

Apache Spark 的基本概念和在大数据分析中的应用

介绍 Apache Spark 的基本概念和在大数据分析中的应用

疯狂的猿

157 0 0

程序猿～厾罗

|

3月前

|

机器学习/深度学习 SQL 分布式计算

介绍 Apache Spark 的基本概念和在大数据分析中的应用。

介绍 Apache Spark 的基本概念和在大数据分析中的应用。

程序猿～厾罗

70 0 0

诸葛子房

|

4月前

|

SQL 分布式计算 HIVE

Spark数据倾斜问题分析和解决

Spark数据倾斜问题分析和解决

诸葛子房

42 0 0

赵广陆

|

7月前

|

SQL 分布式计算大数据

大数据Spark框架概述

大数据Spark框架概述

赵广陆

157 0 0

赵广陆

|

7月前

|

消息中间件分布式计算大数据

大数据Spark实时搜索日志实时分析

大数据Spark实时搜索日志实时分析

赵广陆

136 1 1

xleesf

|

1月前

|

SQL 分布式计算 HIVE

Spark读取变更Hudi数据集Schema实现分析

Spark读取变更Hudi数据集Schema实现分析

xleesf

31 0 0

jerrywangsap

|

2月前

|

分布式计算大数据 Java

Spark 大数据实战：基于 RDD 的大数据处理分析

Spark 大数据实战：基于 RDD 的大数据处理分析

jerrywangsap

120 0 0

小小程序员~

|

7月前

|

SQL 机器学习/深度学习分布式计算

Apache Spark 的基本概念和在大数据分析中的应用

Apache Spark 的基本概念和在大数据分析中的应用

小小程序员~

66 0 0

晓之以理的喵~~

|

3月前

|

机器学习/深度学习数据采集分布式计算

Spark回归分析与特征工程

Spark回归分析与特征工程

晓之以理的喵~~

48 0 0

晓之以理的喵~~

|

3月前

|

缓存分布式计算监控

Spark RDD操作性能优化技巧

Spark RDD操作性能优化技巧

晓之以理的喵~~

32 0 0

热门文章

最新文章

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例

spark和kafka jar包冲突NoSuchMethodError: net.jpountz.lz4.LZ4BlockInputStream

大数据开发！Pandas转spark无痛指南！⛵

Spark 源码分析 -- BlockStore

sparkRDD 算子的创建和使用

BR-MLP基于spark+Hadoop分布式数据挖掘解决方案功能剖析

Spark RDD类源码阅读

7月24日晚Spark社区直播：【Apache Spark 基于 Apache Arrow 的列式存储优化】

地铁译：Spark for python developers --- 搭建Spark虚拟环境3

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark环境搭建与使用

Spark学习---day07、Spark内核（Shuffle、任务执行）

Spark读取变更Hudi数据集Schema实现分析

实战|使用Spark Streaming写入Hudi

adb spark的lakehouse api访问内表数据，还支持算子下推吗

Spark学习---day06、Spark内核（源码提交流程、任务执行）

Spark学习--day05、SparkCore电商网站实操、SparkCore-工程代码

Spark【Spark学习大纲】简介+生态+RDD+安装+使用（xmind分享）

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）