备案控制台

开发者社区

开发者社区大数据与机器学习开源大数据平台 E-MapReduce 文章正文

#Apache Spark系列技术直播# 第六讲【 What's New in Apache Spark 2.4? 】

2018-12-20 1186

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Apache Spark系列技术直播第六讲【 What's New in Apache Spark 2.4? 】 Abstract(简介): This talk will provide an overview of the major features and enhancements in Spark 2.

Apache Spark系列技术直播第六讲【 What's New in Apache Spark 2.4? 】

Abstract(简介):

This talk will provide an overview of the major features and enhancements in Spark 2.4 release and the upcoming releases and will be followed by a Q&A session.
The Apache Spark 2.4 comes packed with a lot of new functionalities: new barrier execution mode, flexible streaming sink, the native AVRO data source, PySpark’s eager evaluation mode, Kubernetes support, higher-order functions, Scala 2.12 support and a lot of other improvements.

主讲人：李潇

  李潇现就职于Databricks，专注于Apache Spark的开发和建设。他是Apache Spark项目管理委员会成员。本科毕业于南京理工大学，后在佛罗里达大学(University of Florida)获计算机博士学位， 曾就职于IBM，获发明大师称号(Master Inventor)，在数据处理领域发表专利十余篇。(Github: gatorsmile)

直播时间：
北京时间2018.12.21（周五） 13:30 - 14:30

加入Apache Spark中国技术交流钉钉群看直播

_2018_12_05_4_48_20_meitu_1

欢迎大家扫码加入~~

文章标签：

开源大数据平台 E-MapReduce

Apache

分布式计算

Spark

关键词：

技术apache spark

技术Apache

Apache技术

apache apache spark

apache spark Apache

相关实践学习

数据湖构建DLF快速入门

本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析，介绍数据湖构建DLF产品的数据发现和数据探索功能。

快速掌握阿里云 E-MapReduce

E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上，利用开源大数据生态系统，包括 Hadoop、Spark、HBase，为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。本课程主要介绍阿里云 E-MapReduce 的使用方法。

社区小助手

目录

相关文章

xleesf

|

1月前

|

存储缓存分布式计算

Apache Hudi数据跳过技术加速查询高达50倍

Apache Hudi数据跳过技术加速查询高达50倍

xleesf

38 2 2

疯狂的猿

|

3月前

|

机器学习/深度学习 SQL 分布式计算

Apache Spark 的基本概念和在大数据分析中的应用

介绍 Apache Spark 的基本概念和在大数据分析中的应用

疯狂的猿

157 0 0

桃李春风一杯酒

|

7天前

|

分布式计算 Hadoop 大数据

大数据技术与Python：结合Spark和Hadoop进行分布式计算

【4月更文挑战第12天】本文介绍了大数据技术及其4V特性，阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce，Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop，可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop，以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。

桃李春风一杯酒

21 1 1

xleesf

|

1月前

|

分布式计算大数据 Apache

大数据技术变革正当时，Apache Hudi了解下？

大数据技术变革正当时，Apache Hudi了解下？

xleesf

25 0 0

xleesf

|

1月前

|

SQL OLAP Apache

年度合集！Apache Hudi 技术文章一次看个够

年度合集！Apache Hudi 技术文章一次看个够

xleesf

38 3 3

xleesf

|

1月前

|

消息中间件分布式计算 Serverless

CDC一键入湖：当 Apache Hudi DeltaStreamer 遇见 Serverless Spark

CDC一键入湖：当 Apache Hudi DeltaStreamer 遇见 Serverless Spark

xleesf

51 2 2

洛神灬殇

|

2月前

|

SQL 并行计算大数据

【大数据技术攻关专题】「Apache-Flink零基础入门」手把手+零基础带你玩转大数据流式处理引擎Flink（基础加强+运行原理）

关于Flink服务的搭建与部署，由于其涉及诸多实战操作而理论部分相对较少，小编打算采用一个独立的版本和环境来进行详尽的实战讲解。考虑到文字描述可能无法充分展现操作的细节和流程，我们决定以视频的形式进行分析和介绍。因此，在本文中，我们将暂时不涉及具体的搭建和部署步骤。

洛神灬殇

495 3 9

【大数据技术攻关专题】「Apache-Flink零基础入门」手把手+零基础带你玩转大数据流式处理引擎Flink（基础加强+运行原理）

晓之以理的喵~~

|

3月前

|

SQL 分布式计算数据处理

Apache Spark简介与历史发展

Apache Spark简介与历史发展

晓之以理的喵~~

79 0 0

灵杰开发者

|

29天前

|

消息中间件 API Apache

官宣｜阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会

本文整理自阿里云开源大数据平台徐榜江 (雪尽)，关于阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会。

灵杰开发者

1279 1 1

官宣｜阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会

灵杰开发者

|

1月前

|

SQL Java API

官宣｜Apache Flink 1.19 发布公告

Apache Flink PMC（项目管理委员）很高兴地宣布发布 Apache Flink 1.19.0。

灵杰开发者

1146 1 2

官宣｜Apache Flink 1.19 发布公告

大数据与机器学习

开源大数据平台 E-MapReduce

热门文章

最新文章

阿里封神谈hadoop生态学习之路

现代流式计算的基石：Google DataFlow

JindoFS: 云上大数据的高性能数据湖存储方案

5W1H(六何分析法)全景洞察大数据

基于Spark Streaming 进行 MySQL Binlog 日志准实时传输

Apache Spark 3.0 将内置支持 GPU 调度

【译】用SQL统一所有：一种有效的、语法惯用的流和表管理方法

开源生态的新发展：Apache Spark 3.0、Koala和Delta Lake

11月14日Spark社区直播【 Spark on Kubernetes & YARN】

YARN中的CPU资源隔离-CGroups

基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成（RAG）系统

通过阿里云向量检索 Milvus 版和通义千问快速构建基于专属知识库的问答系统

EMR Notebook 开启公测，提供交互式数据分析平台

Apache Hadoop入门指南：搭建分布式大数据处理平台

阿里云向量检索 Milvus 版开启公测，助力企业打造高质量 AI 服务

Paimon 与 Spark 的集成（二）：查询优化

阿里云 EMR Serverless Spark 版免费邀测中

实用工具推荐：适用于 TypeScript 网络爬取的常用爬虫框架与库

1688API接口推荐：1688按图搜索拍立淘数据接口

【玩转幻兽帕鲁部署】阿里云幻兽帕鲁服务器搭建1分钟搞定：从入门到精通

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

Apache Flink 入门到实战 - Flink开源社区出品

大数据实时计算框架Spark快速入门

Apache Flink 入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

推荐镜像

更多

apache

packman

CPAN

下一篇

阿里云oss简介和使用流程