钉钉群直播【Koalas 介绍】

简介: 将每个关联结果都作为relational cache构建代价太大,并不现实,我们需要找到一种方式可以通过单个Relational Cache支持优化多个关联查询的方式,从而在加速用户查询的同时,减少创建和更新relational cache的代价。

直播回看点我

直播主题:

【Koalas 介绍】

时间:

7月3日 19:00-20:00

分享嘉宾:

王道远(健身):阿里云EMR技术专家,Apache Spark活跃贡献者,主要关注大数据计算优化相关工作。

内容介绍:

Koalas简介:Koalas是Spark社区推出的新项目,旨在为Spark提供与pandas完全兼容的接口,在降低pandas用户的学习和迁移成本的同时,充分利用Spark强大的分布式处理能力。本次分享介绍Koalas的基本用法和原理。

_Koalas____spark_

相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
API
明晚直播:钉钉宜搭连接器接入高德API实战演示
《你好!低代码》第二十期明天(10月19日)晚上7点准时直播。本期将带来钉钉宜搭连接器实战演示,记得准时收看哦~
698 0
明晚直播:钉钉宜搭连接器接入高德API实战演示
DingTalk - 如何设置钉钉群直播静音?
DingTalk - 如何设置钉钉群直播静音?
131 0
DingTalk - 如何设置钉钉群直播静音?
今晚直播:钉钉宜搭连接器重磅发布
《你好!低代码》第十七期今天(9月26日)晚上7点准时直播。本期将重磅发布钉钉宜搭连接器,记得准时收看哦~
627 0
今晚直播:钉钉宜搭连接器重磅发布
|
数据管理
明晚直播:钉钉宜搭新功能数据管理页升级
《你好!低代码》第十六期明天(9月15日)晚上7点准时直播。本期将为大家分享钉钉宜搭新功能:数据管理页详解,记得准时收看哦~
345 0
明晚直播:钉钉宜搭新功能数据管理页升级
|
机器学习/深度学习 人工智能 Kubernetes
开发者社区精选直播合集(九)| 钉钉低代码创新实践
介绍钉钉开放生态,以及其在新时代下的创新与机遇。通过介绍一些优秀的钉钉企业应用案例向大家展示钉钉的多种应用与实践
开发者社区精选直播合集(九)| 钉钉低代码创新实践
7月31日Spark钉钉群直播【Apache Spark 在存储计算分离趋势下的数据缓存】
在数据上云的大背景下,存储计算分离逐渐成为了大数据处理的一大趋势,计算引擎需要通过网络读写远端的数据,很多情况下 IO 成为了整个计算任务的瓶颈,因而数据缓存成为此类场景下的一个重要的优化手段。本次分享将介绍 Spark 在数据缓存上的一些做法,并将介绍 EMR 自研的 Jindo 存储系统在数据缓存上的应用。
钉钉群直播【E-MapReduce产品探秘,快速构建可扩展的高性能大数据平台】
E-MapReduce整体介绍。通过EMR如何构建一个云上的大数据集群,常见的使用场景和硬件选型指南。
|
SQL 分布式计算 Spark
钉钉群直播【Spark Relational Cache 原理和实践】
主要介绍Relational Cache/物化视图的历史和背景,以及EMR Spark基于Relational Cache加速Spark查询的技术方案,及如何通过基于Relational Cache的数据预计算和预组织,使用Spark支持亚秒级响应的交互式分析使用场景。