1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. S>
  5. spark 读取换行数据库

当前主题:spark 读取换行数据库

spark 读取换行数据库相关的博客

查看更多 写博客

云数据库 ApsaraDB 产品总览

云数据库ApsaraDB是稳定可靠、可弹性伸缩的在线数据库服务产品总称。可轻运维全球90%以上主流开源及商业数据库(MySQL、SQL Server、Redis等),同时提供拥有6倍以上开源数据库性能、开源数据库价格的POLARDB和百TB级数据实时计算能力的HybridDB自研数据库等,更拥有容灾、备份、恢复、监控、迁移等方面的全套解决方案。

立即查看

EMR Spark-SQL性能极致优化揭秘 Native Codegen Framework

EMR团队探索并开发了SparkSQL Native Codegen框架,为SparkSQL换了引擎,新引擎带来最高4倍性能提升,为EMR再次获取世界第一立下汗马功劳。来自阿里云EMR团队的周克勇将详细介绍Native Codegen框架。本文整理自视频 h

阅读全文

深入研究Apache Spark 3.0的新功能

直播回放:https://developer.aliyun.com/live/2894 以下是直播内容精华整理。 Spark3.0解决了超过3400个JIRAs,历时一年多,是整个社区集体智慧的成果。Spark SQL和Spark Cores是其中的核心模块

阅读全文

Demo 示例:如何原生的在 K8s 上运行 Flink?

整理:翟玥(Flink 社区志愿者)校对:温天柱(Flink 社区志愿者)作者:王阳(亦祺) 摘要:本文由阿里巴巴技术专家王阳(亦祺)分享,社区志愿者翟玥整理主要介绍如何原生的在 Kubernetes 上运行 Flink。主要内容包括: Kubernetes

阅读全文

EMR Spark-SQL性能极致优化揭秘 Native Codegen Framework

作者:周克勇,花名一锤,阿里巴巴计算平台事业部EMR团队技术专家,大数据领域技术爱好者,对Spark有浓厚兴趣和一定的了解,目前主要专注于EMR产品中开源计算引擎的优化工作。 背景和动机 SparkSQL多年来的性能优化集中在Optimizer和Runtim

阅读全文

OSS数据湖实践——parquet格式

数据组织形式、存储格式及Parquet格式介绍 在介绍parquet数据格式之前,我们先介绍数据的几种组织形式以及存储形式。 # 结构化、半结构化、非结构化数据 # # 结构化数据 结构化数据源对数据定义了一种模式。通过这些关于底层数据的额外信息,结构化数据

阅读全文

好程序员大数据培训分享之Hadoop的生态系统

  好程序员大数据培训分享之Hadoop的生态系统,这次,我整理了一下hadoop的生态系统。hadoop生态系统,意思就是以hadoop为平台的各种应用框架,相互兼容,组成了一个独立的应用体系,也可以称之为生态圈。 通过以下的图: hadoop生态系统 我

阅读全文

“数据湖”:概念、特征、架构与案例

![5_6_3](https://yqfile.alicdn.com/b5d02cbd3d11b339b0eb566e8fc102f9fe6e1dd8.gif) 写在前面: 最近,数据湖的概念非常热,许多前线的同学都在讨论数据湖应该怎么建?阿里云有没有成熟的

阅读全文

C语言为何不会过时?你需要掌握多少种语言?

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 01 为什么C语言不会过时 评价任何一门编程语言,都是招人骂的。永远是这样。那我为啥还要做这个挨骂的事呢?作为《C语言点滴》《drop of knowled

阅读全文