1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. E>
  5. etl实现

当前主题:etl实现

备战双十一 企业如何最佳实践上云?

备战双十一期间,企业如何最佳上云?阿里云解决方案最佳实践,是基于众多客户上云的成功案例萃取而成的最优化企业上云指导。每个最佳实践包括使用场景、多产品部署架构及部署手册。帮助客户更好地理解阿里云的产品和解决方案,降低企业上云门槛的同时满足客户自服务的需求。 !

阅读全文

带你读《企业数据湖》之二:数据湖概念概览

第2章数据湖概念概览 数据湖概念的诞生,源自企业面临的一些挑战,如数据应该以何种方式处理和存储。最开始,企业对种类庞杂的应用程序的管理都经历了一个比较自然的演化周期。最开始的时候,每个应用程序会产生、存储大量数据,而这些数据并不能被其他应用程序使用,这种状况

阅读全文

带你读《企业数据湖》之一: 数据导论

第1章 数 据 导 论 本书中,我们将着手为企业实施一项技术杰作。在这个过程中,读者不仅要学习许多新的工具和技术,还要学习大量的术语和理论知识。这些会帮助你达到最终的目标,就是构建这个技术杰作——数据湖。 本章旨在让读者为前方艰难的道路做好准备,这样读者就可

阅读全文

云栖PPT下载 | 开源界大咖集体现身,开源数据库专场重点再回眸!

阿里云开源数据库项目最新发布 阿里巴巴集团副总裁、阿里云智能数据库事业部总裁、高级研究员李飞飞(飞刀)、阿里云数据库资深技术专家楼方鑫(黄忠)以及阿里云数据库技术专家傅宇(齐木)三位阿里云技术专家为大家介绍了最新的阿里云开源数据库项目。 李飞飞: 数据库在过

阅读全文

云栖干货回顾 | 行业顶级NoSQL成员坐阵,NoSQL数据库专场重点解析!

NoSQL数据库作为数据库市场最重要的组成之一,它的一举一动都影响着成千上万的企业。本专场邀请了行业顶级的NoSQL核心成员与大家共同展望NoSQL数据库的未来,**阿里巴巴、MongoDB、Redisson、斗鱼等**公司的技术大咖与大家共同分享了阿里云N

阅读全文

【译】使用Spark SQL 运行大规模基因组工作流

编译: 诚历,阿里巴巴计算平台事业部 EMR 技术专家,Apache Sentry PMC,Apache Commons Committer,目前从事开源大数据存储和优化方面的工作。 使用Spark SQL 运行大规模基因组工作流 在过去十年中,随着基因组测

阅读全文

为什么说阿里巴巴本身是云上数据中台的最佳实践

作者:品鉴 [ 更多内容详见数据中台官网 https://dp.alibaba.com ] 数据中台门在阿里巴巴集团干什么的,由哪个部门掌管?数据中台在阿里巴巴的主要作用是什么呢?外面吹嘘这么神秘的数据中台在阿里实践的如何呢?今天小编正好要采访数据技术及产品

阅读全文

云栖干货回顾 | 更强大的实时数仓构建能力!分析型数据库PostgreSQL 6.0新特性解读

阿里云 AnalyticDB for PostgreSQL 为采用MPP架构的分布式集群数据库,完备支持SQL 2003,部分兼容Oracle语法,支持PL/SQL存储过程,触发器,支持标准数据库事务ACID。AnalyticDB PG通过行存储、列存储、多

阅读全文

etl实现相关问答

提问题

Spark批处理从多列DataFrame写入Kafka主题

在批处理之后,Spark ETL需要向Kafka主题写入包含多个不同列的结果DataFrame。 根据以下Spark文档https://spark.apache.org/docs/2.2.0/structured-streaming-kafka-inte

阅读全文

关于JEE6和JSF2.0开发平台的问题

1、现在在技术企业技术选型上有JEE6和spring3.0\3.1。对于未来哪个更强势呢? 2、对于使用jsf2.0的企业开源技术框架,如Seam2.2\3.1(更新缓慢、发展现状担忧)。那相比较OperaMasks 3。有哪些更好的选择。现在企业需求也

阅读全文