huangchuang + 关注

huangchuang 发表了文章:

OSS数据湖实践——parquet格式

发布时间:2020-06-01 09:52:34 浏览:310 回帖 :0

通过对parquet格式及json格式的对比,了解两种常用格式之间存在的异同,了解parquet 能够提高作业性能的内在机制,并且阐述其能够带来的优势。

大数据 OSS 性能 SQL Apache path spark DataFrame file Blog 存储 数据存储 Parquet 数据湖

huangchuang 发表了文章:

OSS 数据湖实践 —— 使用EMR JindoFs Cache提升性能

发布时间:2020-05-26 15:42:49 浏览:301 回帖 :0

通过使用JindoFs 的Cache功能,加速作业计算,减小OSS带宽需求,优化作业架构。

OSS 性能 配置 集群 Cache 数据分析 aliyun e-mapreduce EMR Hive

huangchuang 发表了文章:

OSS数据湖实践——EMR + Hive + OSS案例

发布时间:2020-05-26 15:29:25 浏览:580 回帖 :0

构建基于OSS数据源的EMR大数据计算环境,使用Hive分析工具,实现简单的大数据分析案例。

架构 OSS js 数据仓库 集群 BY e-mapreduce string EMR Hive Group csv

huangchuang 发表了文章:

OSS数据湖实践——EMR + Flink + OSS案例

发布时间:2020-05-26 15:19:50 浏览:532 回帖 :0

构建基于OSS数据源的EMR大数据计算环境,使用Flink大数据计算引擎,实现简单的大数据分析案例。

OSS hadoop Apache 集群 云存储 spark scala API string EMR 大数据分析

huangchuang 发表了文章:

OSS数据湖实践——EMR + Spark + OSS案例

发布时间:2020-05-26 15:00:33 浏览:584 回帖 :0

构建基于OSS数据源的EMR大数据计算环境,使用Spark大数据计算引擎,实现简单的大数据分析案例。

大数据 OSS hadoop SQL Apache 集群 云存储 spark EMR csv Bash 大数据分析

huangchuang 发表了文章:

OSS 数据湖实践 —— EMR+OSS入门

发布时间:2020-05-26 14:41:22 浏览:378 回帖 :0

基于阿里云面向对象存储(OSS) 技术优势,利用EMR的计算能力,把二者结合起来,快速搭建大数据计算环境,实现大数据分析需求。

大数据 OSS hadoop Json 云服务器 Apache 配置 集群 云存储 spark aliyun 对象存储 e-mapreduce EMR 数据湖

暂未提供

感兴趣or擅长的领域:

暂无
更多>
更多>