xy_xin + 关注
目前 focus 在开源大数据领域。

xy_xin 发表了文章:

Data Lake 三剑客——Delta、Hudi、Iceberg 对比分析

发布时间:2020-02-03 15:55:09 浏览:2009 回帖 :0

本文主要从设计出发点、功能支持、性能等方面对比了Delta、Hudi、Iceberg 三个 data lake 方案

大数据 性能 spark bloomfilter schema update 数据管理 Delta Spark, Hudi ,Iceberg

xy_xin 发表了文章:

列式存储系列(二): Vertica

发布时间:2019-08-27 18:45:38 浏览:944 回帖 :0

列式存储系列(二): Vertica 本文是列式存储系列的第二篇。在上一篇,我们介绍了C-Store,一个列式存储数据库。在本篇,我们讲述 C-Store 的继任者——Vertica。C-Store...

列式存储 Vertica

xy_xin 发表了文章:

漫谈分布式计算框架

发布时间:2019-06-05 16:36:20 浏览:3139 回帖 :0

本文主要谈了一些分布式计算框架方面的心得。

分布式 架构 线程 spark pandas 分布式计算 容灾 Mapreduce

xy_xin 发表了文章:

HIVE TopN shuffle 原理

发布时间:2019-03-21 23:44:02 浏览:1671 回帖 :0

TopN 问题是排序中的一个经典问题。对于一个长度为 m 的数组,取其最大的 n (n

大数据 函数 排序 e-mapreduce Hive index

xy_xin 发表了文章:

列式存储系列(一)C-Store

发布时间:2019-03-21 23:37:08 浏览:1449 回帖 :1

列式存储系列(一)概述 序 本文是列式存储系列的第一篇。在这个系列中,我们将介绍几个典型的列式存储系统。这些列式系统的出现都有各自的时代背景。在介绍这些系统的同时,我们也尽量介绍一下它们的背景,以...

大数据 性能 数据库 数据仓库 索引 存储 列式存储

目前 focus 在开源大数据领域。

感兴趣or擅长的领域:

更多>
更多>
我是萌豆
我是萌豆
文章:6丨 粉丝:14丨 话题:0
游客mcfecy5u4s6wa
游客mcfecy5u4s6wa
文章:0丨 粉丝:0丨 话题:0
游客lahbkj2c666lm
游客lahbkj2c666lm
文章:0丨 粉丝:0丨 话题:0
游客avo4qzh7op5tc
游客avo4qzh7op5tc
文章:0丨 粉丝:0丨 话题:0
游客wakz65xzswwsq
游客wakz65xzswwsq
文章:0丨 粉丝:0丨 话题:0
游客3cjz2hvwvlgko
游客3cjz2hvwvlgko
文章:0丨 粉丝:0丨 话题:0