1. 云栖社区>
  2. 全部标签>
  3. #分区表#
分区表

#分区表#

已有1人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

基于 Flink + Hive 构建流批一体准实时数仓

想要搭建流式链路就必须得抛弃现有的 Hive 数仓吗?并不是,借助 Flink 可以实现已有的 Hive 离线数仓准实时化。本文整理自 Apache Flink Committer、阿里巴巴技术专家李劲松的分享,文章将分析当前离线数仓实时化的难点,详解 Flink 如何解决 Hive 流批一体准实时数仓的难题,实现更高效、合理的资源配置。

架构 Hive 分区表 存储

PostgreSQL 列存, 混合存储, 列存索引, 向量化存储, 混合索引 - OLTP OLAP OLXP HTAP 混合负载应用

PostgreSQL 列存, 混合存储, 列存索引, 向量化存储, 混合索引 - OLTP OLAP OLXP HTAP 混合负载应用

PostgreSQL Greenplum SQL 高并发 索引 OLAP 分区表 插件 Digoal Blog 存储 github 数据存储

PostgreSQL Oracle 兼容性 - Oracle 19c 新特性在PostgreSQL中的使用

PostgreSQL Oracle 兼容性 - Oracle 19c 新特性在PostgreSQL中的使用

PostgreSQL 函数 Oracle SQL 数据库 索引 分区表 插件 兼容性 Digoal Blog 存储 github 流计算

OB有问必答 | 分区是什么?在OceanBase中起到了什么作用?

分区是一种水平拆分方案,是数据同步的最小单元,是高可用的最小单元,是高可用的最小单元。

Oceanbase 性能 高可用 paxos 同步 数据同步 分布式数据库 分区表

好程序员大数据培训分享Hive的静态分区与动态分区

  好程序员大数据培训分享Hive的静态分区与动态分区:分区是hive存放数据的一种方式。将列值作为目录来存放数据,就是一个分区。这样查询时使用分区列进行过滤,只需根据列值直接扫描对应目录下的数据,不扫描其他不关心的分区,快速定位,提高查询效率。

大数据 程序员 BY Hive 分区表 Create 培训 好程序员 大数据培训 大数据教程

MySQL分区表最佳实践

云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 前言: 分区是一种表的设计模式,通俗地讲表分区是将一大表,根据条件分割成若干个小表。但是对于应用程序来讲,分区的表和没有分区的表是一样的。

mysql 函数 表达式 分区表 list

Linux下几个与磁盘空间和文件尺寸相关的命令

云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 硬盘是计算机非常重要的一个部件,不管是代码,还是 UI 、声音、文档,抑或是没人时偷偷看的小视频,都需要保存在硬盘里。

linux aliyun 分区表 磁盘

数据上云,应该选择全量抽取还是增量抽取?

数据抽取是指从源数据抽取所需要的数据, 是构建数据中台的第一步。 数据源一般是关系型数据库,近几年,随着移动互联网的蓬勃发展,出现了其他类型的数据源,典型的如网站浏览日期、APP浏览日志、IoT设备日志从技术实现方式来讲,从关系型数据库获取数据,可以细分为全量抽取、增量抽取2种方式,两种方法分别适用于不用的业务场景 增量抽取 时间戳方式用时间戳方式抽取增量数据很常见,业务系统在源表上新增一个时间戳字段,创建、修改表记录时,同时修改时间戳字段的值。

大数据 mysql Oracle 日志 数据库 Image 同步 数据同步 分区表 binlog MaxCompute

Flink 作为现代数据仓库的统一引擎:Hive 集成生产就绪!

如果你对以上问题深有同感,那说明这篇文章很适合你。我们来看看如何真正解决这个问题。接下来我将带各位了解下 Flink 与 Hive 生产级别的整合工作。

大数据 函数 数据处理 基础设施 数据仓库 数据分析 Hive 分区表 数据类型 数据存储 流计算 数据管理 flink 实时计算

MaxComwwwzs12558comI3578II9877-pute 基本概念与术语

项目空间• 项目空间(Project)是MaxCompute的基本组织单元,类似于传统数据库的DataBase或Schema的概念,是进行多用户隔离和访问控制的主要边界。项目空间中包含多个对象,例如表(Table)、资源(Resource)、函数(Function)和实例(Instance)等。

函数 string 分区表 UDF Mapreduce MaxCompute

MaxCompute 基本概念与术语

MaxCompute 基本概念与术语

大数据 函数 string 分区表 UDF Mapreduce MaxCompute

​21年前一场电脑病毒大爆发,6000 万台电脑中招,今天我们依然没吸取教训

CIH 具备空前的破坏力,让它在电脑病毒编年史上青史留名。除了摧毁硬盘数据,它是历史上第一款能导致硬件损坏的病毒。以下就是有关这个病毒的故事。

安全 windows 安全意识 Image 分区表

Delta Lake Presto Integration & Manifests 机制

Delta 0.5 已于上周发布,增加了不少新特性,这篇文章主要讲解其 Presto Integration 和 Manifests 机制。

大数据 java hadoop Apache path spark 开源大数据 string Hive 分区表 schema facebook

Delta Lake 分区表覆盖写入操作

Delta Lake当前版本(0.5)只支持API操作的,但是实现 Insert SQL 语法也不难,需要注意的是 Delta Lake 中的分区表覆盖写入操作。

SQL Image 钉钉 spark DB 开源大数据 API 分区表

Linux系统中文件被删除后的恢复方法(ext4)

本文档给出了恢复ext4文件系统被误删的文件的方法,需要使用的软件是extundelete,这款软件对ext4文件系统的恢复成功率比较高,值得拥有!恢复ext4文件系统被误删的文件恢复ext4文件系统被误删的文件 [root@localhost ~]# rm -Rf / #执行不成功的!rm: 在"/" 进行递归操作十分危险rm: 使用 --no-preserve-root 选项跳过安全模式[root@localhost ~]# rm -rf /* #这个可以执行成功! 呵呵。

linux test 分区表

分库、分表、分区的区别,傻傻分不清?

说过很多次,不要拘泥于某一个技术的一点,技术是相通的。重要的是编程思想,思想是最重要的。当数据量大的时候,需要具有分的思想去细化粒度。当数据量太碎片的时候,需要具有合的思想来粗化粒度。

分布式 架构 mysql 线程 中间件 索引 多线程 分布式数据库 分区表

86
GO