1. 云栖社区>
  2. 全部标签>
  3. #数据仓库#
数据仓库

#数据仓库#

已有11人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

阿里开源!云原生应用自动化引擎 OpenKruise | 直击 KubeCon | 6月26号云栖夜读

今天的首篇文章,讲述了:近期开展的 KubeCon China 2019 上,阿里云将陆续为全球用户分享阿里巴巴超大规模云原生落地实践、云原生前沿技术与应用包括 OpenKruise 开源项目、开放云原生应用中心(Cloud Native App Hub),同时将重磅发布边缘容器、云原生应用管理与交付体系等产品和服务。

云栖社区 大数据 架构 PostgreSQL 数据仓库 数据分析 aliyun 应用管理 分析型数据库 物联网 协议栈 AnalyticDB Tableau

Oracle PL/SQL应用迁移 AnalyticDB for PostgreSQL指导

AnalyticDB for PostgreSQL(简称:ADB for PG)对Oracle语法有着较好的兼容,本文介绍如何将Oracle应用迁移到AnalyticDB for PostgreSQL。

PostgreSQL 函数 Oracle SQL 数据仓库 plpgsql Create timestamp varchar adb 数据类型 AnalyticDB oracle兼容

AnalyticDB for PG 如何作为数据源对接帆软 FineBI

本文介绍 分析型数据库 PostgreSQL 版 (AnalyticDB for PostgreSQL) 如何作为 帆软 BI 的数据源,支持 BI 查询展现。

数据存储与数据库 PostgreSQL 数据库 数据仓库 测试 JDBC ads 分析型数据库 Driver 报表 big data MaxCompute AnalyticDB 帆软

MongoDB 4.2 新特性解读 | 6月24号云栖夜读

今天的首篇文章,讲述了:.“MongoDB 4.2 新特性解读”基于飞天分布式系统和高性能存储,提供三节点副本集的高可用架构,容灾切换,故障迁移完全透明化。并提供专业的数据库在线扩容、备份回滚、性能优化等解决方案。

nginx 大数据 性能优化 飞天 MongoDB 高可用 数据仓库 aliyun 并行计算 容灾 分布式系统 MaxCompute

揭秘|每秒千万级的实时数据处理是怎么实现的? | 6月21号云栖夜读

今天的首篇文章,讲述了:闲鱼目前实际生产部署环境越来越复杂,横向依赖各种服务盘宗错节,纵向依赖的运行环境也越来越复杂。当服务出现问题的时候,能否及时在海量的数据中定位到问题根因,成为考验闲鱼服务能力的一个严峻挑战。

大数据 Apache 数据处理 数据仓库 中间件 电商 aliyun

ETL测试工具简介

ETL测试 ETL测试过程与其他测试过程类似,包括一些阶段。 确定业务需求 测试计划 设计测试用例和测试数据 测试执行和错误报告参考 总结报告 测试结束 ETL测试的类型 生产验证测试: 也称为表平衡或产品对帐。

大数据 etl 数据库 数据仓库 测试 数据迁移 自动化测试 单元测试 数据类型

如何在DataWorks V2.0 的 ODPS SQL任务中使用调度参数

DataWorks提供了系统调度参数,调度系统会根据调度参数的配置,结合当前的业务日期,将调度参数转换为具体的时间。

云栖社区 SQL 数据仓库 odps Image 数加 钉钉 表达式 空格 MaxCompute DataWorks 测试运行 调度参数

Oracle应用迁移到AnalyticDB for PostgreSQL指导 | 6月17号云栖夜读

今天的首篇文章,讲述了:AnalyticDB for PostgreSQL(简称:ADB for PG)对Oracle语法有着较好的兼容,本文介绍如何将Oracle应用迁移到AnalyticDB for PostgreSQL。

PostgreSQL Oracle 性能 数据仓库 aliyun DataFrame AnalyticDB

数据仓库介绍与实时数仓案例 | 6月11号云栖夜读

在本刊开篇文章中,讲述了:数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。

PostgreSQL 程序员 高可用 数据库 数据仓库 容器 测试 aliyun 沙箱

比自建 Hadoop 还便宜!云栖大会揭秘阿里云数加 MaxCompute

DT时代,越来越多的企业应用数据步入云端。 Hadoop是当下流行的大数据并行计算体系,横向扩展、生态圈成熟等一直是它的主要特点。 阿里云数加MaxCompute (原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。

大数据 飞天 阿里云 hadoop 云栖大会 量子计算 数据仓库 数据安全 数加 分布式计算 开发环境 并行计算 企业应用 MaxCompute 海量数据

MVP 学院大数据专场之我见(下)

阿里云大数据最佳实践相关内容

大数据 性能 数据仓库 数据安全 大数据分析

DataSimba系列之计算引擎篇

数据的爆炸式增长以及价值的扩大化,将对企业未来的发展产生深远的影响,数据将成为企业的核心资产。如何处理大数据,挖掘大数据的价值,让大数据为企业的发展保驾护航,将是未来信息技术发展道路上关注的重点。

分布式 大数据 SQL 数据处理 数据库 数据仓库 数据分析 spark 离线计算 Hive 磁盘 存储 计算引擎 数据中台

使用EMR Spark Relational Cache跨集群同步数据

Relational Cache是EMR Spark支持的一个重要特性,主要通过对数据进行预组织和预计算加速数据分析,提供了类似传统数据仓库物化视图的功能。除了用于提升数据处理速度,Relational Cache还可以应用于其他很多场景,本文主要介绍如何使用Relational Cache跨集群同步数据表。

云栖社区 系统软件 数据存储与数据库 大数据 Json 数据处理 数据仓库 集群 Cache 同步 spark string EMR 数据同步 分区表

使用EMR Spark Relational Cache跨集群同步数据

Relational Cache是EMR Spark支持的一个重要特性,主要通过对数据进行预组织和预计算加速数据分析,提供了类似传统数据仓库物化视图的功能。除了用于提升数据处理速度,Relational Cache还可以应用于其他很多场景,本文主要介绍如何使用Relational Cache跨集群同步数据表。

大数据 分布式系统与计算 Json 数据处理 数据仓库 集群 Cache 数据分析 同步 spark string EMR 数据同步 分区表

Impala——2.架构

标签(空格分隔): Impala Impala Server的组件 Impala服务器是分布式,大规模并行处理(MPP)数据库引擎。它由不同的在群集中的特定主机上运行的守护程序进程组成。 Impala守护进程 核心Impala组件是一个守护进程,它通过impalad进程在集群的每个DataNode上运行。

大数据 架构 hdfs hadoop 函数 SQL 高可用 数据库 数据仓库 集群 主机 负载均衡 JDBC Hive odbc

121
GO