1. 云栖社区>
  2. 全部标签>
  3. #数据仓库#
数据仓库

#数据仓库#

已有14人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

自建Hive数据仓库迁移到阿里云EMR

客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云EMR集群之后,涉及到将数据仓库和Hive元数据的数据库迁移上云。

数据库 数据仓库 集群 Image 数据迁移 弹性计算 对象存储 数据库迁移 EMR Hive Mapreduce 公共云

如何使用AnalyticDB for PostgreSQL 6.0 进行TPC-H 1TB数据的测试

TPC-H 主要目的是评价特定查询的决策支持能力,该基准模拟了决策支持系统中的数据库操作,测试数据库系统复杂查询的响应时间。本文详细介绍了在阿里云AnalyticDB for PostgreSQL 6.0版,测试TPC-H benchmark 1TB数据的流程和测试结果

PostgreSQL 实战 数据仓库 测试 adb AnalyticDB TPC-H ADBPG AnalyticDBforPostgreSQL

2019大数据技术公开课年度合集,带你看尽全年大数据精彩直播

在过去的一年中,大数据技术公开课共六季23次直播,内容涵盖阿里经济体的大数据典型场景最佳实践揭秘,企业级大数据平台的构建和思考,各行业客户大数据实战,阿里巴巴大数据产品特性讲解,技术大咖专访,开发者成长等内容。

大数据 数据仓库 钉钉 同步 淘宝 spark aliyun MaxCompute

新发布:免费的防疫数据分析与可视化平台---阿里云新冠病毒疫情分析App

免费的防疫数据分析与可视化平台能力---阿里云新冠病毒疫情分析App 新冠病毒疫情分析App是基于阿里云日志服务中台,提供的一站式的数据处理可视化分析系统。借助它,可以在全球范围内了解各省份、市区的全面一手疫情信息和防疫新闻动态。目前该能力全面开放给政府、社区、第三方平台和开放者进行广泛应用。

日志服务 数据仓库 数据分析 控制台 日志分析 疫情分析 免费中台 新冠病毒

DataWorks高级功能场景化案例分享

DataWorks高级功能场景化案例分享 自2009年DataWorks立项,伴随着阿里巴巴集团登月计划、公共云和专有云的发布,直到2018年V2.0的发布,DataWorks已经走过了十年的历程。

大数据 安全 监控 SQL 配置 数据仓库 API 流计算 工作流 数据开发 DataWorks

详解阿里云数据中台,一篇文章全面了解大数据“网红”

一直想写一篇关于数据中台正面文章,现在有闲时做些总结,想充分诠释一下DT内部人如何看待数据中台。 数据中台的概念是最早由阿里巴巴首次提出,是为了应对内部众多业务部门千变万化的数据需求和高速时效性的要求而成长起来的,它既要满足业务部门日常性的多个业务前台的数据需求,又要满足像双十一,六一八这样的业务高峰、应对大规模数据的线性可扩展问题、应对复杂活动场景业务系统的解耦问题,而在技术、组织架构等方面采取的一些变革。

大数据 数据仓库 数据分析 运营 报表 存储

大幅降低大数据分析使用门槛,分析型数据库AnalyticDB基础版来了!

来自用户的声音—— 大数据的方案,都是些昂贵的方案… MySQL的只读库扛不住压力了,怎么办? Hadoop/Spark/Presto/lmpala等太复杂 小白客户,如何入手大数据分析? 公司业务变化快,有没有更弹性的方案? ...... 上述问题怎么破?看阿里云的新解法👇!

大数据 mysql 性能 数据仓库 集群 测试 云盘 开发环境 分析型数据库 大数据分析 AnalyticDB

大数据计算服务MaxCompute每日问答汇总(持续更新中)

飞天大数据平台计算引擎MaxCompute成为全球首个TPCx-BB认证的公共云产品,是除Hive、Spark以外TPCx-BB第三个标准支持的大数据引擎。

数据仓库 数据安全 Image 钉钉 aliyun 解决方案 分布式计算 运营 汇总 MaxCompute 知识 小卡片

Tablestore入门手册-UpdateRow接口详解| 1月14号云栖号夜读

今天的首篇文章,讲述了:表格存储Tablestore入门手册系列主要介绍表格存储的各个功能接口和适用场景,帮助客户了解和使用表格存储Tablestore。本文对表格存储Tablestore的UpdateRow接口进行介绍,包括其参数、功能示例、使用场景等。

云栖社区 安全与风控 编程语言 数据存储与数据库 测试技术 架构 算法 PostgreSQL 数据仓库 Hybrid 容器 aliyun google Redshift 表格存储

EMR弹性低成本离线大数据分析

布式计算框架系统分别为Hadoop、Spark和Storm, Hadoop可以运用在很多商业应用系统,可以轻松集成结构化、半结构化以及非结构化数据集,Spark采用了内存计算,允许数据载入内存作反复查询,融合数据仓库、流处理和图形计算等多种计算范式,Spark能够与Hadoop 很好地结合,Storm用于处理高速、大型数据流的分布式实时计算系用,为Hadoop添加可靠的实时数据处理能力。

分布式 storm hadoop 数据处理 数据流 数据仓库 系统环境 电商 Image 弹性伸缩 spark 对象存储 e-mapreduce EMR 大数据分析

如何将数据仓库从 AWS Redshift 迁移到阿里云 AnalyticDB for PostgreSQL

阿里云AnalyticDB for PosgreSQL与 AWS Redshift 均为采用PosgreSQL内核的MPP架构数据仓库服务,语法高度兼容一致。本文介绍两者的差异比较,以及如何从AWS Redshift迁移应用和数据到阿里云 ADB for PG。

hadoop 数据仓库 云存储 数据迁移 Redshift 存储过程 adb 存储 AWS MaxCompute AnalyticDB

格灵深瞳AI大脑进化史:算法工业化生产如何将研发和交付提速10倍以上?

为了应对 AI 公司对于算法的快速生产与落地,需要兼顾数据源、数据仓库、标注、算法训练、评价体系、算法使用平台、人力物力算力成本等多方面的限制。

分布式 架构 算法 加密 数据仓库 Image

2020年不可不知的十大大数据技术

数字时代最先进的技术之一就是大数据技术。大数据不是一个流行的术语,而是用来描述规模庞大、随时间急剧变大的数据集合的术语。这意味着该数据很庞大,传统管理工具都无法分析、存储或处理它。

深度学习 大数据 NOSQL hadoop Apache 数据库 人工智能 数据仓库 Image 解决方案 存储 数据存储 大数据分析

127
GO