1. 云栖社区>
  2. 全部标签>
  3. #数据仓库#
数据仓库

#数据仓库#

已有11人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

阿里巴巴飞天大数据架构体系与Hadoop生态系统

先说Hadoop 什么是Hadoop? Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统,主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算,充分利用集群的威力进行高速运算和存储。

架构 飞天 hdfs hadoop 数据仓库 集群 google 数据节点 分布式文件系统 并行计算 Mapreduce 存储 海量数据

读透《阿里巴巴数据中台实践》,其到底有什么高明之处?

最近阿里巴巴分享了《阿里巴巴数据中台实践》这个PPT(自行搜索原始文章),对于数据中台的始作俑者,还是要怀着巨大的敬意去学习的,因此仔细的研读了,希望能发现一些不一样的东西。 读这些专业的PPT,实际是非常耗时的,你需要把这些PPT外表的光鲜扒光,死抠上面的每一个字去理解底下隐藏的含义,然后跟你的已有知识体系去对比,看看是否有助于完善自己的认知,对于自己不理解的,还需要经常去检索相关的文档。

大数据 资产管理 数据仓库 运营 数据管理

助力共享经济,芝麻信用背后的技术| 9月10号栖夜读

今天的首篇文章,讲述了:近期,CCTV9播放了自制的系列纪录片《大数据时代》,该片是国内首部大数据产业题材纪录片,节目细致而生动地讲述了大数据技术在政府治理、民生服务、数据安全、工业转型、未来生活等方面给我们带来的改变和影响。

python 大数据 算法 hbase Apache spring 数据仓库 aliyun API activity

如果你也想做实时数仓…

数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务,数据仓库的建设也是“数据智能”中必不可少的一环。本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细内容。

大数据 架构 消息队列 数据处理 数据仓库 实时计算 ApacheFlink 实时数仓

如果你也想做实时数仓…

数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务,数据仓库的建设也是“数据智能”中必不可少的一环。本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细内容。

大数据 架构 消息队列 数据处理 数据仓库 流计算 实时计算 Apache_Flink

数据仓库介绍与实时数仓案例

1.数据仓库简介 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。

大数据 架构 消息队列 数据仓库 Image

云端数据仓库的模式选型与建设

数据仓库是否也需要上云?如果考虑上云,都需要注意哪些方面?目前主流云厂商产品又有何特点呢?本文将一一解答。

数据存储与数据库 大数据 性能 基础设施 数据仓库 Image 云服务 存储 云服务器ECS

HIVE优化浅谈

HIVE优化浅谈 作者:邓力,entobit技术总监,八年大数据从业经历,由一代HADOOP入坑,深耕云计算应用领域,由从事亚马逊EMR和阿里云EMR应用开发逐步转入大数据架构领域,对大数据生态及框架应用有深刻理解。

大数据 性能优化 性能 reduce 数据仓库 Hive Create Mapreduce 存储 阿里云EMR

列式存储系列(一)C-Store

列式存储系列(一)概述 序 本文是列式存储系列的第一篇。在这个系列中,我们将介绍几个典型的列式存储系统。这些列式系统的出现都有各自的时代背景。在介绍这些系统的同时,我们也尽量介绍一下它们的背景,以便大家有一个更宏观的认识,理解这个系统为什么会出现,它要解决的问题,以及它如何影响后来类似系统的发展。

大数据 性能 数据库 数据仓库 索引 存储 列式存储

分析型数据库 PostgreSQL版本实例规格定义变更

信息摘要: 实例由按多个“计算组”组成,改为由按“节点”组成。一个节点只对应一个数据分区,简化规格定义,遵循标准集群数据库的模式。适用客户: 数据仓库/大数据/数据分析/数据库用户;政府/金融/零售/互联网等行业版本/规格功能: AnalyticDB for PostgreSQL 实例规格定义由多个“计算组”组成改为由多个“节点”组成。

大数据 PostgreSQL 数据库 互联网 数据仓库 集群 数据分析 aliyun MPP 分析型数据库 html AnalyticDB

DataWorks高级功能场景化案例分享

DataWorks高级功能场景化案例分享 自2009年DataWorks立项,伴随着阿里巴巴集团登月计划、公共云和专有云的发布,直到2018年V2.0的发布,DataWorks已经走过了十年的历程。

大数据 安全 监控 SQL 配置 数据仓库 API 流计算 工作流 数据开发 DataWorks

阿里云 ESSD 采用自研新一代存储网络协议,打造“超级高速”

8月26日,阿里云透露,正投入自研数据存储“超级高速”,核心存储产品ESSD已率先采用这一最新的自研存储网络协议,并实现大规模商用,数据传输效率提高50%。

高并发 数据仓库 电商 云存储 物联网 容灾 分布式存储 网络协议 存储 数据存储 海量数据

为AIoT智联网而生,阿里云高性能存储ESSD率先全球大规模商用

8月26日,阿里云宣布自研ESSD率先实现大规模商用,服务数万企业,涵盖自动驾驶、AR/VR、证券交易、电商搜索等产业。ESSD是业界首个百万级IOPS、百微秒延时的超高性能云存储产品,由于其突出的高性能、低延时特点,将成为AIoT智联网场景标配。

性能 数据仓库 电商 云存储 容灾 高性能 分布式存储 网络协议 存储 数据存储 海量数据

124
GO