1. 云栖社区>
  2. 全部标签>
  3. #数仓#
数仓

#数仓#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

Spark入门介绍

前言 Spark自从2014年1.2版本发布以来,已成为大数据计算的通用组件。网上介绍Spark的资源也非常多,但是不利于用户快速入门,所以本文主要通从用户的角度来介绍Spark,让用户能快速的认识Spark,知道Spark是什么、能做什么、怎么去做。

安全与风控 大数据 hbase SQL 数据库 集群 spark aliyun 分布式计算 存储 Streaming 数仓 离线 x-pack

X-Pack Spark对接阿里云日志服务LogHub

概述 X-Pack Spark分析引擎是基于Spark提供的复杂分析、流式处理、机器学习的能力。Spark分析引擎可以对接阿里云的多种数据源,例如:云HBase数据库、MongoDB、Phoenix等,同时也支持对接阿里云日志服务LogHub。

日志 日志服务 数据库 同步 spark aliyun string 数据同步 html varchar loghub Streaming 数仓 离线 x-pack

基于阿里云数加MaxCompute的企业大数据仓库架构建设思路

  数加大数据直播系列课程主要以基于阿里云数加MaxCompute的企业大数据仓库架构建设思路为主题分享阿里巴巴的大数据是怎么演变以及怎样利用大数据技术构建企业级大数据平台。   本次分享嘉宾是来自阿里云大数据的技术专家祎休   背景与总体思路   数据仓库是一个面向主题的、集成的、非易失的、反映历史变化的数据集合用于支持管理决策。

大数据 架构 阿里云 日志 数据处理 阿里巴巴 数据仓库 odps 数加 数据同步 数据采集 数据管理 MaxCompute 数据应用 数仓

分析型数据库+数据传输,构建企业级实时数仓

传统的离线数据仓库,将业务数据集中进行存储后,以固定的计算逻辑定时进行ETL 和其它建模后产出报表等应用。离线数据仓库一般采用每日或每几个小时进行一次计算的方式,计算和数据的实时性均较差,业务人员无法根据自己的即时性需要获取几分钟之前的实时数据。

数据存储与数据库 大数据 架构 实时系统 数据可视化 阿里云 HTTPS 模块 数据库 高并发 数据仓库 分析型数据库 数据传输 实时计算 数仓

1
GO