1. 云栖社区>
  2. 全部标签>
  3. #大数据#
大数据

#大数据#

已有286人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

小红书推荐大数据在阿里云上的实践

小红书推荐业务架构 首先这个图上画了一些比较典型的推荐业务,使用大数据的主要模块,其中最左边是线上推荐引擎,一般推荐引擎会分成召回、排序、后排等几步,在这里就不细说了。主要是从大数据的角度来说,推荐引擎主要是运用预测模型来预估用户对每个候选笔记的喜欢程度。

大数据 数据流 Image 数据中心 流计算 推荐引擎

基于阿里云平台的大数据教学案例 —— B站弹幕数据分析

###一、实验题目 基于所学的大数据处理知识,结合阿里云大数据相关产品,分组完成一个大数据分析项目,数据集可以使用开源数据集或自行爬取,最终完成一个完整的实验报告: 1、 能够使用阿里云大数据相关产品完成数据分析、数据建模与模型优化 2、 能够基于分析结构构建可视化门户或可视化大屏,分析和呈现不少于5个 3、 分析案例有实用价值并能够形成有效结论 4、 能够将开源技术与阿里云产品结合,综合利用提升开发效率,降低成本 5、 能够完成数据分析报告和结果展示 ###二、实验目的 灵活利用所学的阿里云大数据相关技术和大数据处理知识,综合完整地完成一个大数据分析项目。

大数据 Image 数据分析 html type csv 大数据分析

数据湖有新解!Apache Hudi 与 Apache Flink 集成

纵观大数据领域成熟、活跃、有生命力的框架,无一不是设计优雅,能与其他框架相互融合,彼此借力,各专所长。

大数据 性能 Apache spark API 分布式计算 list 数据类型

数据中台交付专家告诉你,数据架构的分层怎样更加合理?

从整体上看,数据中台体系架构可分为:数据采集层、数据计算层、数据服务层三大层次。通过这三大层次对上层数据应用提供数据支撑。

大数据 架构 日志 钉钉 流式计算 解决方案 云平台 数据采集 alibaba 数据存储 海量数据

进击的数据中台,企业数字化转型的新引擎

经历过“追捧”和“质疑”等种种考验后,当前,数据中台已经走到验证其价值的关键路口。 数据中台是企业数字化转型新引擎 在人工智能、大数据等技术发展和企业数字化转型加速的双重驱动下,2019年,数据中台在众多赛道中脱颖而出,成为行业焦点。

大数据 数据仓库 Image

数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体

随着近几年数据湖概念的兴起,业界对于数据仓库和数据湖的对比甚至争论就一直不断。有人说数据湖是下一代大数据平台,各大云厂商也在纷纷的提出自己的数据湖解决方案,一些云数仓产品也增加了和数据湖联动的特性。但是数据仓库和数据湖的区别到底是什么,是技术路线之争?是数据管理方式之争?二者是水火不容还是其实可以和谐共存,甚至互为补充?本文作者来自阿里巴巴计算平台部门,深度参与阿里巴巴大数据/数据中台领域建设,将从历史的角度对数据湖和数据仓库的来龙去脉进行深入剖析,来阐述两者融合演进的新方向——湖仓一体,并就基于阿里云MaxCompute/EMR DataLake的湖仓一体方案做一介绍。

大数据 架构 hadoop 性能 数据库 数据仓库 集群 Image 存储 数据管理 MaxCompute

1895
GO