数加平台——阿里大数据OS实践

简介: 在云栖计算之旅第5期——大数据与人工智能大会上,阿里云大数据事业部数加平台技术负责人陈廷梁从数加定义、起源、愿景、价值、架构、规划六个方面分享了《数加平台——阿里大数据OS实践》。其中,他主要介绍了数加平台的演进过程和阿里大数据OS的架构。

在云栖计算之旅第5期——大数据与人工智能大会上,阿里云大数据事业部数加平台技术负责人陈廷梁从数加定义、起源、愿景、价值、架构、规划六个方面分享了《数加平台——阿里大数据OS实践》。其中,他主要介绍了数加平台的演进过程和阿里大数据OS的架构。

 

以下内容根据视频整理而成。

 

视频回顾:点此进入

pdf下载:点此进入

 

数加是什么

0bfcc1f9a00151b848665e7964fa471350597774

在阿里云的官网打开大数据部分(整个大数据部分统称为数加),其中包括:大数据基础服务部分,MaxCompute、ADS、流计算、大数据开发套件;人工智能部分,机器学习(基础平台是PAI)、语音识别、ET等;数据分析展现部分,数据可视化(大屏、BI报表)、I+关系网络分析(安全领域用的比较多);数据应用部分,推荐引擎(提供面向终端用户的服务,以大数据中间件存在)等。天池比赛也是基于数加平台,数加数据市场相当于大数据的App Store。

数加是什么?数加=数加平台+数加市场+数加应用。平台相当于OS部分,其上有App Store(即市场),市场上有大量的应用(包括官方应用和第三方应用)。数加平台基于阿里十几年在大数据上的经验积累,在对内的平台BASE上做了一个对外的实例即数加。数加平台除了BASE,还包括多租户、账号、权限、安全、meta、计量计费、Open API、数据市场、数加网站等模块,也包括算法平台PAI。

数加平台=大数据OS=大数据的IOS。大数据OS希望提供高度集成的大数据平台,将计算引擎、数据开发工具、数据采集和传输工具、数据分析工具、机器学习平台无缝集成,提供端到端的一站式用户体验;提供云数仓服务(对标redshift),革传统数据仓库的命,让基于Hadoop自建数据平台成为往事,让客户专注于业务系统开发,把用户数据还给用户,提供安全隔离的租户空间;是开放的大数据OS,兼容开源数据生态,支持各种第三方数据应用在上面安装使用;支持数据交换和分享,让用户安全,可计量的使用他方数据。

cdf925b3e7ec71bd1d324facd205d780750e97d4

大数据生态中,数加平台最底层是计算平台,还包括一系列支撑平台、数据开发和算法开发,对外提供大数据的基本职能是SQL开发(是Web界面,方便易用)、MapReduce开发、算法开发(PAI)。Open API层可与外部应用打通。数加数据市场中,包括数据服务(包括API服务)、数据应用(基于整个数据开发平台,以及数据API等各种东西)。

da61fcc8fe51cda368b6dbad72718afc4b8e6443

上图中,下面是数加平台,核心的东西是数据开发、数据分析、应用平台,上面是各个领域的应用。

数加起源

阿里早年烦恼

很早以前,阿里很多的BO用的都是IOE,其存储昂贵、可扩展性差。阿里各个分支有不同的尝试,B2B、支付宝尝试的是Greenplum,淘宝选择了Hadoop。此时产生了数据孤岛问题,各业务部门的数据散落在多个集群,彼此之间数据不通,数据共享太难,缺少权限安全的管理。所以需要做数据仓库来把数据集中在统一的一个平台来管理。数据共享的问题解决之后,由于数据不集中,也没有较好的数据仓库规划,导致数据被拖来拖去、重复存储和计算,出现了重复建设的问题。

阿里大数据背后的挑战

  • EB级的数据算不算得动?
  • 百万张表如何管理?
  • 数据质量之殇?
  • 大集中的数据如何确保安全?

统一的自主可控的大数据平台

在Hadoop的基础上,做了统一的自主可控的大数据平台,其特点是:统一平台,数据大集中,统一的存储,统一的计算平台,统一的数据开发平台,统一的元数据又会涉及到数据治理;资源共享,弹性分配,基于ODPS多集群技术,由数以万计的服务器提供超级计算能力,按需弹性分配给各数据开发团队;数据隔离,权限管理,基于ODPS多租户机制,各部门可独立管理自身的数据,独立做数据授权。

阿里大数据体系架构

fc67209279457d1e806900307d1f37d84d7216ec

上图展示了阿里内部数据平台的进化。首先是大数据平台的统一,数据仓库的统一极其重要,然后是产品和服务层的统一。最上方的前台业务也契合了阿里的公司战略:基础设施要足够大,前台能够利用其快速突破业务。右边是支撑数据平台的一些工具软件。比如成本管理,当一个公司足够大的时候,成本控制非常重要。怎么做到数据共享、算法共享、知识共享,一直是阿里的愿景。

数加对阿里集团业务的支撑

63f5dc93236240396e215dd2a4a0de004b6a132e

上图是数加对阿里集团业务的支撑,下面是数加平台,支撑着蚂蚁金服、电子商务、物流及其他领域。存、通、用是阿里在数据上面多年来总结的心法。存是指数据大集中,MaxCompute(ODPS)统一存储和计算;通是指统一规范,打通各个业务单位,进而推动数据开放和交换,促发展,养生态;用是指数据化运营,进而运营数据。

数加对阿里集团业务的支撑

6f7ed47b043d652e388a6892c202b300b3cef825

阿里集团绝大部分数据都在数加平台上。

阿里大数据实践之路

6d93936b782e0258826b6e3738f8dd194831f114

首先需要统一的数据上云,然后数据资产化是指解决成本问题,只有能产生业务价值才能反向拉动整个数据相关技术及团队的成长。数据生态是将前三步积累的东西构建一个平台。

数加平台愿景

首先是,希望数加平台成为数据分享第一平台,基于大数据OS构建大数据生态。普惠大数据也是其中一个愿景,希望大家通过这个平台可以更加关注自己的业务而不是研究如何搭建平台、Hadoop。其实,做数据平台最难的并不是搭Hadoop、Spark,而是如何做元数管理、调度、数据治理、数据监控。一个公司需要投入很大的人力才能做到基本可用。普惠大户数据的提出就是希望基于这个平台,人人可用,便宜,好用。

数加平台的价值

面向开发者的大数据操作系统

95e6a0e3852c3a48afe0b546bbf99d5f6e791af3

业务数据经过4个过程:采集存储环节,工具可以使用DataX;计算和加工环节,包括数据预处理和加工、数据模型、算法;数据分析环节,一般是使用BI工具,也包括即时查询、多维查询工具;深度挖掘环节。最后进行数据服务和数据展现。应用加速就是经常提到的大数据中间件,比如大屏的中间件DataV。右边是一些应用的行业。

大数据OS的价值

93f27acbf328dc6e1032d4dc33be647cd0e8f960

OS层最里面是计算引擎,数据采集、数据开发、数据分析、机器学习是最重要的数据学习领域。上部分列出了有些比较常见的中间件。正常来说,从零开始开发一个个性化推荐需要900人天的时间,但是使用上述的中间件可以将时间缩短到30人天。从零开始开发一个活动直播大屏需要一个月的时间,使用中间件只需要3天~1个小时。

阿里大数据OS

715cfe9b37d1840b5c5089e1acc9017b8b163cdd

上图展示了阿里大数据OS整个体系。下面是n个独立的集群(可能是跨国的),用飞天OS将其变得相当于一台计算机,使用ODPS则看起来像一个计算引擎,One Data做数据仓库进行统一的管理和数据治理。周边是数加平台的基础设施和支撑软件,比如元数据、调度和任务监控。最上方基于One Service公共数据服务对外提供服务。

数加平台系统架构

9f453ab189b0f56ac64808a4ea5e7815e28d04b2

更详细来看,数据层包含了各种数据,用户数据中心即云数据仓库,每个用户可以在其上建立自己的数据中心。各租户之间可以做分享,并且有平台共享的数据。数据平台层包括计算引擎和支撑平台,对外有做SQL开发和MapReduce开发的接口,OpenAPI可以将做好的数据分享或者授权给别人使用。上面是数据应用,包括一方应用(日志分析、QuickBI、AI应用)和三方应用。

数加典型用户

70aa775feafaa3105f2ab07f3a21b6237a594e51

阿里做公有云的数据平台服务,目标是服务中小企业。

数加平台规划

02409635af6a97f09ff2d21331b0f61dd9e72c05

数加平台的规划包括:建子云平台,建立行业云;支持混合云架构,统一元数据系统,支持实时、数据抓取,兼容开源数据生态、Hadoop一键数据和任务迁移;繁荣数据市场生态;初步探索数据交换模式,平台主导建立数加共享数据库(企业信息数据库、个人信息数据库、社会共享信息数据库)。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
17天前
|
运维 算法 安全
深入理解操作系统的内存管理:原理与实践
【4月更文挑战第25天】 在现代计算机系统中,操作系统扮演着至关重要的角色,它负责协调和管理硬件资源,为上层应用提供必要的服务。其中,内存管理是操作系统的核心功能之一,它不仅关乎系统性能,也直接影响到系统的稳定性和安全性。本文将深入探讨操作系统内存管理的关键原理,包括虚拟内存、物理内存分配、分页机制以及内存保护等,并结合Linux操作系统实例,分析其内存管理的实现细节。通过理论与实践的结合,旨在为读者提供一个全面、深入的操作系统内存管理视角。
|
20天前
|
算法 调度 UED
深入理解操作系统内存管理:原理与实践
【4月更文挑战第23天】 在现代计算机系统中,操作系统的内存管理是保证系统高效、稳定运行的关键组成部分。本文旨在深入探讨操作系统中内存管理的理论基础、关键技术以及实际操作过程,通过对内存分配策略、虚拟内存技术、分页与分段机制等核心概念的详细解析,为读者提供一个清晰、全面的内存管理视角。此外,文章还将通过案例分析,展示内存管理在解决实际问题中的应用,以期加深读者对操作系统内存管理复杂性的认识和理解。
|
2天前
|
数据采集 供应链 安全
利用大数据优化业务流程:策略与实践
【5月更文挑战第11天】本文探讨了利用大数据优化业务流程的策略与实践,包括明确业务目标、构建大数据平台、数据采集整合、分析挖掘及流程优化。通过实例展示了电商和制造企业如何利用大数据改进库存管理和生产流程,提高效率与客户满意度。随着大数据技术进步,其在业务流程优化中的应用将更加广泛和深入,企业需积极采纳以适应市场和客户需求。
|
3天前
|
消息中间件 测试技术 Linux
linux实时操作系统xenomai x86平台基准测试(benchmark)
本文是关于Xenomai实时操作系统的基准测试,旨在评估其在低端x86平台上的性能。测试模仿了VxWorks的方法,关注CPU结构、指令集等因素对系统服务耗时的影响。测试项目包括信号量、互斥量、消息队列、任务切换等,通过比较操作前后的时戳来测量耗时,并排除中断和上下文切换的干扰。测试结果显示了各项操作的最小、平均和最大耗时,为程序优化提供参考。注意,所有数据基于特定硬件环境,测试用例使用Alchemy API编写。
10 0
linux实时操作系统xenomai x86平台基准测试(benchmark)
|
4天前
|
安全 Linux Anolis
centos停止更新?这篇博客教会你CentOS 7转化系统为阿里龙蜥Anolis OS 7
centos停止更新?这篇博客教会你CentOS 7转化系统为阿里龙蜥Anolis OS 7
|
9天前
|
算法 安全 Linux
深入理解操作系统的内存管理:原理与实践
【5月更文挑战第4天】 在现代计算领域,操作系统的内存管理是保证系统稳定、高效运行的关键。本文旨在深入剖析操作系统内存管理的基本原理,包括虚拟内存、物理内存、分页机制和内存交换等概念。同时,文章将探讨如何通过优化内存分配策略,提升系统性能及响应速度。此外,还将讨论当前流行的操作系统(如Linux和Windows)中内存管理的创新技术及其应用案例。
|
12天前
|
缓存 算法 内存技术
深入理解操作系统内存管理:原理与实践
【4月更文挑战第30天】本文旨在深入探讨操作系统中的内存管理机制,包括物理内存的分配与回收、虚拟内存技术、分页系统以及内存优化策略。通过对内存管理概念的详细解读和实际案例分析,读者将获得对操作系统如何处理内存资源的全面认识,并了解如何在实践中应用这些知识以提高系统性能和稳定性。
|
13天前
|
搜索推荐 vr&ar Android开发
移动应用与系统的融合未来:开发与操作系统的深度剖析移动应用与系统:技术演进与开发实践
【4月更文挑战第30天】 随着科技的飞速发展,移动应用与系统已经成为我们日常生活中不可或缺的一部分。从智能手机到平板电脑,从健康监测到娱乐休闲,移动应用与系统的结合为我们带来了前所未有的便利。本文将深入探讨移动应用开发的挑战与机遇,以及移动操作系统的核心功能和发展趋势。 【4月更文挑战第30天】 随着智能设备的普及,移动应用与操作系统成为了信息技术领域的热点。本文将深入探讨移动应用开发的最新趋势、挑战以及移动操作系统的关键技术,旨在为开发者和技术决策者提供全面的视角和实用的指导。
|
13天前
|
存储 算法 安全
深入理解操作系统内存管理:原理与实践
【4月更文挑战第29天】 在现代计算机系统中,操作系统的内存管理是其核心功能之一。有效的内存管理不仅关乎系统性能,也直接影响到用户程序的稳定性和安全性。本文将详细探讨操作系统内存管理的基本原理、关键技术以及当前的挑战和创新方向。通过对页式管理、段式管理和段页式管理等技术的深入分析,我们旨在为读者提供一个清晰、系统的内存管理知识框架,并讨论虚拟内存技术如何帮助解决物理内存不足的问题。同时,考虑到安全性日益成为关注焦点,文中还将介绍内存保护机制和内存隔离技术。最后,结合最新的硬件发展趋势,如非易失性内存(NVM)的出现,本文也将对内存管理的未来发展方向进行展望。
|
13天前
|
存储 运维 监控