阿里云 MaxCompute 2021-2 月刊

本文涉及的产品
对象存储 OSS,20GB 3个月
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
对象存储 OSS,恶意文件检测 1000次 1年
简介: 2021年2月,MaxCompute发布云数仓内的机器学习 MaxCompute SQLML功能,以及MaxCompute湖仓一体OSS数据湖集成方案等15项新功能,欢迎阅读产品2月刊了解新发功能详情。

MaxCompute 2月新发布功能


1、MaxCompute SQLML 功能(中国区)商业化发布 查看文档 >>

MaxCompute SQLML 支持使用SQL语言在 MaxCompute 中创建、训练和应用机器学习模型,实现 AI 普惠。

适用客户

各个领域的 SQL从业人员/ 数据工程师 / 数据分析师 / 数据科学家

发布功能
MaxCompute SQLML 可以让数据工程师、分析师和数据科学家使用 SQL 语言在 MaxCompute 中创建、训练和应用机器学习模型,使 SQL 从业人员利用现有的 SQL 工具和技能就能应用机器学习的能力,同时无需做数据迁移,实现机器学习的普惠。


2、MaxCompute 湖仓一体功能商业化发布 查看文档 >>

MaxCompute 湖仓一体方案融合数据湖的灵活性、生态丰富性与数据仓库的企业级能力,构建数据湖和数据仓库融合的数据管理平台。

适用客户

有以下诉求企业中的 CTO / 数据平台架构师 / 大数据部门主管 / 数据开发人员等

• 已经基于 Hadoop 集群搭建数据平台,同时对集群资源弹性有需求,希望利用 MaxCompute 的弹性与大规模机器学习能力,快速迭代创新业务
• 企业有多个 Hadoop 集群,需要各个集群之间数据打通,利用 DataWorks / Dataphin 构建企业数据中台
• 以阿里云 OSS 构建数据湖应用,希望借助云数仓实现数据统一分析和管理

发布功能

MaxCompute 湖仓一体方案通过数据仓库 MaxCompute、数据湖(对象存储 OSS 或 Hadoop HDFS)共同实现。本次发布两种构建湖仓一体的方式:

• 与阿里云 OSS + DLF 构建湖仓一体能力:通过 MaxCompute 和 OSS 实现。该方式需要配套使用阿里云产品数据湖构建 DLF(Data Lake Formation)。数据湖的元数据(Schema)全部位于DLF中。MaxCompute可以利用DLF对湖数据的元数据管理能力,提升对OSS半结构化格式(AVRO、CSV、JSON、PARQUET、ORC)数据的处理能力。

• 与 Hadoop HDFS 构建湖仓一体能力:通过MaxCompute和Hadoop HDFS(包括本地机房搭建、基于云上虚拟机搭建以及阿里云 E-MapReduce等)实现。您需要填写MaxCompute湖仓一体方案使用申请表,提交申请后,MaxCompute团队技术人员会联系并协助您完成后续操作。


3、MaxCompute zOrder 排序支持与 Distribute by 共用 查看文档 >>

适用客户

开发者、分析师

发布功能

在表或分区写入数据时,查询语句指定zOrder by字段,根据指定的一列或多列按zOrder 方式进行局部排序再写入,可以提高后续在排序数据上做一列或多列交互式查询时的效率。


4、MaxCompute 支持在 values 表达式中使用非常量表达式 查看文档 >>

适用客户

开发者,分析师

发布功能

MaxCompute对 Valuse 表达式进行扩展。原先仅支持常量,扩展后还支持非常量表达式,便于用户在Values表达式中使用函数等非常量表达式。在生成数据,测试计算逻辑时使用更方便。使用方法示例: select * from values (udf(1)),(to_date('20190101', 'yyyyMMdd')),(getdate()),(datetime '2019-01-02 00:00:00') t(d);


5、MaxCompute SQL 支持SkewJoin Hint用于优化join时数据长尾问题 查看文档 >>

适用客户

开发者

发布功能

MaxCompute SQL 支持SkewJoin Hint用于优化join时存在数据长尾问题,,加快Join的执行速度。


6、MaxCompute 推出 Freeride 及 Analyze 两种优化器元数据收集工具 查看文档 >>

适用客户

开发者,分析师

发布功能

MaxCompute推出Freeride(同步)和Analyze(异步)两套优化器元数据收集工具,用于优化计算和查询性能。


7、MaxCompute 内置函数新增或增强

适用客户

开发者、分析师、开源或其他生态用户

发布功能

MaxCompute 日期函数、字符串函数、聚合函数、其他函数等内置函数新增用法或增强兼容性。

日期函数文档 >> 字符串函数文档 >> 聚合函数文档 >> 其他函数文档 >>


8、MaxCompute SQL array 数据类型处理函数新增和增强 查看文档 >>

适用客户

开发者、分析师、有半结构化数据处理需求的用户

发布功能

MaxCompute 新增array_intersect函数,用于计算两个array的交集。
增强内建函数sort_array,增加isAsc参数,对给定数组排序时让用户选择是升序还是降序,默认是升序。


9、MaxCompute 外表Hive兼容模式支持用户自定义serde类 查看文档 >>

适用客户

开发者,外表用户,有开源或自定义数据格式处理需求的用户

发布功能

用户可以在创建外表时使用using jar的方式,使用自定义的serde类实现外表对特殊数据格式的兼容。


10、MaxCompute 外表 OSS 写入场景能力增强 查看文档>>

适用客户

开发者,有导出数据需求的用户,有使用第三方引擎读取导出的数据需求的用户

发布功能

MaxCompute 支持使用 OSS Multi-upload 写 OSS 外表,数据直写到表目录下,不包含.odps 子目录。


11、MaxCompute命令行提供关闭表头显示,便于shell调用 查看文档 >>

适用客户

开发者

发布功能

MaxCompute 可以通过参数设置关闭命令行stdout输出结果的表头显示,便于用户获取动态返回值用于其他操作。


12、MaxCompute支持云HBase外部表 查看文档 >>

适用客户

开发者,分析师,联邦查询用户

发布功能

MaxCompute Hbase外部表支持读写云HBase,在MaxCompute中进行数据导入、写出或联邦查询。


13、MaxCompute支持RDS外部表(公测) 查看文档 >>

适用客户

开发者,分析师,联邦查询用户

发布功能

RDS是阿里云客户主要使用的数据库服务,MaxCompute支持RDS外部表对RDS (RDS MySQL 5.x)进行读写操作。


14、MaxCompute外表支持JDBC方式读写MC-Hologres(公测) 查看文档 >>

适用客户

开发者,分析师,联邦查询用户,有对MaxCompute与MC-Hologres同步数据需求的用户

发布功能

MaxCompute支持创建MC-Hologres外部表,并通过JDBC方式MaxCompute读写同步MC-Hologre数据。


15、MaxCompute支持Unload语句把数据导出到OSS外部存储 查看文档 >>

适用客户

开发者,分析师,对存储优化有需求的用户,在对象存储上使用其他引擎处理分析MaxCompute导出数据的用户

发布功能

MaxCompute支持Unload语句导出数据到OSS,方便用户使用OSS存储数据,并方便OSS上其他计算引擎使用导出的数据。


MaxCompute 产品官网 >>
阅读往期月刊 >>

444

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
11天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
11天前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之使用pyodps读取OSS(阿里云对象存储)中的文件的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
11天前
|
分布式计算 DataWorks Java
DataWorks产品使用合集之阿里云DataWorks专有云环境下,上传MaxCompute的UDF(用户自定义函数)的JAR包的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
21 0
|
11天前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之阿里云MaxCompute对SQL语句的长度的长度限制是多少
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
9天前
|
存储 弹性计算 固态存储
阿里云服务器CPU内存配置详细指南,如何选择合适云服务器配置?
阿里云服务器配置选择涉及CPU、内存、公网带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型e实例,如2核2G3M配置,适合低流量网站。企业用户则应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。选择时考虑实际应用需求和性能稳定性。
110 6
|
11天前
|
域名解析 弹性计算 Linux
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
本文为大家介绍了2024年购买阿里云服务器和注册域名,绑定以及备案的教程,适合需要在阿里云购买云服务器、注册域名并备案的用户参考,新手用户可通过此文您了解在从购买云服务器到完成备案的流程。
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
|
2天前
|
编解码 缓存 安全
阿里云目前活动内各云服务器实例规格适用场景与价格参考
目前阿里云的活动中,云服务器有多种不同实例规格可选,实例规格定义了实例的基本属性:CPU和内存(包括CPU型号、主频等),但是不同实例规格所适用的场景是不一样的,价格也有很大差别,有的用户初次选购阿里云服务器可能并不知道这些实例规格的具体适用场景,下面是小编整理汇总的2024年截止目前阿里云的活动中云服务器实例规格适用场景与活动价格,以供参考。
阿里云目前活动内各云服务器实例规格适用场景与价格参考
|
5天前
|
弹性计算 运维 数据安全/隐私保护
【雾锁王国开服】阿里云一键部署雾锁王国联机服务器详细教程
阿里云提供雾锁王国服务器搭建教程,借助计算巢服务,用户可在3分钟内创建Enshrouded游戏服务器。8核32G服务器1个月109元,3个月327元;4核16G10M带宽1个月30元,3个月90元。需先注册并实名认证阿里云账号,然后通过傻瓜式一键部署入口进行购买和设置,包括地域、购买时长、服务器参数等。部署完成后,分享服务器信息给游戏伙伴,即可开始游戏。详细教程和更多配置信息可在阿里云ECS产品页查看。
23 0
|
5天前
|
弹性计算
阿里云服务器多少钱一年?2024年5月云服务器价格表曝光!
2024年5月,阿里云服务器价格曝光,ECS云服务器2核2G3M带宽低至99元/年,2核4G5M优惠价199元/年。香港轻量服务器24元/月,4核8G服务器700元/年。其他配置如8核32G也有不同优惠。详细价格表及活动信息见阿里云服务器ECS页面
|
13天前
|
网络协议 Serverless 应用服务中间件
Serverless 应用引擎操作报错合集之在阿里云函数计算中,服务器调用FC函数时出现 "[Errno -3] Temporary failure in name resolution)" 错误如何解决
Serverless 应用引擎(SAE)是阿里云提供的Serverless PaaS平台,支持Spring Cloud、Dubbo、HSF等主流微服务框架,简化应用的部署、运维和弹性伸缩。在使用SAE过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
162 4

热门文章

最新文章