阿里云MaxCompute 2019-10 月刊

简介: MaxCompute支持分区合并,支持VPC网络IP白名单设置,支持自然连接NATURAL JOIN等新功能尽在10月刊。

您好,MaxCompute 2019.10月刊为您带来10月产品、技术最新动态,欢迎阅读。订阅 MaxCompute 月刊 >>


导读

【重要发布】10月产品重要发布

【文档更新】10月重要文档更新

【干货精选】10月精选技术文章

【技术活动】活动回顾与预告


【重要发布】10月产品重要发布

1. 支持新运算符     查看详情 >>>

支持新运算符,丰富MaxCompute计算场景,用户使用更加灵活。

适用客户
MaxCompute公共云客户

发布功能
1) IS [NOT] DISTINCT FROM:
例如:a IS DISTINCT FROM b,相当于not(a<=>b);a IS NOt DISTINCT FROM b相当于 a<=>b
2) A||B:字符串连接操作符(||) :
例如:a||b||c 相当于concat(a, b, c)


2. 支持自然连接NATURAL JOI     查看详情 >>>

支持自然连接NATURAL JOIN,提升了MaxCompute SQL引擎的JOIN能力,用户操作更加灵活。

适用客户
MaxCompute公共云客户

发布功能
支持自然连接(Natural Join) 即参与JOIN的两张表根据字段名字自动决定连接字段。支持 outer natural join,支持使用using字段执行join,输出字段中公共字段只出现一次。例如:表src的字段(key1, key2, a1, a2),表src2的字段(key1, key2, b1, b2),SELECT * FROM src NATURAL JOIN src2; 由于 src 和 src2 有两个同名字段 (key1, key2) ,所以相当于:SELECT src.key1 as key1, src.key2 as key2, src.a1, src.a2, src2.b1, src2.b2 FROM src INNER JOIN src2 ON src.key1 = src2.key1 AND src.key2 = src2.key2;


3. 支持LIMIT OFFSET     查看详情 >>>

支持LIMIT OFFSET,MaxCompute SQL引擎能力提升,用户操作更加灵活。

适用客户
MaxCompute公共云客户

发布功能
OFFSET 和 ORDER BY LIMIT语句配合,可以指定跳过OFFSET数目的行。例如:SELECT * FROM src ORDER BY key LIMIT 20 OFFSET 10;将 src 按照 key从小到大排序后,输出第11到第30行 (OFFSET 10 指定跳过前10行,LIMIT 20 指定最多输出20行)


4. 新增内置函数JSON_TUPLE和EXTRACT     查看详情 >>>

新增内置函数JSON_TUPLE和EXTRACT,MaxCompute SQL引擎能力提升,用户操作更加灵活。

适用客户
MaxCompute公共云客户

发布功能
新增字符串函数JSON_TUPLE、日期函数EXTRACT。格式说明:STRING JSON_TUPLE(STRING json,STRING key1,STRING key2,...),用于一个标准的JSON字符串中,按照输入的一组键(key1,key2,...)抽取各个键指定的字符串。INT EXTRACT( from ),提取日期的一部分。


5. JOIN与SETOP支持括号指定优先级     查看详情 >>>

JOIN与SETOP支持括号指定优先级,MaxCompute SQL引擎能力提升,客户操作更加灵活。

适用客户
MaxCompute公共云客户

发布功能
支持通过括号指定JOIN的优先级,括号内的JOIN优先级较高。如下JOIN语句中,先执行src2 JOIN src3得出结果后再执行与src的JOIN。例如:SELECT * FROM src JOIN (src2 JOIN src3 on xxx) ON yyy;


6. MaxCompute支持分区合并     查看详情 >>>

MaxCompute 有分区数量上限6万的限制,当分区数量过多时,可使用合并分区功能,对数仓数据进行归档。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute支持合并分区,对数仓数据进行归档,将同一个表下多个分区数据快速合并成一个分区, 并删除之前分区, 把数据移动到指定的分区下。


7. MaxCompute支持VPC网络IP白名单设置     查看详情 >>>

MaxCompute支持VPC网络IP白名单设置,客户安全管理更加灵活。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute支持VPC网络IP白名单设置。


8. 新增flag支持只grouy by / order by 字段序号,而不用写字段名     查看详情 >>>

新增flag支持只grouy by / order by 字段序号,而不用写字段名,SQL语法更丰富,书写更灵活。

适用客户
MaxCompute公共云客户

发布功能
1) 当sql语句set flagset hive.groupby.position.alias=true;时,GROUP BY 中的整形常量会被当做select的列序号处理。示例:set hive.groupby.position.alias=true; select region, sum(total_price) from sale_detail group by 1;(常量1代表select的列中第一列即region);
2) 当sql语句set flagset hive.orderby.position.alias=true;时,ORDER BY 中的整形常量会被当做select的列序号处理。例如:表src的列为(key BIGINT,value BIGINT) SELECT FROM src ORDER BY 2 limit 100; 等同于SELECT FROM src ORDER BY value limit 100。


9. 支持一次增加或删除多个分区     查看详情 >>>

支持一次增加或删除多个分区,使客户对分区管理更加灵活。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute的DDL语义升级,支持一次增加或删除多个分区的操作,用户可执行批量的分区管理操作,提升了数仓管理操作的效率。


10. 支持指定表的列默认值     查看详情 >>>

支持指定表的列默认值,提升了MaxCompute DDL的能力,用户操作更加灵活。

适用客户
MaxCompute公共云客户

发布功能
DEFAULT value 指定列的默认值,当insert操作不指定该列时,该列写入默认值。[(col_name data_type [DEFAULT value] [COMMENT col_comment], ...)]

【文档更新】10月重要文档更新     更多文档 >>>

  1. 新增Hive迁移到MaxCompute最佳实践视频
  2. 新增成本优化最佳实践
  3. 新增PyODPS示例 PyDOPS的排序 > PyODPS的去重 > PyODPS的采样 > PyODPS的数据缩放 > PyODPS的空值处理 >
  4. 新增支持VPC网络IP白名单设置 项目空间操作 > 设置IP白名单 >

【干货精选】10月精选技术文章     更多详情 >>>

  1. 最全合集】[一文看尽 2019杭州云栖大会 MaxCompute 技术分享
  2. 如何有效降低大数据平台安全风险
  3. 丰富、连接、待集成—MaxCompute 生态再出发
  4. 混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践
  5. 阿里巴巴大数据技术关键进展及展望

【技术活动】回顾和预告

【双11】MaxCompute 限时折扣,预付费标准版年付8折。活动时间:11月1日-11月11日

活动回顾

《技术直播 kafka 数据如何同步到 MaxCompute 》2019.10.22 19:00-19:40

<直播简介> 主要介绍Kafka产品的原理和使用方式,以及同步数据到MaxCompute的参数介绍、独享集成资源组与自定义资源组的使用背景和配置方式、Kafka同步数据到MaxCompute的开发到生产的整体部署操作等内容。

视频回放 >>>
分享资料下载 >>>

《Hadoop 数据如何同步至 MaxCompute》 2019.10.29 19:00-19:40

<直播简介> **云下Hadoop用户如何快速、平滑的迁移到阿里云MaxComute大数据生态?如何快速完成数据和业务的迁移以及生态系统的对接?MaxCompute提供了数据迁移工具-MMA,支持Meta、数据、作业和工作流的批量自动化迁移,帮助客户高效、低成本的上云,快速构建云上业务。

视频回放 >>>
分享资料下载 >>>

活动预告

《MySQL/RDS 数据如何同步到 MaxCompute》 2019.11.5 19:00-19:40

【直播简介】主要讲解MySQL/RDS业务数据如何通过DataWorks数据集成或DTS同步到MaxCompute。
【观看直播】MaxCompute开发者社区2群


《日志数据如何同步到 MaxCompute》 2019.11.12 19:00-19:40

【直播简介】主要讲解日志文件如何通过Loghub/Datahub同步数据到MaxCompute的参数介绍和详细同步过程等内容。
【观看直播】MaxCompute开发者社区2群

点击链接加入 MaxCompute开发者社区2群 https://h5.dingtalk.com/invite-page/index.html?bizSource=____source____&corpId=dingb682fb31ec15e09f35c2f4657eb6378f&inviterUid=E3F28CD2308408A8&encodeDeptId=0054DC2B53AFE745
或扫码加入
image

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
4天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4天前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之使用pyodps读取OSS(阿里云对象存储)中的文件的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4天前
|
分布式计算 DataWorks Java
DataWorks产品使用合集之阿里云DataWorks专有云环境下,上传MaxCompute的UDF(用户自定义函数)的JAR包的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
12 0
|
4天前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之阿里云MaxCompute对SQL语句的长度的长度限制是多少
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1月前
|
机器学习/深度学习 分布式计算 数据挖掘
阿里云 MaxCompute MaxFrame 开启免费邀测,统一 Python 开发生态
阿里云 MaxCompute MaxFrame 正式开启邀测,统一 Python 开发生态,打破大数据及 AI 开发使用边界。
380 1
|
4天前
|
域名解析 弹性计算 Linux
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
本文为大家介绍了2024年购买阿里云服务器和注册域名,绑定以及备案的教程,适合需要在阿里云购买云服务器、注册域名并备案的用户参考,新手用户可通过此文您了解在从购买云服务器到完成备案的流程。
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
|
2天前
|
存储 弹性计算 固态存储
阿里云服务器CPU内存配置详细指南,如何选择合适云服务器配置?
阿里云服务器配置选择涉及CPU、内存、公网带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型e实例,如2核2G3M配置,适合低流量网站。企业用户则应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。选择时考虑实际应用需求和性能稳定性。
|
5天前
|
网络协议 Serverless 应用服务中间件
Serverless 应用引擎操作报错合集之在阿里云函数计算中,服务器调用FC函数时出现 "[Errno -3] Temporary failure in name resolution)" 错误如何解决
Serverless 应用引擎(SAE)是阿里云提供的Serverless PaaS平台,支持Spring Cloud、Dubbo、HSF等主流微服务框架,简化应用的部署、运维和弹性伸缩。在使用SAE过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
26 4
|
7天前
|
存储 编解码 安全
阿里云服务器计算型c7与c8y、通用型g7与g8y、内存型r7与r8y区别及选择参考
在阿里云目前的活动中,除了轻量应用服务器和经济型e、通用算力型u1实例的云服务器之外,性能更高的云服务器实例规格有计算型c7与c8y、通用型g7与g8y、内存型r7与r8y,这些实例规格更适合企业级用户的上云需求,有的用户并不是很清楚他们之间的区别,从而不知道应该如何选择,本文就为大家介绍一下他们之间的区别,以供选择参考。
阿里云服务器计算型c7与c8y、通用型g7与g8y、内存型r7与r8y区别及选择参考
|
8天前
|
存储 小程序 数据库
阿里云学生云服务器申请,阿里云送每个大学生一台云服务器
2024年,阿里云为学生提供免费7个月的学生服务器,包括2核2G配置、1M带宽和独立IP。学生需通过学信网认证,完成任务可额外获得6个月免费时长。申请流程包括注册阿里云账号、实名认证和学生认证。此外,学生可免费领取300元无门槛优惠券,在阿里云高校计划中使用。学生服务器可用于建站、部署等多种场景。详细信息和申请入口见官方链接。
73 0

热门文章

最新文章

相关产品

  • 云原生大数据计算服务 MaxCompute