阿里巴巴大数据 —玩家社区 关注
手机版

MaxCompute SQL原理解析及性能调优

分享内容 介绍了ODPS SQL的基于mapreduce是如何实现的及一些使用小技巧,回顾了mapreduce各个阶段可能产生的问题及相应...

算法 阿里云 性能 SQL odps Mapreduce MaxCompute

阿里云机器学习平台的思考

最近读了阿里的《大数据之路-阿里巴巴大数据实践》,对于其机器学习平台也蛮感兴趣,正好阿里出了本新书《解析阿里云机器学习平台》,顺便读了下,感...

大数据 算法 阿里云 数据仓库 数据挖掘

比自建 Hadoop 还便宜!云栖大会揭秘阿里云数加 MaxCompute

DT时代,越来越多的企业应用数据步入云端。 Hadoop是当下流行的大数据并行计算体系,横向扩展、生态圈成熟等一直是它的主要特点。 阿里云...

大数据 飞天 阿里云 hadoop 云栖大会 量子计算 数据仓库 数据安全 数加 分布式计算 开发环境 并行计算 企业应用 MaxCompute 海量数据

阿里云MaxCompute香港开服 引入更多人工智能

 9月18日,阿里云宣布大数据计算服务MaxCompute在香港正式开服。通过MaxCompute强大的计算能力,阿里云将为香港市场提供更多的人工智能产品,助力当地企业智能化升级。

大数据 飞天 阿里云 人工智能 阿里巴巴 数据安全 分布式计算 MaxCompute 海量数据 数据处理与分析

阿里巴巴下一代数据集成技术

数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。在企业数据集成领域,已经有了很多成熟的框...

大数据 阿里云 模块 阿里巴巴 数据仓库 数加 数据同步 数据采集 数据管理

1次演讲13次提到技术,马云在阿里巴巴年会上都说了什么?

阿里巴巴是一个奇迹,18年前的今天,阿里巴巴只有18人和50万人民币,18年后的今天,拥有54421名员工,市值4426亿美金,亚洲第1,全球第6。慕名上门拜访的各国高级政要更是络绎不绝,企业做到这份上,阿里巴巴算是独一家。

大数据 飞天 阿里云 阿里巴巴 排序 容器

阿里数据仓库实践分享

数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智...

大数据 架构 监控 个性化推荐 数据仓库 开发环境 工作流 MaxCompute DataWorks

MaxCompute常见错误汇总(更新ing)

从今天开始,小编会为大家陆续解读MaxCompute常见问题,帮助大家快速上手MaxCompute,玩转大数据计算平台。

大数据 函数 odps 解决方案 exception MaxCompute 故障 FAILED: 常见错误

阿里巴巴MaxCompute亮相VLDB2017

[摘要]8月28日-9月1日,第四十三届VLDB会议在德国慕尼黑举行。阿里巴巴在本届VLDB展区重点展示了MaxCompute、Apsara...

大数据 阿里云 性能 数据处理 数据库 高并发 阿里巴巴 电商 分布式系统 facebook 存储 MaxCompute AnalyticDB

DT时代已经悄然来临,IT人您跟上了吗?

什么是DT时代?         在2015年中国(深圳)IT领袖峰会上,马云发表演讲:过去7年我们从互联网创业到互联网产业,很快进入互联...

大数据 架构 飞天 阿里云 HTTPS 互联网 阿里巴巴 odps 运营 分布式系统 alibaba MaxCompute

美柚与MaxCompute数据同步架构说明

美柚与MaxCompute数据同步架构说明

大数据 架构 服务器 HTTPS ECS http 配置 odps 测试 数加 数据同步 美柚 MaxCompute

阿里云大数据计算服务MaxCompute(原ODPS)华南1(深圳)Region即将开服!

2017年9月7日,阿里云数加·MaxCompute(原ODPS)华南1(深圳)数据中心正式开服售卖,这是数加·MaxCompute在国内开...

大数据 阿里云 云服务器 odps 数据迁移 数加 MaxCompute 华南1 开新服 MaxCompute开新服 MaxCompute新Region开服 MaxCompute华南1Region开服

数据智能需求旺盛 阿里云MaxCompute 2.0华南区开服

8月31日,阿里云宣布将在深圳区域正式部署大数据计算服务MaxCompute,以进一步提升对华南区域客户服务的响应速度,并推动该地域人工智能...

大数据 阿里云 人工智能 阿里巴巴 数据仓库 集群 数据安全 数加 流式计算 存储 日志分析 MaxCompute 海量数据

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

当前,很多用户的业务数据存放在传统关系型数据库上,例如阿里云的RDS,做业务读写操作。当数据量非常大的时候,此时传系关系型数据库会显得有些吃...

云栖社区 大数据 阿里云 RDS HTTPS 配置 数据迁移 同步 aliyun string 数据同步 分区表 MaxCompute 动态分区

SQL优化器原理 - Auto Hash Join

在MaxCompute中,Join操作符的实现算法之一名为"Hash Join",其实现原理是,把小表的数据全部读入内存中,并拷贝多份分发到大表数据所在机器,在 map 阶段直接扫描大表数据与内存中的小表数据进行匹配。

分布式 分布式系统与计算 SQL HASH CPU network MaxCompute

SQL优化器原理-Shuffle优化

分布式系统中,Shuffle是重操作之一,直接影响到了SQL运行时的效率。Join、Aggregate等操作符都需要借助Shuffle操作符,确保相同数据分发到同一机器或Instance中,才可以进行Join、Aggregate操作。

云栖社区 数据存储与数据库 分布式 大数据 MaxCompute

SQL优化器原理 - Join重排

这是MaxCompute有关SQL优化器原理的系列文章之一。我们会陆续推出SQL优化器有关优化规则和框架的其他文章。添加钉钉群“关系代数优化...

算法 HTTPS SQL 分布式系统 伪代码 MaxCompute

阿里云「MaxCompute最佳实践」征文大赛获奖文章公布

在征文阶段,共有近44个企业和开发者提交了上云实践现文章,经过广大网友的投票以及专家评审团的打分,结果公布如下。

大数据 MaxCompute

品《阿里巴巴大数据实践-大数据之路》一书(下)

今天继续谈阿里的这本书,包括数据服务平台、数据挖掘平台、数据建模、数据管理及数据应用,希望于你有启示。 1、数据服务平台 数据服务平台可...

大数据 架构 算法 阿里巴巴 数据仓库 odps 数据挖掘 MaxCompute

报表几种常用数据方案

报表的数据源如何组织?数据链路是怎样?怎样快捷方便的拿到数据?

mysql 性能 数据处理 数据分析 同步 报表 存储 MaxCompute QuickBI

7

阿里大数据博文,问答,社群,实践,有朋自远方来,不亦说乎……

管理员:
艺卓
2256
关注
73
成员
364
文章