1. 云栖社区>
  2. 全部标签>
  3. #odps#
odps

#odps#

已有7人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

阿里云MaxCompute技术共享计划 首波技术公开课干货集锦

MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速、完全托管的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。

云栖社区 大数据 性能优化 Cloud 线下活动 数据仓库 odps 钉钉 aliyun MaxCompute bigdata

品《阿里巴巴大数据实践-大数据之路》一书(下)

今天继续谈阿里的这本书,包括数据服务平台、数据挖掘平台、数据建模、数据管理及数据应用,希望于你有启示。 1、数据服务平台 数据服务平台可以叫数据开放平台,数据部门产出海量数据,如何能方便高效地开放出去,是我们一直要解决的难题,在没有数据服务的年代,阿里的数据开放的方式简单、粗暴,一般是直接将数据导出给对方,我想,现在大多公司的开放应该也是如此吧,虽然PaaS喊了这么多年,但真正成就的又有几个? 即使如阿里,在数据开放这个方向上的探索和实践,至今也有7个年头了,任何关于数据开放毕其功于一役的做法都将失败,任何一次数据开放的改进都是伴随着对于业务理解的深入而成长起来的。

大数据 架构 算法 阿里巴巴 数据仓库 odps 数据挖掘 MaxCompute

如何理解maxcompute常见报错信息?【阿里云MVP月度分享】

貌似大部分人在遇到报错的时候,都懒得用翻译软件翻译报错信息,一般直接抛出来问,甚至连报错信息都懒得复制,直接截图出来。所以这里特地总结了一下,最近一段时间有人经常在群里问到的报错信息。 ODPS-0130252:Cartesian product is not allowed “不允许笛卡尔积”主要是为了防止用户误操作,不小心漏了关联条件,造成大量的资源的耗费。

odps 分区表 MaxCompute

阿里云MaxCompute(大数据)公开数据集---带你玩转人工智能

目前阿里云大数据产品已经免费向全部用户开放了多种公用数据集。开放的数据类别包括:股票价格数据,房产信息,影视及其票房数据。

大数据 阿里云 code odps 排序 数加 string 报表 MaxCompute 数据集 免费大数据集 免费数据

MaxCompute全表扫描新功能,给你“失误”的机会

MaxCompute提供了在不修改代码的前提下,在MapReduce或自定义函数(UDF) 代码中,通过某个固定的资源名读取不同资源(数据)的需求。

分布式 大数据 SQL odps 数据分析 钉钉 分布式计算 分区表 MaxCompute 海量数据 海量数据处理

项目owner看这里,MaxCompute全表扫描新功能,给你“失误”的机会

MaxCompute发布了“ALIAS 命令”,提供了在不修改代码的前提下,在MapReduce或自定义函数(UDF) 代码中,通过某个固定的资源名读取不同资源(数据)的需求。

分布式 大数据 函数 SQL odps 数据分析 分布式计算 分区表 alias MaxCompute 海量数据 海量数据处理 全表扫描

“帮助企业做好MaxCompute成本优化的实践” 主题分享 6月21日 18:30不见不散

在这个初夏,MaxCompute与大数据开发者们共同开启 “因计算,共成长” 分享季。 第一季《MaxCompute开发实战,爽爽不油腻》,共四次主题分享,每周二 18:30-19:00 “MaxCompute开发者交流钉钉群” 在这里等你。

大数据 数据仓库 odps 钉钉 aliyun 数据同步 数据存储 MaxCompute

阿里云大数据利器Maxcompute学习之-假如你使用过hive

如果您是一个大数据开发工程师并且使用过hadoop的hive框架,那么恭喜您,阿里云的大数据计算服务-Maxcompute,您已经会了90%。这篇文章就来简单对比下Maxcompute和hive的异同,来方便刚开始使用Maxcompute的用户,从hive秒速迁移到Maxcompute的使用上。

云栖社区 大数据 javascript 飞天 阿里云 函数 HTTPS odps Image aliyun string static Hive 数据同步 存储

MaxCompute读取分析OSS非结构化数据的实践经验总结

1. 本文背景 很多行业的信息系统中,例如金融行业的信息系统,相当多的数据交互工作是通过传统的文本文件进行交互的。此外,很多系统的业务日志和系统日志由于各种原因并没有进入ELK之类的日志分析系统,也是以文本文件的形式存在的。

java OSS odps aliyun github MaxCompute 非结构化数据

帮助企业做好MaxCompute大数据平台成本优化的最佳实践

阿里云大数据计算服务MaxCompute通过灵活性、简单性和创新为您企业的业务环境带来了变革,但是您企业是否通过其实现了原本预期的节省成本的目标呢?本文中,我们将为广大读者诸君介绍优化您企业MaxCompute开销的一些关键性的策略。

大数据 HTTPS SQL odps aliyun 云服务 数据同步 html 存储 MaxCompute 大数据平台成本估算

MaxCompute Studio 使用入门

MaxCompute Studio 是MaxCompute 平台提供的安装在开发者客户端的大数据集成开发环境工具,是一套基于流行的集成开发平台 IntelliJ IDEA 的开发插件,可以帮助您方便地进行数据开发。下面我们一起来看一看Studio的简单用法。

SQL odps 同步 脚本 studio 机器人 MaxCompute

阿里云全球首批 MVP 杨绣专访 - 技术要坚持刨根问底

使用阿里云产品过程中,我提过很多工单,包括系统bug、易用性问题、功能建议。因为喜欢刨根问底,不满足于“重启一下”、“再试一次”之类的临时性解决方法,我会很认真地描述使用场景、异常现象和可能的原因,要求客服和后台研发继续分析给出明确原因。

架构 监控 性能优化 阿里云 Oracle 高并发 数据仓库 工单 可扩展性 odps 数加 钉钉 Hive 数据存储 MaxCompute

在 MaxCompute UDF 中运行 Scipy

新版 MaxCompute Isolation Session 支持 Python UDF。也就是说,Python UDF 中已经可以跑二进制包。刚才以 Scipy 为例踩了一下坑,把相关的过程分享出来。

python 函数 path 工单 odps 沙箱 UDF MaxCompute

Python实现MaxCompute UDF/UDAF/UDTF

参数与返回值类型 参数与返回值通过如下方式指定: @odps.udf.annotate(signature) Python UDF目前支持ODPS SQL数据类型有:bigint, string, double, boolean和datetime。

python 函数 SQL odps string class UDF 数据类型

DataWorks支持PyODPS类型任务

昨天,DataWorks推出了PYODPS任务类型,集成了Maxcompute的Python SDK,可在DataWorks的PYODPS节点上直接编辑Python代码操作Maxcompute,也可以设置调度任务来处理数据,提高数据开发效率。

python SQL 配置 odps MaxCompute

MaxCompute(ODPS)上处理非结构化数据的Best Practice

随着MaxCompute(ODPS)2.0的上线,新增的非结构化数据处理框架也推出一系列的介绍文章,包括 MaxCompute上如何访问OSS数据, 基本功能用法和整体介绍,侧重介绍读取OSS数据进行计算处理; 本文:MaxCompute(ODPS)上处理非结构化数据的Best Practice。

OSS 数据处理 数据流 集群 odps 分布式计算 分布式系统 存储 MaxCompute

14
GO