原来MaxCompute还能这么玩系列（1）—— 通过Apache Zeppelin 快速实现数据可视化-阿里云开发者社区

原来MaxCompute还能这么玩系列（1）—— 通过Apache Zeppelin 快速实现数据可视化

2016-09-26 10472

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 通过简单的几步配置，教你如何快速实现MaxCompute的数据可视化

注：MaxCompute原名ODPS，是阿里云自研的大数据计算平台，文中出现的MaxCompute与ODPS都指代同一平台，不做区分

Zeppelin简介

Zeppelin是一款基于web的notebook工具，它支持以插件的方式接入各种解释器（interpreter），从而使用户能够以特定的语言或数据处理后端来完成交互式查询，并快速实现数据可视化。

部署Zeppelin

首先，你需要在部署的服务器上安装Oracle JDK 1.7，并配置好相应的JAVA_HOME环境变量，这步不做赘述。

接着，我们需要获取Zeppelin，推荐你下载官网最新的发行包。

下载后解压到服务器上的某个目录下，比如笔者解压到了本地目录：/Users/emerson/develop_tools/zeppelin-0.6.1-bin-all，该目录即为zeppelin的根目录了。在根目录下执行：

% bin/zeppelin-daemon.sh start
Zeppelin start                                             [  OK  ]

这说明zeppelin已经部署成功。

在浏览器中访问zeppelin主页，由于笔者部署在本机，而zeppelin默认启动在8080端口，所以访问的地址是：http://127.0.0.1:8080/，你将看到类似如下的页面。默认情况下，你已经以匿名的方式访问到zeppelin。

配置新的Interpreter

接着，我们来为MaxCompute JDBC创建一个Interpreter。

首先，我们需要下载携带有完整依赖的MaxCompute JDBC的jar包。请从这里获取最新的稳定版：odps-jdbc-1.9-jar-with-dependencies.jar。

然后回到zeppelin页面，用鼠标点击右上角的“anonymous”，在弹出的下拉列表中选择“Interpreter”。

你将进入如下页面，然后点击右上角的“+Create”按钮。

接着，便进入了解释器的新建页面，如下图：

填入Interpreter的名称和分组，分别是“odps”和“jdbc”。

然后增减并修改配置如下：

其中 default.user 和 default.password 分别是你在MaxCompute对应的 accessID 和 accessKey 。而 default.url 则是对应的MaxCompute JDBC的URL，请注意替换其中的project名，此处笔者使用的是odpsdemo。

而Dependencies处的artifact填写之前下载的odps-jdbc-1.9-jar-with-dependencies.jar的本地路径。

完成配置后保存并重启该名为odps的Interpreter。

新建notebook

现在，你便可以新建notebook来测试该Interpreter了。

用鼠标点击上方的“Notebook”按钮，并选择“+Create new note”，如下图所示：

为新note命名为“odps_jdbc”,如下图：

在新的note页面点击右上角的“齿轮”按钮，完成note与新Interpreter的绑定，如下图所示：

将名为“odps”的Interpreter选中并拖拽到顶部，作为默认的Interpreter使用。

保存后，即可在note中输入符合MaxCompute SQL语法的SQL，点击运行按钮完成数据查询：

实现数据可视化

Zeppelin提供了非常丰富且简单的可视化功能，点击如下图中的可视化选项，完成简单的setting配置，即可看到不同种类的可视化图表了：

欢迎加入MaxCompute钉钉群讨论

03ea92a4c1fbb04d443ff8f015c957815055111e

相关实践学习

简单用户画像分析

本场景主要介绍基于海量日志数据进行简单用户画像分析为背景，如何通过使用DataWorks完成数据采集、加工数据、配置数据质量监控和数据可视化展现等任务。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

原来MaxCompute还能这么玩系列（1）—— 通过Apache Zeppelin 快速实现数据可视化

Zeppelin简介

部署Zeppelin

配置新的Interpreter

新建notebook

实现数据可视化

大数据计算 MaxCompute

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像