原来MaxCompute还能这么玩系列（1）—— 通过Apache Zeppelin 快速实现数据可视化-阿里云开发者社区

原来MaxCompute还能这么玩系列（1）—— 通过Apache Zeppelin 快速实现数据可视化

2016-09-26 10675

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： 通过简单的几步配置，教你如何快速实现MaxCompute的数据可视化

注：MaxCompute原名ODPS，是阿里云自研的大数据计算平台，文中出现的MaxCompute与ODPS都指代同一平台，不做区分

Zeppelin简介

Zeppelin是一款基于web的notebook工具，它支持以插件的方式接入各种解释器（interpreter），从而使用户能够以特定的语言或数据处理后端来完成交互式查询，并快速实现数据可视化。

部署Zeppelin

首先，你需要在部署的服务器上安装Oracle JDK 1.7，并配置好相应的JAVA_HOME环境变量，这步不做赘述。

接着，我们需要获取Zeppelin，推荐你下载官网最新的发行包。

下载后解压到服务器上的某个目录下，比如笔者解压到了本地目录：/Users/emerson/develop_tools/zeppelin-0.6.1-bin-all，该目录即为zeppelin的根目录了。在根目录下执行：

% bin/zeppelin-daemon.sh start
Zeppelin start                                             [  OK  ]
        
          
        
        
        
          
          AI 代码解读

这说明zeppelin已经部署成功。

在浏览器中访问zeppelin主页，由于笔者部署在本机，而zeppelin默认启动在8080端口，所以访问的地址是：http://127.0.0.1:8080/，你将看到类似如下的页面。默认情况下，你已经以匿名的方式访问到zeppelin。

配置新的Interpreter

接着，我们来为MaxCompute JDBC创建一个Interpreter。

首先，我们需要下载携带有完整依赖的MaxCompute JDBC的jar包。请从这里获取最新的稳定版：odps-jdbc-1.9-jar-with-dependencies.jar。

然后回到zeppelin页面，用鼠标点击右上角的“anonymous”，在弹出的下拉列表中选择“Interpreter”。

你将进入如下页面，然后点击右上角的“+Create”按钮。

接着，便进入了解释器的新建页面，如下图：

填入Interpreter的名称和分组，分别是“odps”和“jdbc”。

然后增减并修改配置如下：

其中 default.user 和 default.password 分别是你在MaxCompute对应的 accessID 和 accessKey 。而 default.url 则是对应的MaxCompute JDBC的URL，请注意替换其中的project名，此处笔者使用的是odpsdemo。

而Dependencies处的artifact填写之前下载的odps-jdbc-1.9-jar-with-dependencies.jar的本地路径。

完成配置后保存并重启该名为odps的Interpreter。

新建notebook

现在，你便可以新建notebook来测试该Interpreter了。

用鼠标点击上方的“Notebook”按钮，并选择“+Create new note”，如下图所示：

为新note命名为“odps_jdbc”,如下图：

在新的note页面点击右上角的“齿轮”按钮，完成note与新Interpreter的绑定，如下图所示：

将名为“odps”的Interpreter选中并拖拽到顶部，作为默认的Interpreter使用。

保存后，即可在note中输入符合MaxCompute SQL语法的SQL，点击运行按钮完成数据查询：

实现数据可视化

Zeppelin提供了非常丰富且简单的可视化功能，点击如下图中的可视化选项，完成简单的setting配置，即可看到不同种类的可视化图表了：

欢迎加入MaxCompute钉钉群讨论

03ea92a4c1fbb04d443ff8f015c957815055111e

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

原来MaxCompute还能这么玩系列（1）—— 通过Apache Zeppelin 快速实现数据可视化

Zeppelin简介

部署Zeppelin

配置新的Interpreter

新建notebook

实现数据可视化

大数据计算 MaxCompute

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

原来MaxCompute还能这么玩系列（1）—— 通过Apache Zeppelin 快速实现数据可视化

Zeppelin简介

部署Zeppelin

配置新的Interpreter

新建notebook

实现数据可视化

大数据计算 MaxCompute

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像