【Spark Summit East 2017】不再有“Sbt Assembly”了：使用CueSheet反思Spark Summit-阿里云开发者社区

【Spark Summit East 2017】不再有“Sbt Assembly”了：使用CueSheet反思Spark Summit

2017-02-19 2051

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Jong Wook Kim在Spark Summit East 2017上的演讲，主要介绍了CueSheet，一个围绕着Spark构建的开源框架，能够对于Spark应用程序的开发进行加速。CueSheet无需打开终端就可以对于Spark应用进行打包、提交和部署，并且可以帮助开发者方便地进行编程和调试。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Jong Wook Kim在Spark Summit East 2017上的演讲，主要介绍了CueSheet，一个围绕着Spark构建的开源框架，能够对于Spark应用程序的开发进行加速。

在Spark应用的开发中至关重要，但是并不是很有趣的一部分就是对应用进行打包，尽管有很多像Zeppelin 以及Databricks这样的笔记本式的交互环境，但是对于存在很多严重依赖的正式项目而言，经常存在将Spark项目作为单独的Scala版控制树进行管理。为了应对这些，官方文档告诉我们使用SBT或Maven插件组装的胖jar包并且运行spark-submit脚本，但是这将明显减慢开发周期。CueSheet无需打开终端就可以对于Spark应用进行打包、提交和部署，并且可以帮助开发者方便地进行编程和调试。

76e4d564e997796c316fb8397927872565859587