LinkedIn开源Dr. Elephant

简介:

今天LinkedIn宣布开源Dr. Elephant,Dr. Elephant能够很好的帮助用户理解、分析和优化Hadoop和Spark的工作流。LinkedIn在去年第八届Hadoop Summit上第一次在社区呈现。

动机

Hadoop是一个分布式数据存储和大数据处理框架,体量大、组件复杂,因而每个组件的性能优化就显得异常重要。在优化底层硬件资源,网络架构,OS和其它堆栈的同时,也需要对集群上运行的任务进行优化。

什么是Dr. Elephant?

Dr. Elephant是一个Hadoop 和Spark的性能监控和调优工具。Dr. Elephant能自动化收集所有指标,进行数据分析,并以简单易用的方式进行呈现。Dr. Elephant的目标是提高开发人员的开发效率和增加集群任务调试的高效性。Dr. Elephant支持对Hadoop和Spark任务进行可插拔式、配置化以及基于规则的启发式job性能分析,并且根据分析结果给出合适的建议来指导如何调优使任务更有效率。

为什么选择Dr. Elephant?

其它开源或者商用Hadoop优化工具都是收集系统资源指标和监控集群资源信息,关注点仅在于简化Hadoop集群的发布和管理,而很少有工具是来帮助Hadoop优化任务流。这些工具不支持Hadoop集群的规模化和Hadoop框架的增长,而Dr. Elephant支持Hadoop生态的各种框架,并且很容易的扩展到新的框架,已经支持Spark。Dr. Elephant让用户更清晰的掌握Hadoop和Spark原理,并帮助其轻松的优化任务。

Dr. Elephant如何工作?

Dr. Elephant从YARN Resource Manager周期性获取所有最近运行成功和失败的应用列表,然后从Job History Server中攫取每个应用的元数据,包括job counters、任务配置和任务数据。有了元数据后,Dr. Elephant进行启发式分析,并生成每个任务的诊断报告,从而进行相应的整体优化。Dr. Elephant将会标记出五个等级问题严重性,指出潜在的性能问题。

20160418121553412.jpg

  图1 Dr. Elephant问题等级

20160418121556253.jpg

  图2 Dr. Elephant的面板

通过Dr. Elephant的UI查看数据面板,见图2,这里显示集群的相关统计信息,包括集群上运行的任务数,需要优化的任务数,以及基于启发式分析发现的严重任务数。图中是最近24小时的Dr. Elephant分析的所有最近的任务。

20160418121557201.jpg

  图3 Dr. Elephant的搜索页

Dr. Elephant提供一个搜索功能,帮助用户通过任务ID/应用ID,执行ID,任务类型,任务严重程度和任务完成时间等来搜索任务。

20160418121557483.jpg

  图4 Dr. Elephant任务页面

当你点击指定的搜索结果,会显示完整的任务信息,并能查看相互引用的任务流。

20160418121558435.jpg

  图5 Dr. Elephant的工作流历史

20160418121558269.jpg

  图6 Dr. Elephant的任务历史

Dr. Elephant的任务历史和工作流历史可以帮用户比较前后执行的区别。Dr. Elephant通过启发式计算出每个任务执行的性能得分并作图。这个图表可以帮助用户很直观的分析哪个性能好。

家庭医生

Dr. Elephant在LinkedIn非常受欢迎,大家钟爱其简洁性。Dr. Elephant通过简单的诊断可以解决百分之八十的问题。Dr. Elephant提供任务级别的建议帮助用户去理解和优化Hadoop工作流。

Dr. Elephant已经完全和Hadoop生态整合。在LinkedIn,开发人员使用Dr. Elephant作为开发流程的一部分,线上任务强制达到绿色级别。



本文转自d1net(转载)

相关文章
|
11月前
|
数据建模
白话Elasticsearch55-数据建模之对每个用户发表的博客进行分组 (Top Hits Aggregation)
白话Elasticsearch55-数据建模之对每个用户发表的博客进行分组 (Top Hits Aggregation)
58 0
|
11月前
|
存储 移动开发 前端开发
闲鱼技术2022年度白皮书-KUN主题-大终端领域的新物种-KUN(下)
闲鱼技术2022年度白皮书-KUN主题-大终端领域的新物种-KUN
119 0
|
11月前
|
开发框架 前端开发 JavaScript
闲鱼技术2022年度白皮书-KUN主题-大终端领域的新物种-KUN(上)
闲鱼技术2022年度白皮书-KUN主题-大终端领域的新物种-KUN
249 0
闲鱼技术2022年度白皮书-KUN主题-大终端领域的新物种-KUN(上)
|
11月前
|
Web App开发 移动开发 Dart
闲鱼技术2022年度白皮书-KUN主题-大终端领域的新物种-KUN(中)
闲鱼技术2022年度白皮书-KUN主题-大终端领域的新物种-KUN
186 0
|
11月前
|
存储 编解码 人工智能
Github 3k+!南科大 VIP Lab 近期开源 Track-Anything | SAM + VOS: 一键视频标注
Github 3k+!南科大 VIP Lab 近期开源 Track-Anything | SAM + VOS: 一键视频标注
395 0
|
存储 缓存 NoSQL
社交网络场景下大规模图存储实践——Facebook TAO
社交网络场景下大规模图存储实践——Facebook TAO
156 0
社交网络场景下大规模图存储实践——Facebook TAO
|
Apache 流计算
《Flink Forward Virtual Conference - April 2020 - Cloudera CDF Keynote》电子版地址
Apache Flink - Completing Cloudera's End-to-End Streaming Platform
60 0
《Flink Forward Virtual Conference - April 2020 - Cloudera CDF Keynote》电子版地址
|
Unix 程序员 Shell
Vim 诞生 30 周年:作者 Bram Moolenaar 、开发者 Alex Baldwin 分别撰文庆祝
Vim 诞生 30 周年:作者 Bram Moolenaar 、开发者 Alex Baldwin 分别撰文庆祝
229 0
Vim 诞生 30 周年:作者 Bram Moolenaar 、开发者 Alex Baldwin 分别撰文庆祝
|
前端开发 .NET C#
一起谈.NET技术,WCF+WF双剑合璧构建微软的SOA系列(一):从一个简单的Demo开始
  本系列文章将从实例出发,以实例结尾。由浅入深讲解在我们项目中如何使用WCF和WF。我们会发现使用WCF+WF将造就出其他技术无法达到的高度。最后我会将程序架到云端。   微软.net的3W(WPF、WCF、WF)战略如下图。
1220 0

热门文章

最新文章