在Docker上建立多节点的Hadoop集群

简介:

现在我们提高门槛,在Docker上创建一个多点hadoop集群。在开始前,确保你有最新的Ambari镜像:

 
  1. docker pull sequenceiq/ambari:latest 

一行命令

一旦你得到了最新的镜像,你就可以启动Docker容器。我们已经创建了几个shell 函数来帮你输入Docker命令,从而避免输入像docker run [options] image [command]这样冗长的命令。

有了这些功能,创建3个节点的hadoop簇,只需要下面一行代码搞定:

 
  1. curl -Lo .amb j.mp/docker-ambari && . .amb && amb-deploy-cluster 

默认参数值都是可以根据需要更改的,像是blueprint,簇大小,等等 … 在shellj.mp/docker-ambari功能函数的头文件有参数列表.

它是按照下面步骤来实现的:

  • 在Docker (后台运行) 容器的守护进程上运行sambari-server start (记得还有 anambari-agent start)

  • 运行sn-1 守护进程容器并用ambari-agent start连接到服务器

  • 运行AmbariShell 以及其终端控制台 (监控子进程)

    • AmbariShell 会把内置的多节点blueprint发送至 /api/v1/blueprintsREST API

    • AmbariShell 依照blueprint的设置自动分配宿主信息

    • 通过发送至/api/v1/clustersREST API的内容创建簇

自定义

如果你有自己定义好的脚本,可以放在 gist然后运行 AmbariShell. 先启动 AmbariShell:

 
  1. amb-start-cluster 2  
  2. amb-shell 

AmbariShell启动的前提:

  • Ambari REST API 将帮助你建立多个hadoop端.

 
  
  1. host list  
  2. blueprint add --url https://gist.githubusercontent.com/lalyos/xxx/raw/custum-blueprint.json  
  3. cluster build --blueprint custom-blueprint  
  4. cluster assign --hostGroup host_group_1 --host amb0.mycorp.kom  
  5. cluster assign --hostGroup host_group_2 --host amb1.mycorp.kom  
  6. cluster assign --hostGroup host_group_2 --host amb1.mycorp.kom  
  7. cluster create 

AmbariShell 的 hint命令能帮助开发人员实现自动补全等功能.

自动补全包括:

  • 补全命令行 (例如,没有这个帮助下 cluster命令是不可用的)

  • 添加需要的参数

  • 添加备选参数: --后加上<TAB>

  • 添加变参,像是参数名,宿主名等等 …

总结

基本上我们开始使用Docker的时候就已经使用多端的hadoop功能了 – 笔记本上运行3到4簇面临的极限问题比 Sandbox VM少得多.

我们使用了docker的模式简化了hadoop的使用模式 – 可以在 LinkedIn找到我们关于Cloudbreak的最新进展 – 开源云端的Hadoop as a Service API应用并构建在 docker上.


本文作者:佚名

来源:51CTO

相关文章
|
1月前
|
存储 分布式计算 资源调度
Hadoop【环境搭建 04】【hadoop-2.6.0-cdh5.15.2.tar.gz 基于ZooKeeper搭建高可用集群】(部分图片来源于网络)
【4月更文挑战第1天】Hadoop【环境搭建 04】【hadoop-2.6.0-cdh5.15.2.tar.gz 基于ZooKeeper搭建高可用集群】(部分图片来源于网络)
54 3
|
4天前
|
监控 Docker 容器
【Docker 专栏】Docker Swarm 集群的扩展与缩容策略
【5月更文挑战第8天】本文探讨了Docker Swarm集群的扩展与缩容策略。集群扩展可提高性能、增强可用性和适应业务发展,可通过手动或自动方式实现。缩容则需考虑业务需求、资源利用率和节点状态,可手动或按策略执行。关键步骤包括添加/移除节点及任务迁移。注意数据同步、监控评估和测试验证。案例分析和总结强调了灵活管理对保持集群最佳状态的重要性。
【Docker 专栏】Docker Swarm 集群的扩展与缩容策略
|
17天前
|
算法 Nacos Docker
docker部署nacos集群
docker部署nacos集群
26 0
|
17天前
|
NoSQL Redis Docker
使用Docker搭建Redis主从集群
使用Docker搭建Redis主从集群
32 1
|
18天前
|
分布式计算 监控 Hadoop
Ganglia监控Hadoop与HBase集群
Ganglia监控Hadoop与HBase集群
|
23天前
|
存储 Kubernetes Docker
构建高效稳定的Docker容器集群:从原理到实践
【4月更文挑战第19天】 在当今微服务架构盛行的时代,容器化技术已经成为了软件开发和部署的标准实践。本文深入探讨了如何利用Docker容器技术,结合Kubernetes集群管理工具,构建一个高效、稳定且可扩展的容器化环境。文章首先简述了Docker的核心原理及其优势,接着详细阐述了Kubernetes的基本概念与组件,最后通过一个实际案例来指导读者如何从零开始搭建并优化一个基于Docker和Kubernetes的容器集群系统。
23 1
|
24天前
|
存储 分布式计算 Hadoop
Hadoop集群搭建
Hadoop集群搭建
|
24天前
|
分布式计算 负载均衡 Hadoop
Hadoop集群节点添加
Hadoop集群节点添加
|
24天前
|
存储 分布式计算 Hadoop
Hadoop集群规模扩展
【4月更文挑战第14天】Hadoop集群扩展可通过添加更多节点、垂直扩展(增强单节点资源)和水平扩展(增加节点数量)来实现。关键点包括规划扩展策略、确保集群稳定性和优化配置。注意在扩展过程中要保证数据完整性,并根据需求调整以提升集群性能和效率。
22 1
|
28天前
|
分布式计算 资源调度 Hadoop
Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】(图片来源于网络)(hadoop fs + hadoop dfs + hdfs dfs 使用举例)
【4月更文挑战第5天】Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)Hadoop【基础知识 04】【HDFS常用shell命令】(hadoop fs + hadoop dfs + hdfs dfs 使用举例)
54 9