本节书摘来异步社区《Hadoop海量数据处理:技术详解与项目实战(第2版)》一书中的第2章,第2.5节,作者: 范东来 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。
2.5 安装HBase
本节将讲解如何安装HBase。HBase是基于HDFS的,所以在安装HBase之前,要确保安装好了Hadoop。另外,HBase也和Hadoop一样,分为完全分布模式和伪分布模式,下面将分别进行介绍。
2.5.1 解压文件并修改Zookeeper相关配置
将/opt/ hbase-1.0.0-cdh5.6.0.tar解压,执行命令:
tar -zxvf /opt/hbase-1.0.0-cdh5.6.0.tar.gz
打开hbase-site.xml:
vi /opt/hbase-1.0.0-cdh5.6.0/conf/hbase-site.xml
修改hbase-site.xml文件,添加如下配置:
export JAVA_HOME=/opt/jdk1.7.0_80
export HBASE_MANAGES_ZK=true
并注释掉其余与Zookeeper相关的配置,这样做的原因是HBase使用自带的Zookeeper,而不使用单独的Zookeeper集群。
2.5.2 配置节点
修改regionservers文件,执行命令:
vi /opt/hbase-1.0.0-cdh5.6.0/conf/regionservers
如果是完全分布模式,则regionservers为:
slave1
slave2
…
如果是伪分布模式,则regionservers为:
slave1
接下来,需要配置hbase-site.xml,将配置文件修改为:
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://master:9000/hbase</value>
</property>
<name>hbase.cluster.distributed</name>
<value>true</value>
<property>
</property>
</configuration>
第一个配置指的是HBase在HDFS上的存储目录,第二个是指定HBase的运行模式为完全分布模式,如果是伪分布模式,该配置为false。配置完成后,将文件分发至相应节点(regionservers文件里的节点)。
2.5.3 配置环境变量
在regionservers所示的节点上,配置如下环境变量:
export HBASE_HOME=/opt/hbase-1.0.0-cdh5.6.0
export PATH=$HBASE_HOME/bin:$PATH
使环境变量立即生效:
source /etc/profile
2.5.4 启动并验证
下面的工作就是启动并验证了,首先赋予脚本可执行权限,再执行:
chmod +x /opt/hbase-1.0.0-cdh5.6.0/bin/start-hbase.sh
.//opt/hbase-1.0.0-cdh5.6.0/bin/start-hbase.sh
启动完成后,在执行命令的节点用jps命令查看发现以下进程,说明启动成功:
HMaster
HRegionServer
HQuorumpeer
其中,Hmaster是HBase的配置节点,默认会在执行tart-hbase.sh脚本的节点启动,HregionServer根据regionservers文件中的节点启动,HQuorumpeer是Zookeeper的进程。
验证的步骤很简单,首先执行
hbase shell
进入HBase命令行,接着执行
hbase(main):001:0> create 'testtable', 'colfaml'
如果没有报错即安装成功。
需要注意的是,安装完HBase,需要采用NTP时间同步服务使各节点时间一致,否则误差到了一定时间,HBase会启动失败。