《Hadoop海量数据处理:技术详解与项目实战(第2版)》一2.5 安装HBase

  1. 云栖社区>
  2. 博客>
  3. 正文

《Hadoop海量数据处理:技术详解与项目实战(第2版)》一2.5 安装HBase

异步社区 2017-05-02 09:36:00 浏览1295
展开阅读全文

本节书摘来异步社区《Hadoop海量数据处理:技术详解与项目实战(第2版)》一书中的第2章,第2.5节,作者: 范东来 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.5 安装HBase

本节将讲解如何安装HBase。HBase是基于HDFS的,所以在安装HBase之前,要确保安装好了Hadoop。另外,HBase也和Hadoop一样,分为完全分布模式和伪分布模式,下面将分别进行介绍。

2.5.1 解压文件并修改Zookeeper相关配置

将/opt/ hbase-1.0.0-cdh5.6.0.tar解压,执行命令:

tar -zxvf /opt/hbase-1.0.0-cdh5.6.0.tar.gz

打开hbase-site.xml:

vi /opt/hbase-1.0.0-cdh5.6.0/conf/hbase-site.xml

修改hbase-site.xml文件,添加如下配置:

export JAVA_HOME=/opt/jdk1.7.0_80
export HBASE_MANAGES_ZK=true

并注释掉其余与Zookeeper相关的配置,这样做的原因是HBase使用自带的Zookeeper,而不使用单独的Zookeeper集群。

2.5.2 配置节点

修改regionservers文件,执行命令:

vi /opt/hbase-1.0.0-cdh5.6.0/conf/regionservers

如果是完全分布模式,则regionservers为:

slave1
slave2
…

如果是伪分布模式,则regionservers为:

slave1

接下来,需要配置hbase-site.xml,将配置文件修改为:

<configuration>
  <property>
   <name>hbase.rootdir</name>
   <value>hdfs://master:9000/hbase</value>
  </property>
   <name>hbase.cluster.distributed</name>
   <value>true</value>
  <property>
  </property>
</configuration>

第一个配置指的是HBase在HDFS上的存储目录,第二个是指定HBase的运行模式为完全分布模式,如果是伪分布模式,该配置为false。配置完成后,将文件分发至相应节点(regionservers文件里的节点)。

2.5.3 配置环境变量

在regionservers所示的节点上,配置如下环境变量:

export HBASE_HOME=/opt/hbase-1.0.0-cdh5.6.0
export PATH=$HBASE_HOME/bin:$PATH
使环境变量立即生效:

source /etc/profile

2.5.4 启动并验证

下面的工作就是启动并验证了,首先赋予脚本可执行权限,再执行:

chmod +x /opt/hbase-1.0.0-cdh5.6.0/bin/start-hbase.sh
.//opt/hbase-1.0.0-cdh5.6.0/bin/start-hbase.sh

启动完成后,在执行命令的节点用jps命令查看发现以下进程,说明启动成功:

HMaster
HRegionServer
HQuorumpeer

其中,Hmaster是HBase的配置节点,默认会在执行tart-hbase.sh脚本的节点启动,HregionServer根据regionservers文件中的节点启动,HQuorumpeer是Zookeeper的进程。

验证的步骤很简单,首先执行

hbase shell

进入HBase命令行,接着执行

hbase(main):001:0> create 'testtable', 'colfaml'

如果没有报错即安装成功。

需要注意的是,安装完HBase,需要采用NTP时间同步服务使各节点时间一致,否则误差到了一定时间,HBase会启动失败。

网友评论

登录后评论
0/500
评论