《Hadoop海量数据处理：技术详解与项目实战（第2版）》一2.4　安装Hive-阿里云开发者社区

《Hadoop海量数据处理：技术详解与项目实战（第2版）》一2.4　安装Hive

2017-05-02 1877

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS MySQL，集群系列 2核4GB

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，高可用系列 2核4GB

简介：

本节书摘来异步社区《Hadoop海量数据处理：技术详解与项目实战（第2版）》一书中的第2章，第2.4节，作者：范东来责编：杨海玲，更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.4　安装Hive

在这一节，我们将进行Hive的安装。与安装Hadoop相比，Hive的安装非常简单，并且有些工作已经在安装Hadoop的时候完成，例如JDK的安装。并且Hive作为Hadoop的一个客户端，运行方式并不分为单机模式、伪分布模式、完全分布模式，所以不管读者在上一节选择伪分布模式或者完全分布模式安装Hadoop，安装Hive的方式只有一种。

安装Hive的步骤分为以下两步。

（1）安装元数据库。

（2）修改Hive配置文件。

由于Hadoop选择的Cloudera的CDH5版本，为了不出现兼容性的问题，Hive也选择CDH5的版本，完整的版本号为hive-1.1.0-cdh5.6.0。不管读者采用伪分布模式还是完全分布模式安装Hadoop，Hive可以被安装至集群任意一个节点（以主节点为例）。

2.4.1　安装元数据库

Hive的元数据和数据是分开存放的，数据存放在HDFS上，而元数据默认是存在Hive自带的Derby数据库，但由于Derby只支持同时一个用户访问Hive，所以不推荐使用。我们将使用MySQL作为Hive的元数据库。执行以下命令（以root用户在主节点执行）。

安装MySQL客户端：

yum install mysql

        
          
        
        
        
          
          AI 代码解读

安装MySQL服务器端：

yum install mysql-server
yum install mysql-devel

        
          
        
        
        
          
          AI 代码解读

查看MySQL状态、启动及停止：

service mysqld status
service mysqld start
service mysqld stop

        
          
        
        
        
          
          AI 代码解读

启动MySQL服务后，以root用户登录MySQL执行命令：

mysql -u root -p

        
          
        
        
        
          
          AI 代码解读

创建数据库hive，用来保存Hive元数据：

create database hive;

        
          
        
        
        
          
          AI 代码解读

使hadoop（操作系统用户）用户可以操作数据库hive中的所有表：

GRANT all ON hive.* TO hadoop@'master' IDENTIFIED BY 'hivepwd';
flush privileges;

        
          
        
        
        
          
          AI 代码解读

这样，Hive的元数据库就安装完成。

2.4.2　修改Hive配置文件

先将Hive的安装文件解压，将Hive的安装包移至/opt下，以hadoop用户在master执行：

tar -zxvf /opt/hive-1.1.0-cdh5.6.0.tar.gz

        
          
        
        
        
          
          AI 代码解读

和Hadoop相同，Hive的配置文件还是存放在/opt/hive-1.1.0-cdh5.6.0/conf路径下，以hadoop用户创建文件hive-site.xml，添加以下内容：

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
　　 <property>
　　　　　<name>hive.metastore.local</name>
　　　　　<value>true</value>
　　 </property>
　　 <property>
　　　　　<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true</value>
　　 </property>
　　 <property>
　　　　　<name>javax.jdo.option.ConnectionDriverName</name>
　　　　　<value>com.mysql.jdbc.Driver</value>
　　 </property>
　　 <property>
　　　　　<name>javax.jdo.option.ConnectionUserName</name>
　　　　　<value>hadoop</value>
　　 </property>
　　 <property>
　　　　　<name>javax.jdo.option.ConnectionPassword</name>
　　　　　<value>hivepwd</value>
　　 </property>
</configuration>

        
          
        
        
        
          
          AI 代码解读

修改/opt/hive-1.1.0-cdh5.6.0/conf/hive-env.sh文件，以hadoop用户在文件末尾追加：

export JAVA_HOME=/opt/jdk1.7.0_80
export HADOOP_HOME=/opt/hadoop-2.6.0-cdh5.6.0

        
          
        
        
        
          
          AI 代码解读

将MySQL的JDBC驱动jar包移到hive-1.1.0-cdh5.6.0/lib文件夹下，否则Hive不能成功连接MySQL，最后还需配置环境变量，以root用户在/etc/profile文件末尾追加：

export HIVE_HOME=/opt/hive-1.1.0-cdh5.6.0
export PATH=$PATH:$HIVE_HOME/bin

        
          
        
        
        
          
          AI 代码解读

追加后执行命令使环境变量立即生效：

source /etc/profile

        
          
        
        
        
          
          AI 代码解读

2.4.3　验证安装

首先启动Hadoop和MySQL，然后执行：

进入Hive命令行，执行命令，创建一个名为test的表，并查询该表的记录数：

create table test(id int);
select count(*) from test;

        
          
        
        
        
          
          AI 代码解读

如无异常并且结果显示为0，则安装成功。

《Hadoop海量数据处理：技术详解与项目实战（第2版）》一2.4　安装Hive

2.4　安装Hive

2.4.1　安装元数据库

2.4.2　修改Hive配置文件

2.4.3　验证安装

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

《Hadoop海量数据处理：技术详解与项目实战（第2版）》一2.4 安装Hive

2.4 安装Hive

2.4.1 安装元数据库

2.4.2 修改Hive配置文件

2.4.3 验证安装

热门文章

最新文章

相关课程

相关电子书

相关实验场景

《Hadoop海量数据处理：技术详解与项目实战（第2版）》一2.4　安装Hive

2.4　安装Hive

2.4.1　安装元数据库

2.4.2　修改Hive配置文件

2.4.3　验证安装