Hive部署

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

什么是 Hive
        Hive 是一个翻译器,它可以将SQL语句翻译成一个 MapReduce 程序
        
        常见的数据分析引擎: Hive, Pig,  Impala,  Spark SQL
        Hive 是一个基于Hadoop 之上的数据分析引擎(数据仓库)

        Hives               HDFS
         表      --------> 目录
        数据    --------> 文件
        分区    --------> 目录


环境部署:

    部署前准备:

    环境变量:vi ~/.bash_profile
        HIVE_HOME=/root/training/apache-hive-2.3.0-bin
        export HIVE_HOME

        PATH=$HIVE_HOME/bin:$PATH
        export PATH


     嵌入式部署:
        (1)使用Hive自带的Derby数据库来存储元信息
        (2)Hive只支持一个连接
             创建 conf/hive-site.xml
                <?xml version="1.0" encoding="UTF-8" standalone="no"?>
                <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
                <configuration>             
                    <property>
                      <name>javax.jdo.option.ConnectionURL</name>
                      <value>jdbc:derby:;databaseName=metastore_db;create=true</value>
                    </property>    

                    <property>
                      <name>javax.jdo.option.ConnectionDriverName</name>
                      <value>org.apache.derby.jdbc.EmbeddedDriver</value>
                    </property>    

                    <property>
                      <name>hive.metastore.local</name>
                      <value>true</value>
                    </property>    

                    <property>
                      <name>hive.metastore.warehouse.dir</name>
                      <value>file:///root/training/apache-hive-2.3.0-bin/warehouse</value>
                    </property>        
                </configuration>    

            初始化MetaStore:
            schematool -dbType derby -initSchema



     远程模式(需要MySQL数据库):

            1. 安装 MySQL数据库(此处省略)

            2. 配置 hive-site.xml  (JDBC的参数)

                <?xml version="1.0" encoding="UTF-8" standalone="no"?>
                <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
                <configuration>             
                    <property>
                      <name>javax.jdo.option.ConnectionURL</name>
                      <value>jdbc:mysql://localhost:3306/hive?useSSL=false</value>
                    </property>    

                    <property>
                      <name>javax.jdo.option.ConnectionDriverName</name>
                      <value>com.mysql.jdbc.Driver</value>
                    </property>    
                    
                    <property>
                      <name>javax.jdo.option.ConnectionUserName</name>
                      <value>hiveowner</value>
                    </property>    
                    
                    <property>
                      <name>javax.jdo.option.ConnectionPassword</name>
                      <value>Welcome_1</value>
                    </property>    
                    
                </configuration>

            3. 把MySQL 数据库的驱动放到: Hive/lib 下

            4. 初始化 MySQL数据库

                老版本的hive 在第一次运行时自动初始化 MySQL数据库

                新版本的hive 需要执行命令:

                    schematool   -dbType  mysql  -initSchema

本文转自   tianshuai369   51CTO博客,原文链接:http://blog.51cto.com/songqinglong/2055914


相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
21天前
|
SQL 分布式计算 Java
bigdata-17-Hive部署与Hive基础
bigdata-17-Hive部署与Hive基础
35 0
|
5月前
|
SQL 分布式计算 Hadoop
Hive部署
Hive部署
70 0
|
2月前
|
SQL 消息中间件 Kafka
Flink部署问题之hive表没有数据如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
|
6月前
|
SQL 分布式计算 关系型数据库
hadoop搭建、mysql、hive部署(三)
hadoop搭建、mysql、hive部署
82 0
hadoop搭建、mysql、hive部署(三)
|
6月前
|
SQL 分布式计算 关系型数据库
hadoop搭建、mysql、hive部署(二)
hadoop搭建、mysql、hive部署
55 0
|
6月前
|
SQL 分布式计算 Hadoop
hadoop搭建、mysql、hive部署(一)
hadoop搭建、mysql、hive部署
96 0
|
11月前
|
SQL 存储 分布式计算
工良出品:包教会,Hadoop、Hive 搭建部署简易教程
导读 Hadoop、Hive 是什么 运行环境 Java 环境 Mysql 下载 Hadoop、Hive 和 驱动 安装 Hadoop core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml hadoop-env.cmd 启动 Hadoop 安装 Hive 配置 Hive hive-env.sh hive-site.xml 运行 Hive 连接到 Hive
197 0
|
SQL 存储 分布式计算
大数据技术基础实验九:Hive实验——部署Hive
大数据技术基础实验九,了解有关Hive的知识和学习如何在虚拟机上部署Hive并启动Hive。
303 0
大数据技术基础实验九:Hive实验——部署Hive
|
SQL 分布式计算 关系型数据库
|
SQL 大数据 HIVE