Hive初认识(2)

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

配置hive首先需要安装在hadoop主节点的linux上
需要注意的需要同时安装MYSQL
对于hive安装呢 唯一要注意的就是配置site.xml文件
配置参数 通用的首先就是


javax.jdo.option.ConnectionURL

<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://127.0.0.1:3306/hive?createDatabaseIfNotExist=true</value>
<description>JDBC connect string for a JDBC metastore</description>

java.jdo.option.ConnectionDriverName

<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>Driver class name for a JDBC metastore</description>

java.jdo.ConnectionUserName

<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
<description>Username to use against metastore database</description>

java.jdo.ConnectionPassword

<name>javax.jdo.option.ConnectionPassword</name>
<value>sa</value>
<description>password to use against metastore database</description>

hive.exec.local.scratchdir

<name>hive.exec.local.scratchdir</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp</value>
<description>Local scratch space for Hive jobs</description>

hive.downloaded.resources.dir

<name>hive.downloaded.resources.dir</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp/resources</value>
<description>Temporary local directory for added resources in the remote file system.</description>

hive.querylog.location

<name>hive.querylog.location</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp</value>
<description>Location of Hive run time structured log file</description>

hive.server2.logging.operation.log.location

<name>hive.server2.logging.operation.log.location</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp/operation_logs</value>
<description>Top level directory where operation logs are stored if logging functionality is enabled</description>

配置完后,使用
schematool -initSchema -daType mysql

最后运行即可
如果报错 可能星有两个hive的site.xml信息配置出错
不然就是mysql有问题

关于hive的使用
确保集群开启
运行 hiveserver2
重新打开一个命令窗口
运行beeline
当出现
beeline>则表示运行成功
然后输入!connect jdbc:hive2://localhost:10000
会出现让你输入user和password 当输入完成后 则
会变成
0 : jdbc:hive://localhost:10000>

官网文档为
image
当然你也可以指定链接参数在命令行它的意思就是可以找到你在unix shell命令的历史记录的字符串(所以第一次登录个估计不行吧)
image

登录进入后
可以执行一些读写操作

比如讲hdfs上的文档写入到数据库中
创建数据库
create database test;
使用 数据库
use test;
创建table
create table docs(line string);
讲HDFS系统上的README.txt 文件写入到docs 表中 以字符串的形式
load data inpath '/reversetext/README.txt' overwrite into table docs;

接下来做一个简单的单词计数
操作为
select explode (split(line,'\s')) from docs;
意思为讲字符串参数 line 用空格分割开来
展示效果为 所有单个单词
接下来聚合单词 讲上条sql作为子令
select word,count(*) from (select explode(split(line,'\s'))as word from docs)a group by word;

这样的展示并未输出写入到hive数据库中或者hdfs中
我们可以通过 下面这条指令 将结果写到table表格中
create table wc_result as select word,count(*) as wccount from (select explode (split(line,'\s'))as word from docs)a group by word;

这条语句中 我们是通过创建table表名为wc_result 将上面的聚合结果当做输入写入到wc_result中 你可以发现 在这个创建的table中没有指定字段.
所以说 hive中是可以不用指定字段,但是问题在于table如何创建的.

运用hive必须会数据语言
DDL 数据定义语言 创建删除表数据库 更改表结构
DML 数据操作语言 对表的增删改查
DQL 数据查询语言 Select ..
DCL 数据库控制语言 grant priliages on , create user..

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
5月前
|
SQL 存储 分布式计算
hive解决了什么问题
hive解决了什么问题
41 0
|
7月前
|
SQL Java 数据库连接
|
9月前
|
SQL 存储 分布式计算
HIVE初识
什么是HiveHive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载,可以简称为ETL。
58 1
|
10月前
|
SQL 存储 分布式计算
Hive小结1
Hive小结
71 1
|
10月前
|
SQL 存储 分布式计算
Hive小结2
Hive小结2
94 0
|
11月前
|
SQL 分布式计算 大数据
Hive 到底有什么用?
MapReduce简化大数据编程难度,但对经常需大数据计算的人,如从事研究BI的数据分析师,他们通常使用SQL进行大数据分析和统计,MapReduce编程还是有门槛。且若每次统计和分析都开发相应MapReduce程序,成本确实太高。
77 0
Hive中not in的正确使用
Hive中not in的正确使用
Hive中not in的正确使用
|
SQL 存储 分布式计算
【Hive】(一)Hive 入门
【Hive】(一)Hive 入门
304 0
【Hive】(一)Hive 入门
|
SQL 存储 数据采集
【Hive】(七)Hive 查询使用详解2
【Hive】(七)Hive 查询使用详解2
168 0
【Hive】(七)Hive 查询使用详解2
|
SQL 存储 分布式计算
【Hive】(七)Hive 查询使用详解1
【Hive】(七)Hive 查询使用详解1
296 0
【Hive】(七)Hive 查询使用详解1