备案控制台登录注册

开发者社区数据库文章正文

Hive之 hive架构

2017-11-12 2229

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Hive架构图

主要分为以下几个部分：

用户接口，包括命令行CLI，Client，Web界面WUI，JDBC/ODBC接口等
中间件：包括thrift接口和JDBC/ODBC的服务端，用于整合Hive和其他程序。
元数据metadata存储，通常是存储在关系数据库如 mysql, derby 中的系统参数
底层驱动：包括HiveQL解释器、编译器、优化器、执行器（引擎）。
Hadoop：用 HDFS 进行存储，利用 MapReduce 进行计算。

用户接口主要有三个：CLI，Client 和 WUI。其中最常用的是 CLI，Cli 启动的时候，会同时启动一个 Hive 副本。Client 是 Hive 的客户端，用户连接至 Hive Server。在启动 Client 模式的时候，需要指出 Hive Server 所在节点，并且在该节点启动 Hive Server。 WUI 是通过浏览器访问 Hive。
Hive 将元数据存储在数据库中，如 mysql、derby。Hive 中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等。
解释器、编译器、优化器完成 HQL 查询语句从词法分析、语法分析、编译生成执行计划、优化以及生成最佳执行计划。生成的查询计划存储在 HDFS 中，并在随后有 MapReduce 调用执行。
Hive 的数据存储在 HDFS 中，大部分的查询由 MapReduce 完成（包含 * 的查询，比如 select * from tbl 不会生成MapRedcue 任务）。

本文转自张冲andy 博客园博客，原文链接： http://www.cnblogs.com/andy6/p/7545019.html ，如需转载请自行联系原作者

文章标签：

SQL

HIVE

关系型数据库

数据库

存储

Java

MySQL

中间件

数据库连接

编译器

关键词：

Hive架构

架构hive

技术小美

+关注

目录

打赏

0

0

0

0

101

相关文章

syst1_m

|

SQL 存储 Java

Hive基础架构

Hive基础架构

syst1_m

104 0 0

热烈的马

|

11月前

|

SQL 存储分布式计算

【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍（图文解释超详细）

【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍（图文解释超详细）

热烈的马

1395 0 0

赵渝强老师

|

5月前

|

SQL 分布式计算 Java

【赵渝强老师】Hive的体系架构

Hive是基于Hadoop的数据仓库平台，提供SQL-like的HQL语言进行数据分析，无需编写复杂的Java代码。Hive支持丰富的数据模型，可将SQL语句转换为MapReduce任务在Yarn上运行，底层依赖HDFS存储数据。Hive可通过CLI、JDBC和Web界面执行SQL查询。

赵渝强老师

229 2 2

武子康

|

6月前

|

SQL 分布式计算 Hadoop

Hadoop-12-Hive 基本介绍下载安装配置 MariaDB安装 3台云服务Hadoop集群架构图对比SQL HQL

Hadoop-12-Hive 基本介绍下载安装配置 MariaDB安装 3台云服务Hadoop集群架构图对比SQL HQL

武子康

180 3 3

你都不懂

|

9月前

|

SQL 分布式计算关系型数据库

Hadoop-12-Hive 基本介绍下载安装配置 MariaDB安装 3台云服务Hadoop集群架构图对比SQL HQL

Hadoop-12-Hive 基本介绍下载安装配置 MariaDB安装 3台云服务Hadoop集群架构图对比SQL HQL

你都不懂

117 2 2

yuanzhengme

|

11月前

|

SQL 存储分布式计算

Hive【基础 01】核心概念+体系架构+数据类型+内容格式+存储格式+内外部表（部分图片来源于网络）

【4月更文挑战第6天】Hive【基础 01】核心概念+体系架构+数据类型+内容格式+存储格式+内外部表（部分图片来源于网络）

yuanzhengme

196 1 1

阿甘兄

|

SQL 存储 Java

45 Hive架构

阿甘兄

52 0 0

安然AR

|

SQL 存储大数据

关于数据仓库的Hive的Hive架构的MetaStore元数据服务

随着大数据技术的不断发展，数据仓库成为了企业中不可或缺的一部分。而Hive作为一种开源的数据仓库系统，因其易于使用和高效处理等特点，成为了许多企业的首选。然而，对于普通用户来说，直接使用Hive的命令行工具进行操作并不方便。因此，开发者社区中涌现出了大量的Hive GUI工具，其中最为流行的就是Web GUI工具。

安然AR

360 2 4

安然AR

|

SQL Java 大数据

关于数据仓库的Hive的Hive架构的用户接口的JDBC/ODBC

随着大数据技术的不断发展，数据仓库成为了企业中不可或缺的一部分。而Hive作为一种开源的数据仓库系统，因其易于使用和高效处理等特点，成为了许多企业的首选。然而，对于普通用户来说，直接使用Hive的命令行工具进行操作并不方便。因此，开发者社区中涌现出了大量的Hive GUI工具，其中最为流行的就是Web GUI工具。

安然AR

394 1 1

安然AR

|

SQL 存储分布式计算

关于数据仓库的Hive的Hive架构的beeline

数据仓库是一个面向分析的数据存储系统，其中包含了大量的历史数据，可以用于数据分析和报表生成。

安然AR

334 0 0

热门文章

最新文章

如何打造出一个安全的架构 —— 一位来自阿里云资深架构师的实践经验分享

阿里云资深架构师经验分享——DevSecOps最佳实践

阿里开源多模态全能王 Qwen2.5-Omni：创新Thinker-Talker架构，全面超越Gemini-1.5-Pro等竞品

英伟达新一代GPU架构（50系列显卡）PyTorch兼容性解决方案

AI部署架构：A100、H100、A800、H800、H20的差异以及如何选型？开发、测试、生产环境如何进行AI大模型部署架构？

鸿蒙OS架构设计探秘：从分层设计到多端部署

如何成为企业级大模型架构师?

RocketMQ原理—5.高可用+高并发+高性能架构

阿里云SLB深度解析：从流量分发到架构优化的技术实践

JeecgBoot架构图 ● 技术架构图 ● 系统架构图

【YashanDB知识库】DataX迁移Hive到崖山分布式

【YashanDB知识库】Hive 命令工具insert崖山数据库报错

【YashanDB 知识库】Hive 命令工具 insert 崖山数据库报错

【YashanDB知识库】hive初始化崖山报错YAS-04209

【YashanDB知识库】hive初始化崖山报错YAS-04209

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

seatunnel配置mysql2hive

如何在IDE中通过Spark操作Hive

基于云服务器的数仓搭建-hive/spark安装

hive聚合函数多行合并

相关课程

更多

架构的演进

MySQL企业常见架构与调优经验分享

企业Web常用架构LAMP-LNMP实战

企业级互联网分布式系统应用架构学习

大数据Hive教程精讲

高校精品课-上海交通大学 -企业级应用体系架构

相关电子书

更多

MaxCompute架构升级及开放性解读

MaxCompute Serverless 架构演进

阿里云消息队列的 Serverless架构演进

相关实验场景

更多

每个IT人都想学的“Web应用上云经典架构”实战

MySQL引擎及架构优化

基于数据湖架构的网站访问行为分析

使用SLB+2ECS+NAS，部署电商web网站的高可用架构

使用EDA架构部署在线外卖订单系统

部署高可用架构

下一篇

阿里云对象存储OSS存放视频及费用说明（存储费+流量费）

你好，我是AI助理

可以解答问题、推荐解决方案等