备案控制台登录注册

开发者社区数据库文章正文

Hive hang without response

2017-11-15 1148

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

前些天Hive查询的接口一直超时报警，登录上去查看发现这个超时报警的曲线很有规律，每个小时开始就出现，过了大约3分钟左右就好了.在这个期间里，也发现hive根本就执行不了，完全hang住了，机器负载，HDFS,Jobtracker的负载响应都完全正常！

立刻查看下日志发现几点：

1.对比其他时间的同一个job发现两个时间点的上传job文件到hdfs以及mapreduce的执行时间完全一致，也就是说排除了hdfs,jobtracker的问题

2.出问题时，hive的执行基本阻塞在Initialized ObjectStore部分

那么基本猜想就是MySQL出问题了，查看MySQL的监控日志发现果然每到这个时间点都会出现highsession，找到一个时间点用percona的工具分析了一下slow log发现了最终的元凶：

原来是每个整点都会执行一次backup，但是在backup之前会有一个分析的query也在跑（cron），mysqldump在backup之前会先进行flush table，但是由于那个long running query在导致flush table一直在等待，从而导致后来的所有操作都在waitingfor flushing table.

找到原因就好办了，把备份迁移到从库，另外优化那个long running query,解决.

本文转自MIKE老毕 51CTO博客，原文链接：http://blog.51cto.com/boylook/1367256，如需转载请自行联系原作者

文章标签：

关系型数据库

监控

SQL

HIVE

分布式计算

MySQL

关键词：

Hive hang

科技小先锋

目录

相关文章

科技小先锋

|

SQL 监控 HIVE

Hive动态分区导致的Jobtracker Hang

科技小先锋

1311 0 0

Maynor

|

11月前

|

SQL 数据采集数据挖掘

大数据行业应用之Hive数据分析航班线路相关的各项指标

大数据行业应用之Hive数据分析航班线路相关的各项指标

Maynor

257 1 1

javaedge

|

SQL Java 大数据

Hive实战(03)-深入了解Hive JDBC：在大数据世界中实现数据交互

Hive实战(03)-深入了解Hive JDBC：在大数据世界中实现数据交互

javaedge

705 1 1

Want595

|

SQL 分布式计算大数据

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门

Want595

223 0 0

热烈的马

|

11月前

|

SQL 存储大数据

【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示（附SQL语句）

【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示（附SQL语句）

热烈的马

354 0 0

Want595

|

SQL 存储大数据

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念

Want595

182 0 0

热烈的马

|

11月前

|

SQL 分布式计算数据库

【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战（附源码）

【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战（附源码）

热烈的马

400 0 0

热烈的马

|

11月前

|

SQL 存储分布式计算

【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍（图文解释超详细）

【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍（图文解释超详细）

热烈的马

1391 0 0

武子康

|

6月前

|

SQL 分布式计算 Java

大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源：JSON、CSV、JDBC、Hive

大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源：JSON、CSV、JDBC、Hive

武子康

143 0 0

1941623231718325

|

9月前

|

SQL 分布式计算大数据

大数据处理平台Hive详解

【7月更文挑战第15天】Hive作为基于Hadoop的数据仓库工具，在大数据处理和分析领域发挥着重要作用。通过提供类SQL的查询语言，Hive降低了数据处理的门槛，使得具有SQL背景的开发者可以轻松地处理大规模数据。然而，Hive也存在查询延迟高、表达能力有限等缺点，需要在实际应用中根据具体场景和需求进行选择和优化。

1941623231718325

514 6 6

热门文章

最新文章

【YashanDB知识库】hive初始化崖山报错YAS-04209

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

【YashanDB 知识库】Hive 命令工具 insert 崖山数据库报错

【YashanDB知识库】Hive 命令工具insert崖山数据库报错

【YashanDB知识库】hive初始化崖山报错YAS-04209

【YashanDB知识库】DataX迁移Hive到崖山分布式

Hive架构优点及使用场景

HIVE的安装配置、mysql的安装、hive创建表、创建分区、修改表等内容、hive beeline使用、HIVE的四种数据导入方式、使用Java代码执行hive的sql命令

有Mysql数据库的情况下为什么要用Hive？

HADOOP之HIVE+MYSQL,HBASE+ZOOKEEPER

【YashanDB知识库】DataX迁移Hive到崖山分布式

【YashanDB知识库】Hive 命令工具insert崖山数据库报错

【YashanDB 知识库】Hive 命令工具 insert 崖山数据库报错

【YashanDB知识库】hive初始化崖山报错YAS-04209

【YashanDB知识库】hive初始化崖山报错YAS-04209

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

seatunnel配置mysql2hive

如何在IDE中通过Spark操作Hive

基于云服务器的数仓搭建-hive/spark安装

hive聚合函数多行合并

相关课程

更多

大数据Hive教程精讲

相关电子书

更多

Hive Bucketing in Apache Spark

spark替代HIVE实现ETL作业

2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践

下一篇

阿里云无影云电脑免费试用，最长可试用3个月

你好，我是AI助理

可以解答问题、推荐解决方案等