针对惠普服务器SNMP采集频繁,导致服务停止的解决方案

简介: 运维软件:zabbix采集方式:snmp采集设备:惠普-DL380_Gen9-服务器采集周期:根据指标要求频率有5分钟到1天主要命令:reset /map1乐维服务中发现,snmp采集惠普服务器一段时间后,zabbix提示连接失败,重启ilo后又可以重新采集,我们可以利用这一点做一个自动重启脚本,保证采集正常。
运维软件:zabbix
采集方式:snmp
采集设备:惠普-DL380_Gen9-服务器
采集周期:根据指标要求频率有5分钟到1天
主要命令:reset /map1

乐维服务中发现,snmp采集惠普服务器一段时间后,zabbix提示连接失败,重启ilo后又可以重新采集,我们可以利用这一点做一个自动重启脚本,保证采集正常。
实现思路:zabbix检查自定时间内没有数据->触发告警脚本->告警脚本登录设备执行 reset /map1

1.我们要模板里加一个多久没有采集到数据的触发器如:
img_f9b83c6b27e84bf6fdd25cf66f5b811c.png 

2.增加报警媒介。
管理->报警媒介类型->创建报警媒介类型。

img_df24e78933a398a1b69f89f024f01926.png 

脚本的操作是根据传过来的参数到数据库是找出此设备管理口IP、帐号、密码。

主要sql:SELECT i.ip,h.ipmi_username,h.ipmi_password from `hosts` as h LEFT JOIN interface as i on i.hostid = h.hostid where h.host="'.$hostName.'"  and  i.port= 161。

然后用ssh连接到该设备,执行reset /map1 就可以重启该ilo了。

3.添加动作
配置->动作->创建动作
img_35963fe10443915efca0a40e3b52b831.png 


到此重启设备ilo口完成。

面对snmp频繁采集导致snmp连接失败,这也是一个解决方案。


3.png




转自

惠普服务器SNMP采集频繁导致服务停止解决方案

(出处: 乐维)


相关文章
|
2月前
|
Arthas 弹性计算 运维
阿里云ECS监控服务
阿里云ECS监控服务
417 2
|
2月前
|
机器学习/深度学习 弹性计算 运维
ECS阿里云监控服务
ECS阿里云监控服务
78 3
|
1月前
|
运维 监控 Linux
Centos开启snmp服务
Centos开启snmp服务
20 1
|
2月前
|
Shell Windows
Windows服务器 开机自启动服务
Windows服务器 开机自启动服务
20 0
|
1月前
|
安全 网络安全 数据安全/隐私保护
一个服务器实现本机服务互联网化
一个服务器实现本机服务互联网化
20 0
|
2月前
|
弹性计算 运维 安全
2024年阿里云一键搭建部署幻兽帕鲁服务器解决方案
幻兽帕鲁火了,为了确保畅快体验游戏,构建高效、稳定的游戏服务器至关重要。幸运的是,阿里云为您提供了快速、简便的服务器搭建解决方案,即使您对技术知识了解有限,也能在短短一分钟内轻松完成《幻兽帕鲁》游戏的联机服务器搭建!
1466 4
|
7天前
|
Web App开发 安全 Unix
Linux 配置FTP服务器 + vsftpd服务安装配置 (Good篇)
Linux 配置FTP服务器 + vsftpd服务安装配置 (Good篇)
|
10天前
|
存储 监控 安全
如何利用服务器为个人和企业提供定制服务?
【5月更文挑战第4天】如何利用服务器为个人和企业提供定制服务?
25 11
|
10天前
|
Ubuntu
Ubuntu20.04安装SNMP服务
至此,你已经成功在Ubuntu 20.04上安装了SNMP服务。你可以使用SNMP工具来监视和管理你的系统,或者将其集成到网络管理系统中。
26 3
|
15天前
|
弹性计算 运维 Serverless
Serverless 应用引擎产品使用之在阿里函数计算中,使用阿里云API或SDK从函数计算调用ECS实例的服务如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
42 4