阿里云-进程监控与告警

简介: 1.背景 我在阿里云ECS上部署了个人网站,用到了mysql与tomcat,所以想要分钟级监控这两个进程是否alive。 2.安装监控agent 安装说明:https://help.aliyun.com/knowledge_detail/38859.html 进入阿里云控制台,产品与服务|监控与管理|云监控|云服务监控|云服务器ECS|单击实例ID,即可见到图2-1.

1.背景

我在阿里云ECS上部署了个人网站,用到了mysql与tomcat,所以想要分钟级监控这两个进程是否alive。

2.安装监控agent

进入阿里云控制台, 产品与服务|监控与管理|云监控|云服务监控|云服务器ECS|单击实例ID,即可见到图2-1.

图2-1
如果图表有缺失,按照提示安装监控agent。它会定时收集系统信息并上报给阿里云后台。

3.添加进程监控

见图3-1。


图3-1
完整进程名称通过 ps aux得到,包含进程名称及启动参数。
注意:这里只需要填写 关键字即可,如果 完整进程名称. contains(关键字) ,那么此关键字下的进程计数就+1。
添加后等待3分钟即可有数据显示。见图3-2.

图3-2

4设置告警规则

见图4-1.

图4-1.

5.告警效果

手机阿里云会提示有告警,见图5-1。且 会收到短信,不用担心错过。


图5-1
目录
打赏
0
0
0
1
14
分享
相关文章
|
18天前
【YashanDB 知识库】YCM Monit 进程频繁误告警
YCM中Monit进程出现频繁误告警问题,表现为“Monit进程停止服务”的邮件告警。原因是服务器资源高负载时,Monit检测动作失败。解决方法为将检测间隔从默认10秒调整至1分钟。此问题影响23.3.2.5及更早版本,目前无修复版本。详情可见YashanDB知识库相关文章。
|
15天前
【YashanDB知识库】YCM Monit进程频繁误告警
【YashanDB知识库】YCM Monit进程频繁误告警
数据采集监控与告警:错误重试、日志分析与自动化运维
本文探讨了数据采集技术从“简单采集”到自动化运维的演进。传统方式因反爬策略和网络波动常导致数据丢失,而引入错误重试、日志分析与自动化告警机制可显著提升系统稳定性与时效性。正方强调健全监控体系的重要性,反方则担忧复杂化带来的成本与安全风险。未来,结合AI与大数据技术,数据采集将向智能化、全自动方向发展,实现动态调整与智能识别反爬策略,降低人工干预需求。附带的Python示例展示了如何通过代理IP、重试策略及日志记录实现高效的数据采集程序。
数据采集监控与告警:错误重试、日志分析与自动化运维
Kubernetes监控:Prometheus与AlertManager结合,配置邮件告警。
完成这些步骤之后,您就拥有了一个可以用邮件通知你的Kubernetes监控解决方案了。当然,所有的这些配置都需要相互照应,还要对你的Kubernetes集群状况有深入的了解。希望这份指南能帮助你创建出适合自己场景的监控系统,让你在首次发现问题时就能做出响应。
49 22
网络分析与监控:阿里云拨测方案解密
阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下,介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘,为客户的业务保驾护航。
595 90
|
16天前
【YashanDB 知识库】YCM Monit 进程频繁误告警
【YashanDB 知识库】YCM Monit 进程频繁误告警
【YashanDB知识库】服务器重启后启动yasom和yasagent进程时有告警
【YashanDB知识库】服务器重启后启动yasom和yasagent进程时有告警
【YashanDB知识库】服务器重启后启动yasom和yasagent进程时有告警
本文介绍了YashanDB在特定场景下的问题分析与解决方法。当使用yasboot重启数据库后,yasom和yasagent进程虽启动成功但出现告警,原因是缺少libnsl.so.1库文件或环境变量配置错误。解决步骤包括:检查系统中是否存在该库文件,若不存在则根据操作系统类型安装(有外网时通过yum或apt,无外网时创建符号链接),若存在则调整环境变量配置,并重新启动相关进程验证问题是否解决。
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
579 3
基于阿里云可观测产品构建企业级告警体系的通用路径与最佳实践
基于阿里云可观测产品构建企业级告警体系的通用路径与最佳实践
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等