故障处理方式

简介:

排除故障方法:
1、自顶而下法
2、自底而上法
3、分而治之法
4、跟踪流量路径法 
5、对比配置法
6、组件替换法

大多数采用的工具:
ping 测试链路连通性
traceroute 测试路由可达性,是否缺少路由
telnet 测试服务端口,是否被拒绝


ICMP(Internet 控制消息协议):ICMP被封装在IP数据报内

ping交换机存在间歇性不通现象,undo icmp rate-limit enable 关闭ICMP限速功能

ping 检测硬件层和网络层IP地址(禁止重定向=禁ping)

ICMP指定了多种消息类型,这些消息的共同目的就是管理网络
消息分为:错误消息、请求消息、响应消息
Frame 1155: 74 bytes on wire (592 bits), 74 bytes captured (592 bits) on interface 0
Ethernet II, Src: guangjie-PC.local (e4:d5:3d:a2:64:95), Dst: localhost (c8:3a:35:58:12:c8)
Internet Protocol Version 4, Src: guangjie-PC.local (192.168.0.104), Dst: localhost (192.168.0.1)
Internet Control Message Protocol
    Type: 8 (Echo (ping) request)
    Code: 0
    Checksum: 0x4d57 [correct]
    [Checksum Status: Good]
    Identifier (BE): 1 (0x0001)
    Identifier (LE): 256 (0x0100)
    Sequence number (BE): 4 (0x0004)
    Sequence number (LE): 1024 (0x0400)
    [Response frame: 1156]
    Data (32 bytes)

traceroute 定位源和目的之间的路径故障

1、探测包超时:没有收到探测包 、设备没有开启ICMP
2、强制性禁止:策略拒绝
3、循环跳动:环路引起
telnet 检测源和目的之间的应用层软件


排除故障方式:
1、报告故障 (收集并分析信息)
2、验证故障 (排除潜在可能的故障原因 )
3、定义故障 (验证推断,不是网络层问题)
4、分配故障 (确定责任,提交相应的工程师排查,假设应用层问题)
5、收集故障 (建立故障文档)
6、上报故障 (硬件故障、软件故障、配置差错)

分类——>询问信息——>证实——>上报——>协调——>更新——>报告

定义故障:
1、您所说的故障到底指什么?
2、故障出现之前有无变更操作?
3、故障出现之前是否发现了什么异常?
4、正常工作的最后时间是什么?


物理层
1、设备掉电
2、线缆损坏
3、线缆未连接
4、网口故障
5、连接端口错误
6、收发器故障
7、中间节点问题

8、板卡问题

9、……

数据链路层
1、不正确地配置接口(vlan划分)
2、不正确的封装设置(trunk、PPP)
3、端口故障(速率工作模式不匹配)
4、配置错误引起环路
5、链路聚合端口不一致
6、……

网络层
1、没启用路由器协议
2、启用错误的路由器协议
3、IP地址配置错误
4、子网掩码配置错误
5、网关配置错误
6、未配置路由条目
7、配置路由条目错误
8、认证错误
9、……

传输层
1、添加ACL中的permit
2、未添加ACL中
3、……










本文转自 周小玉 51CTO博客,原文链接:http://blog.51cto.com/maguangjie/1914525,如需转载请自行联系原作者
目录
相关文章
|
23天前
|
Kubernetes Java 测试技术
ChaosBlade常见问题之在K8s环境下演练cpu满载报错如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
21 0
|
22天前
|
Java 测试技术 开发者
ChaosBlade常见问题之故障编排如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
23 1
|
SQL 监控 网络协议
线上故障如何快速排查?来看这套技巧大全
有哪些常见的线上故障?如何快速定位问题?本文详细总结工作中的经验,从服务器、Java应用、数据库、Redis、网络和业务六个层面分享线上故障排查的思路和技巧。较长,同学们可收藏后再看。
线上故障如何快速排查?来看这套技巧大全
|
运维 监控 数据库
线上服务故障处理原则
墨菲定律 任何事情都没有表面看起来那么简单 所有事情的发展都会比你预计的时间长 会出错的事情总会出错 如果担心某个事情发生,那么它更有可能发生 墨菲定律暗示我们,如果担心某种情况会发生,那么它更有可能发生,久而久之就一定会发生。
2070 0
|
22天前
|
Kubernetes Java 测试技术
ChaosBlade故障问题之支持JVM故障注入如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
|
23天前
|
Kubernetes 监控 测试技术
ChaosBlade常见问题之演练故障添加如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
24 0
|
JSON 运维 网络协议
平稳运行半年的系统宕机了,记录一次排错调优的全过程!
最近发生了一件很让人头疼的事情,已经上线半年且平稳运行半年系统在年后早高峰的使用时发生了濒临宕机的情况。访问速度特别慢,后台查到大量time_wait的连接,从代码层面到架构层面到网络层面排查了几天几夜,总算是有了结果。
|
监控 NoSQL 关系型数据库