收藏 分销(赏)

DC100012中低端网络产品维护与故障排除ISSUE10.pptx

上传人:胜**** 文档编号:953871 上传时间:2024-04-09 格式:PPTX 页数:59 大小:522.61KB
下载 相关 举报
DC100012中低端网络产品维护与故障排除ISSUE10.pptx_第1页
第1页 / 共59页
DC100012中低端网络产品维护与故障排除ISSUE10.pptx_第2页
第2页 / 共59页
DC100012中低端网络产品维护与故障排除ISSUE10.pptx_第3页
第3页 / 共59页
DC100012中低端网络产品维护与故障排除ISSUE10.pptx_第4页
第4页 / 共59页
DC100012中低端网络产品维护与故障排除ISSUE10.pptx_第5页
第5页 / 共59页
点击查看更多>>
资源描述

1、HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 1学习完此课程,您将会:掌握一般的故障排除步骤掌握常用的故障排除工具掌握故障处理常用方法了解华为数据通信产品故障处理资源HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 2第第第第1 1章章章章 网络故障处理概述网络故障处理概述网络故障处理概述网络故障处理概述 第第2章章 故障排除常用工具故障排除常用工具第第3章章 故障排除常用方法故障排除常用方法第第4章章 终端故障处理终端故障处理第第5章章 华为数据通信产品故障处理资源华为数据通信产品

2、故障处理资源HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 3网络故障处理技术概述l能够正确地维护网络尽量不出现故障,并确保出现故障之后能够迅速、准确地定位问题并排除故障,对网络维护和管理人员来说是个挑战。l这不但要求对网络协议和技术有着深入的理解,更重要的是要建立一个系统化的故障处理思想并合理应用于实际中,以将一个复杂的问题隔离、分解或缩减排错范围,从而及时修复网络故障。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 4网络故障分类l连通性问题硬件、媒介、电源故障;配置错误;设备兼

3、容性问题。l性能问题网络拥塞;到目的地不是最佳路由;供电不足;路由环路;网络不稳定。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 5网络故障排除基本步骤故障现象观察故障相关信息收集经验判断和理论分析各种可能原因列表对每一原因实施排错方案故障排除?恢复实施方案前的网络状态故障排除过程文档化循环1循环2NYHUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 6第第1章章 网络故障处理概述网络故障处理概述 第第第第2 2章章章章 故障排除常用工具故障排除常用工具故障排除常用工具故障排除常用工

4、具第第3章章 故障排除常用方法故障排除常用方法第第4章章 终端故障处理终端故障处理第第5章章 华为数据通信产品故障处理资源华为数据通信产品故障处理资源HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 7故障排除常用工具lping命令ltracert命令ldisplay命令lreset命令ldebug命令HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 8PING命令l命令ping用于检查IP网络连接及主机是否可达。l“ping”这个词源于声纳定位操作,指来自声纳设备的脉冲信号。ping命

5、令的思想与发出一个短促的雷达波,通过收集回波来判断目标很相似;即源站点向目的站点发出一个ICMP Echo Request报文,目的站点收到该报文后回一个ICMP Echo Reply报文,这样就验证了两个节点间IP层的可达性表示了网络层是连通的l由于ping和tracert命令不仅是VRP平台的常用网络命令,也是windows平台上常用的网络命令,下面对两种平台下的命令使用均进行介绍HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 9PING命令l在Quidway系列设备上,ping命令的格式如下:ping -c number -t nu

6、mber -s number ip-address-c ping报文的个数,缺省值为5;-t 设置ping报文的超时时间,单位为毫秒,缺省值为2000;-s 设置ping报文的大小,以字节为单位,缺省值为56。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 10PING命令l在PC机上或Windwos NT为平台的服务器上,ping命令的格式如下:ping -n number -t -l number ip-address-n ping报文的个数,缺省值为5;-t 持续地ping 直到人为地中断,Ctr+Breack暂时中止ping命令并

7、查看当前的统计结果,而Ctr+C则中断命令的执行。-l 设置ping报文所携带的数据部分的字节数,设置范围从0至65500HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 11用ping命令进行故障处理l案例一 连通性问题还是性能问题工程师小L,在配置完一台路由器之后执行ping命令检测链路是否通畅。发现5个报文都没有ping通,小L断定是连通性问题。检查双方的配置命令并查看路由表,却一直没有找到错误所在。最后又重复执行了一遍相同的ping命令,发现这一次5个报文中有1个ping通了,原来是线路质量不好存在比较严重的丢包现象。HUAWEI

8、TECHNOLOGIES CO.,LTD.All rights reservedPage 12用ping命令进行故障处理l工程师小L又配置了一台路由器,然后执行ping命令访问Internet上某站点的IP地址,但没有ping通。有了上次的教训小L,再一次ping了20个报文,仍旧没有响应。于是这次小L觉得能够断定是连通性故障。l在费劲周折检查了配置链路之后仍没有发现任何可疑之处,最后小L采取逐段检测的方法对链路中的网关进行逐级测试,发现都可以ping 通,但是响应的时间越来越长,最后一个网关的响应时间在1800ms左右。会不会是由于超时而导致显示为ping 不同呢?受此启发,小L将ping

9、命令报文的超时时间改为4000ms,这次成功ping通了,显示所有的报文响应时间都在2200ms 左右。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 13用ping命令进行故障处理l建议和总结:真的是ping不通吗?这个问题需要定位清楚,因为连通性问题和性能问题排错的关注点是不一样的,问题定位错误必然会导致排错过程的周折。使用一般的ping命令,缺省是发送5个报文的,超时时长是2000ms。如果ping不通情况发生,最好能够再用带参数-c和-t的ping命令再执行一遍,如:ping-c 20-t 4000 ip-address即连续发送

10、20个报文,每个报文的超时时长为4000ms,这样一般可以判断出到底是连通性问题还是性能问题。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 14用ping命令进行故障处理l案例二 使用大包ping对端进行MTU不一致的故障处理某次开局,使用Quidway路由器与其他厂商的某路由器互连,并运行OSPF协议。数据配置完毕后,一切正常,并在今后相当长的时间内设备运转稳定。但两个月后,用户反馈网络中断。l相关信息显示:登录到两台路由器上,发现双方连接正常,可以相互ping通对端地址,但OSPF协议中断;登录Quidway路由器查看邻居状态,发现

11、邻居状态机处于Exstart状态。打开相应的debug开关查看相应的报文信息,发现双方都可以收到Hello报文,但Quidway路由器发送DD报文后,一直没有收到对方回应的DD报文;登录其他厂商的那台路由器,打开相应的debug开关,发现对方收到Quidway路由器发送的DD报文后,已发送了相应的DD报文予以回应。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 15用ping命令进行故障处理l原因分析:初步断定,Quidway路由器没有收到DD回应报文,但对方确实发出来了。既然可以接收到HELLO 报文说明链路是通畅的,而且多播报文的收发

12、也没有问题。那么有可能是对方发送的DD 报文有错误导致Quidway路由器拒收,但查看相应的信息,并没有报告接收到错误的DD 报文。仔细查看某厂商路由器的调试信息发现这个DD报文很大有2000 多字节。会不会是由于报文太大导致的问题呢?试着ping了一个2000字节的报文,结果不通。那么故障原因很可能是由于双方的MTU不一致导致大包不通。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 16用ping命令进行故障处理l处理过程检查配置,发现对方路由器的MTU设置为4000多,而Quidway路由器的MTU设置为1500,于是修改对端路由器的

13、MTU为1500。故障消除。那么为什么工程初期没有问题呢?这是因为前期DD报文长度小于1500字节,而后来网络扩容导致路由信息过多,使DD报文的长度超过了1500 字节。l建议和总结:由于ping 缺省报文是56 个字节,所以显示的ping 通信息只是表示56字节的报文可以通而并不一定表示其他大小的报文仍旧可以通。所以,应当善于使用ping的其他参数来进行故障处理。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 17用ping命令进行故障处理E0:3.3.3.3/8E0:2.2.2.2/8S0:1.1.1.1/8S0:1.1.1.2/8R

14、outer ARouter B案例三 A能ping通B,B就一定能ping通A吗?在RouterA上配置一条指向2.0.0.0/8的静态路由:Quidway ip route-static 2.0.0.0 255.0.0.0 1.1.1.1 在RouterA 上ping路由器RouterB 的以太网地址2.2.2.2,显示可以正常ping通;但是在RouterB上ping路由器RouterA的以太网地址3.3.3.3,却无法ping通。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 18用ping命令进行故障处理l原因分析:由于在Rout

15、erB上没有相应的配置到3.0.0.0/8 路由,所以在RouterB上ping不通RouterA的以太网口3.3.3.3。但是为何在A上可以ping 通2.2.2.2 呢?同样是没有回程路由。打开路由器上的IP报文调试开关发现,原来从RouterA上发出的ICMP报文的源地址填写的是1.1.1.1而不是3.3.3.3,由于两台路由器的s0口处于同一网段,所以响应报文可以顺利到达RouterB。l建议和总结:A能够ping通B则B一定能够ping通A(不考虑防火墙的因素),这句话的对错取决于A和B到底是指主机还是指路由器。如果是指两台主机,那么这句话就是正确的。如果是指两台路由器那就是错误的,

16、因为路由器通常会有多个IP地址。现在就有如下问题:当从一台路由器上执行ping命令它发出的ICMP Echo报文的源地址究竟选择哪一个呢?实际情况是路由器选择发出报文的接口的IP地址。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 19TRACERT 命令l tracert 命令用于测试数据报文从发送主机到目的地所经过的网关,主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障。l tracert利用IP报文的TTL域在每经过一个路由器的转发后减1,当TTL=0时,则向源节点报告TTL超时这个的特性。HUAWEI TECHNOLO

17、GIES CO.,LTD.All rights reservedPage 20TRACERT 命令l在华为Quidway系列设备上,tracert命令的格式如下:tracert tracert -a-a ip-address ip-address -f-f first_TTL first_TTL -m-m max_TTL max_TTL -p-p port -q nqueries -w timeout hostport -q nqueries -w timeout host-a指定本次tracert命令配置的报文源地址;-f指定初始报文的TTL大小,缺省值为1;-m指定最大TTL大小,缺省值为

18、30;-p目的主机的端口号,缺省值为33434;-q每次发送的探测报文的个数,缺省值为3;-w指明报文的超时时间,单位为秒,缺省值为 5000。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 21TRACERT命令l在PC机上或Windwos NT为平台的服务器上,tracert命令的格式如下:tracert -d -h tracert -d -h maximum_hopsmaximum_hops -j -j host-listhost-list -w -w timeouttimeout hosthost-d 不解析主机名;-h 指定最大

19、TTL大小;-j 设定松散源地址路由列表;-w 用于设置UDP报文的超时时间,单位毫秒。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 22使用tracert命令进行故障处理l案例一 使用tracert命令定位不当的网络配置点某校园网中,RouterB和RouterC同属于一个运行RIPv2路由协议的网络,主机4.0.0.2访问数据库服务器5.0.0.2,用户抱怨访问性能差。网云RIP域E1:4.0.0.1/84.0.0.2/8E0:3.0.0.1/8S0:1.0.0.1/8S1:2.0.0.1/8S0:1.0.0.2/8s1:2.0.0

20、.2/85.0.0.2/8RouterARouterARouterBRouterBRouterCRouterCHUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 23使用tracert命令进行故障处理l 相关信息显示登录到RouterC,使用带参数的ping远端服务器5.0.0.2,显示如下:RouterC ping-c 10-s 4000-t 6000 5.0.0.2 PING 5.0.0.2:4000 data bytes,press CTRL_C to break Reply from 5.0.0.2:bytes=4000 Sequen

21、ce=0 ttl=249 time=552 ms Reply from 5.0.0.2:bytes=4000 Sequence=1 ttl=249 time=5733 ms Reply from 5.0.0.2:bytes=4000 Sequence=2 ttl=249 time=552 ms Reply from 5.0.0.2:bytes=4000 Sequence=3 ttl=249 time=5714 ms HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 24使用tracert命令进行故障处理l原因分析上面的ping显示出一个规律

22、:奇数报文的返回时长短,而偶数报文返回时长很长(是奇数报文的10倍多)。可以初步判断奇数报文和偶数报文是通过不同的路径传输的。现在我们需要使用tracert命令来追踪这不同的路径。在RouterC上,tracert远端RouterA的以太网接口5.0.0.1RouterC tracert-q 8 5.0.0.1 traceroute to 5.0.0.1(5.0.0.1)30 hops max,40 bytes packet 1 4.0.0.1 6 ms 4 ms 4 ms 4 ms 4 ms 4 ms 4 ms 4 ms 5 3.0.0.2 20 ms 16 ms 15 ms 16 ms 1

23、6 ms 16 ms 16 ms 16 ms 6 5.0.0.1 30 ms 278 ms 25 ms 279 ms 25 ms 278 ms 25 ms 277 msl从上面的显示可看到,直至3.0.0.2,UDP探测报文的返回时长都基本一致,而到5.0.0.1时,则发生明显变化,呈现奇数报文时长短,偶数报文时长长的现象。于是判断,问题发生在RouterB和RouterA之间。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 25使用tracert命令进行故障处理l原因分析通过询问该段网络的管理员,得知这两路由器间有一主一备两串行链路,主

24、链路为2.048Mbps(s0口之间),备份链路为128Kbps(s1口之间)。网络管理员在此两路由器间配置了静态路由。RouterB上如下配置:RouterB ip route-static 5.0.0.0 255.0.0.0 1.0.0.2RouterB ip route-static 5.0.0.0 255.0.0.0 2.0.0.2RouterA上如下配置:RouterA ip route-static 0.0.0.0 0.0.0.0 1.0.0.1RouterA ip route-static 0.0.0.0 0.0.0.0 2.0.0.1于是问题就清楚了。例如RouterB,由于管

25、理员配置时没有给出静态路由的优先级,这两条路由项的优先级就同为缺省值60,于是就同时出现在路由表中,实现的是负载分担,而不能达到主备的目的。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 26使用tracert命令进行故障处理l处理过程,可以有两种处理方法:继续使用静态路由,进行配置更改。RouterB上进行如下更改:RouterB ip route-static 5.0.0.0 255.0.0.0 1.0.0.2(主链路仍使用缺省优先级60)RouterBip route-static 5.0.0.0 255.0.0.0 2.0.0.2

26、 100(备份链路的优先级降低至100)RouterA上进行如下更改:RouterA ip route-static 0.0.0.0 0.0.0.0 1.0.0.1RouterA ip route-static 0.0.0.0 0.0.0.0 2.0.0.1 100这样,只有当主链路发生故障,备份链路的路由项才会出线在路由表中,从而接替主链路完成报文转发,实现主备目的。在两路由器上运行动态路由协议,如OSPF等,但不要运行RIP协议(因为RIP协议仅以hop作为Metric的)。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 27使用tr

27、acert命令进行故障处理l建议和总结本案例的目的不是为了解释网络配置问题,而是用来展示ping命令和tracert命令的相互配合来找到网络问题的发生点。在一个大的组网环境中,维护人员可能无法沿着路径逐机排查,此时,能够迅速定位出发生问题的线路或路由器就非常重要了。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 28使用tracert命令进行故障处理E1:4.0.0.1/84.0.0.2/8E0:3.0.0.1/8E0:3.0.0.2/8S0:1.0.0.2/8S0:1.0.0.2/8E0:3.0.0.2/8RouterARouterBR

28、outerC案例二 使用tracert命令发现路由环路 三台路由器均配置静态路由,完成后,登录到RouterA上ping主机4.0.0.2,发现不通。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 29使用tracert命令进行故障处理l相关信息显示RouterA ping-c 6-t 5000 4.0.0.2 PING 4.0.0.1:56 data bytes,press CTRL_C to break Request time out Request time outRouterA tracert 4.0.0.2 tracerout

29、e to 4.0.0.2(4.0.0.2)30 hops max,40 bytes packet 1 1.0.0.1 6 ms 4 ms 4 ms (RouterB)2 1.0.0.2 8 ms 8 ms 8 ms (RouterA)3 1.0.0.1 12 ms 12 ms 12 ms(RouterB)4 1.0.0.2 16 ms 16 ms 16 ms(RouterA)HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 30使用tracert命令进行故障处理l原因分析 从上面的tracert命令的显示可以立即发现,在RouterA和Ro

30、uterB间产生了路由环路。由于是配置的是静态路由,基本可以断定是RouterA或RouterB的静态路由配置错误。检查RouterA的路由表,配置的是缺省静态路由:ip route-static 0.0.0.0 0.0.0.0 1.0.0.1,没有问题。检查RouterB的路由表,配置到4.0.0.0网络的静态路由为:ip route-static 4.0.0.0 255.0.0.0 1.0.0.2 下一跳配置的是1.0.0.2,而不是3.0.0.1,这正是错误所在。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 31使用tracert

31、命令进行故障处理l处理过程修改RouterB的配置如下:RouterB no ip route-static 4.0.0.0 255.0.0.0 1.0.0.2RouterB ip route-static 4.0.0.0 255.0.0.0 3.0.0.1l建议和总结tracert命令能够很容易发现路由环路等潜在问题。当路由器A认为路由器B知道到达目的地的路径,而路由器B也认为路由器A知道目的地时,就是路由环路发生了。使用ping命令只能知道接收端出现超时错误,而tracert能够立即发现环路所在,如果tracert命令两次或者多次显示同样的接口。当通过tracert发现路由环路后,如果配置

32、为:静态路由:几乎可以肯定是手工配置有问题单动态路由协议:可能是地址聚合产生的问题多动态路由协议:可能是路由引入产生的问题HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 32DISPLAY命令ldisplay命令是用于了解路由器的当前状况、检测相邻路由器、从总体上监控网络、隔离因特网络中故障的最重要的工具之一。几乎在任何故障处理和监控场合,display命令都是必不可少的。l常用的display命令Display VersionDisplay current-configuration 和 display saved-configurat

33、ionDisplay interfaceHUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 33Display VersionQuidwaydisplay version Copyright Notice:All rights reserved(Aug 17 2004).Without the owners prior written consent,no decompiling nor reverse-engineering shall be allowed.Huawei-3Com Versatile Routing Platform So

34、ftware VRP(R)software,Version 3.30,Release 0008 Copyright(c)2003-2004 Hangzhou Huawei-3Com Tech.Co.,Ltd.All rights reserved.Copyright(c)2000-2003 Huawei Tech.Co.,Ltd.All rights reserved.Quidway Series Router 2631 uptime is 0 week,0 day,7 hours,26 minutes CPU type:PowerPC 8240 200MHz 64M bytes SDRAM

35、Memory 8M bytes Flash Memory 128K bytes NvRAM Memory Pcb Version:1.1 Logic Version:3.0 BootROM Version:9.05HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 34current-configuration和saved-configurationlDisplay current-configuration用于查看当前的配置信息。Display saved-configuration用于显示NVRAM或Flash中的路由器配置文件,即路由器

36、下次上电启动时所用的配置文件。lCurrent-configuration是路由器目前正在运行的配置文件,当更改某一配置时,current-configuration会立即改变;如果不使用save命令将改变保存到启动配置文件saved-configuration中,路由器重启时该改动将丢失。因此请注意到修改运行配置并验证正确后,应当将之保存到启动配置文件中。l强烈建议网络维护或管理人员保存一份启动配置文件的拷贝存放到路由器以外的其他设备上。这有几点好处:这将使维护人员能够迅速配置一个替代的路由器;这个保存在外部的文本文件也可以按上述规定的格式脱机编辑然后使用Download config命令加

37、载到路由器上;可以将该配置文件通过E-mail形式发给华为技术支持人员以帮助定位配置问题。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 35Display interfaceldisplay interface命令可以显示所有接口的当前状态,如果只是想查看特定接口的状态,请在该命令后输入接口类型和接口号,例如:display interface Serial 3/1命令,查看Serial 3/1接口的运行状态和相关信息。Quidway display interface Serial 3/1 Serial3/1 current stat

38、e:UP Line protocol current state:UP Description:Serial3/1 Interface The Maximum Transmit Unit is 1500,Hold timer is 10(sec)Internet protocol processing:disabled Link layer protocol is PPP LCP opened Output queue:(Urgent queue:Size/Length/Discards)0/50/0 Output queue:(Protocol queue:Size/Length/Disca

39、rds)0/500/0 Output queue:(FIFO queuing:Size/Length/Discards)0/75/0 Physical layer is synchronous,Baudrate is 64000 bps Interface is DCE,Cable type is V35 Last 300 seconds input rate 2.40 bytes/sec,0.20 packets/sec Last 300 seconds output rate 2.40 bytes/sec,0.20 packets/secHUAWEI TECHNOLOGIES CO.,LT

40、D.All rights reservedPage 36Reset命令 lReset 命令的作用用于清空当前的统计信息以排除以前积累的数据的干扰。lReset命令中最主要的是reset counters interface和reset ip statistics命令。对于二层帧收发的各计数器的刷新必须使用reset counters interface,可通过display interfaces命令来观察;对于三层报文的收发统计可使用reset ip statistics来刷新,通过display ip interface命令来观察。HUAWEI TECHNOLOGIES CO.,LTD.Al

41、l rights reservedPage 37debug命令 ldebug命令可以帮助用户在网络发生故障时获得路由器中交换的报文和帧的细节信息,这些信息对网络故障的定位是至关重要的。ldisplay命令能够提供某个时间的设备运行状况的视图(静态),而debug命令能够展示一段时间内设备运行的变化情况(动态)。l一般说来,display命令不会影响系统的运行性能,而debug命令则会对系统性能造成影响。因此两者的使用应遵循如下规则:首先使用相关的多个display命令查看设备当前的运行状况,分析可能原因,缩减故障到适当范围,然后打开某个特定的debug命令观察变化情况,以定位和排除问题。HUA

42、WEI TECHNOLOGIES CO.,LTD.All rights reservedPage 38使用debug命令的注意要点 l应当使用debug命令来查找故障,而不是用来监控正常的网络运行。l尽量在网络使用的低峰期或网络用户较少时使用,以降低debug命令对系统的影响性。l由于debug命令在各个输出方向对系统资源的占用情况不同。视网络负荷状况,我们应当在使用方便性(info-center console debugging命令)和资源耗费小(info-center logbuffer debugging命令)间做出权衡。l不要轻易使用类似debug all之类将产生大量输出的命令。仅

43、当寻找某些类型的流量或故障并且已将故障原因缩小到一个可能的范围时,才使用某些特定的debug命令。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 39使用debug命令进故障处理 l案例一 忘记关闭debug开关引起的路由器报文转发速度变慢的故障处理某电信局安装了Quidway路由器作为接入服务器的出口网关,一段时间运转良好。某日用户反映该设备明显速度变慢。执行PING操作,PING对端路由器设备,所用时间为正常的2倍多。l相关信息收集 该路由器的日志中记录了大量的收发IP报文的信息。l原因分析 初步分析可能有以下几种原因:线路质量不好对

44、端设备问题,导致回应较慢自身配置错误网络繁忙软硬件故障 HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 40使用debug命令进故障处理l处理过程 检查线路,没有发现问题;PING与之相连的其他路由器设备,故障依旧,说明对端设备无问题;对照以前运转良好时备份的current-configuration文件,检查路由器上的配置,没有错误;当时并非上网高峰期,且只是变慢,而无丢包,应当不是网络负荷问题;检查该路由器的日志信息,发现其中记录了大量的收发IP报文的信息,执行命令display debugging命令,发现该路由器的debug ip

45、 packet处于打开状态。由于设备需要记录每一个被转发的IP报文,大大降低了路由器的处理速度,导致变慢。关闭该debug开关后,故障解决。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 41第第1章章 网络故障处理概述网络故障处理概述 第第2章章 故障排除常用工具故障排除常用工具第第第第3 3章章章章 故障排除常用方法故障排除常用方法故障排除常用方法故障排除常用方法第第4章章 终端故障处理终端故障处理第第5章章 华为数据通信产品故障处理资源华为数据通信产品故障处理资源HUAWEI TECHNOLOGIES CO.,LTD.All rig

46、hts reservedPage 42故障排除常用方法l分层故障排除法 l分块故障排除法l分段故障排除法l替换法 HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 43分层故障处理法l分层法思想很简单:所有模型都遵循相同的基本前提,当模型的所有低层结构工作正常时,它的高层结构才能正常工作。在确信所有低层结构都正常运行之前,解决高层结构问题完全是浪费时间。l案例分析:在一个帧中继网络中,由于物理层的不稳定,帧中继连接总是出现反复失去连接的问题,这个问题的直接表象是到达远程端点的路由总是出现间歇性中断。这使得维护工程师第一反应是路由协议出问题了

47、,然后凭借着这个感觉来对路由协议进行大量故障诊断和配置,其结果是可想而知的。如果他能够从OSI模型的底层逐步向上来探究原因的话,维护工程师将不会做出这个错误的假设,并能够迅速定位和排除问题。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 44分层故障处理法各层次的关注点 l物理层:电缆、连接头、信号电平、编码、时钟和组帧,这些都是导致端口处于down状态的因素。l数据链路层:数据链路层负责在网络层与物理层之间进行信息传输;规定了介质如何接入和共享;站点如何进行标识;如何根据物理层接收的二进制数据建立帧。封装的不一致是导致数据链路层故障的最

48、常见原因。可以使用display interfaces命令初步判断数据链路层是否存在故障。l网络层:地址错误和子网掩码错误是引起网络层故障最常见的原因;网络中的地址重复是网络故障的另一个可能原因;另外,路由协议是网络层的一部分,在较复杂的网络中是排错重点关注的内容。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 45分块故障处理法lQuidway系列设备current-configuration文件的组织结构,是以全局配置、物理接口配置、逻辑接口配置、路由配置等方式编排的。l我们可以以此作为故障定位提供了一个原始框架,当出现一个故障案例现

49、象时,我们可以把它归入上述某一类或某几类中,从而有助于缩减故障定位范围:管理部分(路由器名称、口令、服务、日志等)端口部分(地址、封装、cost、认证等)路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)策略部分(路由策略、策略路由、安全配置等)接入部分(主控制台、Telnet登录或哑终端、拨号等)其他应用部分(语言配置、VPN配置、QoS配置等)HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 46分块故障处理法l案例分析当使用display ip routing-table命令,结果只显示出了直连路由,那么问题可能发生在哪里

50、呢?根据上述的分块,我们发现有三部分可能引起该故障:路由协议、策略、端口。如果没有配置路由协议或配置不当,路由表就可能为空;如果访问列表配置错误,就可能妨碍路由的更新;如果端口的地址、掩码或认证配置错误,也可能导致路由表错误。HUAWEI TECHNOLOGIES CO.,LTD.All rights reservedPage 47分段故障处理法 l如果两个路由器跨越电信部门提供的线路而不能相互通信时,分段故障处理法是有效的:主机到路由器LAN接口的这一段路由器到CSU/DSU接口的这一段CSU/DSU到电信部门接口的这一段WAN电路CSU/DSU本身问题路由器本身问题HUAWEI TECHN

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服