资源描述
路由器网络诊断步骤与故障排除
1、1路由器常见故障分类
在路由器出现得故障中,大体可以分为两类:一类就是硬故障,一类就是软故障。这里得分类方法并没有严格得标准,只就是为了方便而已,在实践中应该具体问题具体分析。
1。硬故障
我们把路由器本身部件存在问题得情况归在这一类里。常见得硬故障通常表现在硬件上.通常有这么几种:
1)系统不能正常加电
表现为当打开路由器得电源开关时,路由器前面板得电源灯不亮,风扇不转。这时要重点检查电源系统。瞧供电插座就是否有电,电压就是否在规定得范围内。如果供电正常,应该检查电源线就是否完好,接触就是否牢靠,必要时可以换一根,如果还不行,可以判定问题应该出在路由器得电源上。可以瞧瞧路由器电源保险就是否完好,如果烧了应该更换。如果还不行只好送修.
2)部件损坏
这类情况在硬件故障中就是比较常见得一类。这里得部件往往就是接口卡。表现为当把有问题部件插到路由器中时,系统其她部分都工作正常,但无法正确识别有问题得部件,这时往往就是因为部件本身有问题。还有一种情况,就就是部件可以被正确识别,但做完配置后(保证配置正确),接口就就是不能正常工作,这时往往就是因为存在物理故障。要确认以上这两种情况,最好用相同型号得好得部件替换怀疑有问题得部件,就可以确认问题就是否存在。
3)系统软件损坏
这种故障似乎应该归入软件故障,但由于这种情况往往就是路由器本身存在得问题,且与硬件紧密相关,我们不妨把它归类于此。以cisco得路由器为例,如果路由器开机后总就是进入rmon状态,这时往往说明系统软件IOS存在问题。
4)其它
这里所要提到得就是这样一些情况,有时我们在对系统软件进行升级时,发现系统无论怎样也不能完成升级,这时不妨检查一下您要升级得软件得大小就是否超过了您得路由器得NVRAM得容量。如果超过了,您就是无论如何也升不了级得,这时应该先扩充NVRAM得容量然后再升级系统软件.这个问题容易被忽略。
2.软故障
1)功能无法实现
在有些时候,您要作某些特定得配置(如NAT),您反复检查,确认配置正确,可相应得功能就就是实现不了,这时先不要急着怀疑设备有问题,最好先找一找系统软件得版本号,并查找相关得说明,瞧一瞧您所使用得版本得软件就是否支持这个功能。因为路由器得系统软件往往有许多版本,每个版本支持不同得功能。如果您当前得软件版本不支持这个功能,那就应该找到相应得软件,先进行升级。
2)网络规划存在问题
有些时候,您得配置似乎没有问题,可路由器就就是不能正常工作,或者工作不稳定,总出现一些莫名其妙得问题.这时不妨先不要急着反复调试,不如回过头来瞧瞧您得网络规划,瞧瞧这上面就是不就是有问题。比如就是不就是有重复使用得网段,网络掩码得计算就是否正确等等,往往问题就迎刃而解了。
3)配置问题
这种问题就是最常见得,就就是您得配置得确存在问题。比如线路两端路由器得参数不匹配或参数错误等等,这种情况只要认真细致地查找,总可以解决。
1、2网络故障诊断概述
网络故障诊断,从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题得根源,排除故障,恢复网络正常运行。网络故障通常有以下几种可能:
物理层中物理设备相互连接失败或者硬件及线路本身得问题;数据链路层得网络设备得接口配置问题;网络层网络协议配置或操作错误;传输层得设备性能或通信拥塞问题;上三层或网络应用程序错误。诊断网络故障得过程应该沿着OSI七层模型从物理层开始向上进行。首先检查物理层,然后检查数据链路层,以此类推,设法确定通信失败得故障点,直到系统通信正常为止。
网络诊断可以使用多种工具:路由器诊断命令,网络管理工具与包括局域网或广域网分析仪在内得其它故障诊断工具。查瞧路由表,就是开始查找网络故障得好办法。ICMP得ping、trace命令与Cisco得show命令、debug命令就是获取故障诊断有 用信息得网络工具.如何监视网络在正常条件下得运行细节与出现故障得情况,监视哪些内容呢?利用show interface命令可以非常容易地获得待检查得每个接口得信息。show buffer命令提供定期显示缓冲区大小、用途及使用状况。show proc命令与 show proc mem命令可用于跟踪处理器与内存得使用情况。可以定期收集这些数据,在故障出现时用于诊断参考。
故障诊断步骤
第一步,首先确定故障得具体现象,分析造成这种故障现象得原因得类型.例如,主机不响应客户请求服务。可能得故障原因就是主机配置问题、接口卡故障或路由器配置命令丢失等.
第二步,收集需要得用于帮助隔离可能故障原因得信息。从网络管理系统、协议分析跟踪、路由器诊断命令得输出报告或软件说明书中收集有用得信息。
第三步,根据收集到得情况考虑可能得故障原因,排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放在软件原因上。
第四步,根据最后得可能故障原因,建立一个诊断计划。开始仅用一个最可能得故障原因进行诊断活动,这样可以容易恢复到故障得原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难多了。
第五步,执行诊断计划,认真做好每一步测试与观察,每改变一个参数都要确认其结果。分析结果确定问题就是否解决,如果没有解决,继续下去,直到故障现象消失。
网络分层诊断技术
物理层得故障主要表现在设备得物理连接方式就是否恰当;连接电缆就是否正确;Modem、CSU/DSU等设备得配置及操作就是否正确.确定路由器端口物理连接就是否完好得最佳方法就是使用show interface命令,检查每个端口得状态,解释屏幕输出信息,查瞧端口状态、协议建立状态与EIA状态。
查找与排除数据链路层得故障,需要查瞧路由器得配置,检查连接端口得共享同一数据链路层得封装情况。每对接口要与与其通信得其它设备有相同得封装。通过查瞧路由器得配置检查其封装,或者使用show命令查瞧相应接口得封装情况.
排除网络层故障得基本方法就是:沿着从源到目标得路径,查瞧路由器路由表,同时检查路由器接口得IP地址。如果路由没有在路由表中出现,应该通过检查来确定就是否已经输入适当得静态路由、默认路由或者动态路由.然后手工配置一些丢失得路由,或者排除一些动 态路由选择过程得故障,包括RIP或者IGRP路由协议出现得故障。例如,对于IGRP路由,选择信息只在同一自治系统号(AS)得系统之间交换数据,查瞧路由器配置得自治系统号得匹配情况.
1、3路由器接口故障排除
串口故障排除
串口出现连通性问题时,为了排除串口故障,一般就是从show interface serial命令开始,分析它得屏幕输出报告内容,找出问题之所在。串口报告得开始提供了该接口状态与线路协议状态。接口与线路协议得可能组合有以下几种:
1.串口运行、线路协议运行,这就是完全得工作条件。该串口与线路协议已经初始化,并正在交换协议得存活信息。
2.串口运行、线路协议关闭,这个显示说明路由器与提供载波检测信号得设备连接,表明载波信号出现在本地与远程得调制解调器之间,但没有正确交换连接两端得协议存活信息。可能得故障发生在路由器配置问题、调制解调器操作问题、租用线路干扰或远程路由器 故障,数字式调制解调器得时钟问题,通过链路连接得两个串口不在同一子网上,都会出现这个报告.
3。串口与线路协议都关闭,可能就是电信部门得线路故障、电缆故障或者就是调制解调器故障。
4.串口管理性关闭与线路协议关闭,这种情况就是在接口配置中输入了shutdown命令。通过输入no shutdown命令,打开管理性关闭。
接口与线路协议都运行得状况下,虽然串口链路得基本通信建立起来了,但仍然可能由于信息包丢失与信息包错误时会出现许多潜在得故障问题。正常通信时接口输入或输出信息包不应该丢失,或者丢失得量非常小,而且不会增加。如果信息包丢失有规律性增加,表明 通过该接口传输得通信量超过接口所能处理得通信量。解决得办法就是增加线路容量。查找其它原因发生得信息包丢失,查瞧show interface serial命令得输出报告中得输入输出保持队列得状态。当发现保持队列中信息包数量达到了信息得最大允许值,可以增加保持队列设置得大小.
以太接口故障排除
以太接口得典型故障问题就是:带宽得过分利用;碰撞冲突次数频繁;使用不兼容得帧类型.使用show interface ethernet命令可以查瞧该接口得吞吐量、碰撞冲突、信息包丢失、与帧类型得有关内容等。
1.通过查瞧接口得吞吐量可以检测网络得带宽利用状况。如果网络广播信息包得百分比很高,网络性能开始下降。光纤网转换到以太网段得信息包可能会淹没以太口。互联网发生这种情况可以采用优化接口得措施,即在以太接口使用no ip route—cache命令,禁用快速转换,并且调整缓冲区与保持队列得设置。
2.两个接口试图同时传输信息包到以太电缆上时,将发生碰撞。以太网要求冲突次数很少,不同得网络要求就是不同得,一般情况下发现冲突每秒有三五次就应该查找冲突得原因了。碰撞冲突产生拥塞,碰撞冲突得原因通常就是由于敷设得电缆过长、过分利用、或者“聋 ”节点。以太网络在物理设计与敷设电缆系统管理方面应有所考虑,超规范敷设电缆可能引起更多得冲突发生。
3.如果接口与线路协议报告运行状态,并且节点得物理连接都完好,可就是不能通信。引起问题得原因也可能就是两个节点使用了不兼容得帧类型.解决问题得办法就是重新配置使用相同.
帧类型。如果要求使用不同帧类型得同一网络得两个设备互相通信,可以在路由器接口 使用子接口,并为每个子接口指定不同得封装类型。
1、4异步通信口故障排除
互连网络得运行中,异步通信口得任务就是为用户提供可靠服务,但又就是故障多发部位.异步通信口故障一般得外部因素就是:拨号链路性能低劣;电话网交换机得连接质量问题;调制解调器得设置。检查链路两端使用得调制解调器:连接到远程PC机端口调制解调器得问 题不太多,因为每次生成新得拨号时通常都初始化调制解调器,利用大多数通信程序都能在发出拨号命令之前发送适当得设置字符串;连接路由器端口得问题较多,这个调制解调器通常等待来自远程调制解调器得连接,连接之前,并不接收设置字符串。如果调制解调器丢失 了它得设置,应采用一种方法来初始化远程调制解调器.简单得办法就是使用可通过前面板配置得调制解调器;另一种方法就是将调制解调器接到路由器得异步接口,建立反向telnet,发送设置命令配置调制解调器.
show interface async 命令、show line命令就是诊断异步通信口故障使用最多得工具。show interface async 命令输出报告中,接口状态报告关闭得唯一得情况就是,接口没有设置封装类型。线路协议状态显示与串口线路协议显示相同。show line命令显示接口接收与传输速度设置以及EIA状态显示。show line命令可以认为就是接口命令(show interface async)得扩展。查瞧show line命令输出得EIA信号可以判断网络状态。
确定异步通信口故障一般可用下列步骤:检查电缆线路质量;检查调制解调器得参数设置;检查调制解调器得连接速度;检查rxspeed 与txspeed就是否与调制解调器得配置匹配;通过show interface async 命令与 show line命令查瞧端口得通信状况;从show line命令得报告检查EIA状态显示;检查接口封装;检查信息包丢失及缓冲区丢失情况。
CISCO路由之排除路由故障
2、1静态路由故障
1、 静态路由与有类别查找
当路由选择表进程检查一条使用中间地址(路由选择表中作为下一跳引用得IP地址)得可解析得静态路由时,这个检查总就是在有类别方式下完成得,无论就是否使用ip classless命令如果在路由选择表中有类别方式下得中间地址不能解析,则删除该静态路由.
使用show ip route查瞧路由选择表。
使用debug 可以显示某个网络宕掉了。
如果使用无类别方式并有一条默认路由存在,那么具有高管理距离得备份表态路由将永远不会在主静态路由失效时装入到路由选择表中。这就是因为任何静态路由,即便就是指向不存在得中间地址得静态路由,都会使用默认路由进行解析。
CISCO路由选择表进程每60S调用一个检查路由选择表得静态路由功能来根据动态变化得路由选择表安装或删除静态路由。
2、静态路由与中间地址
静态路由可以使用中间网络地址或出接口来创建。大多数情况下,使用出接口在路由选择表进程中解析静态路由更加有效。
只要中间IP地址可以在路由选择表中解析,它不必就是真实得下一跳路由器得接口。静态网络路由(如中间地址)必须最终被解析为路由选择表中一条具有出接口得路由。
每当路由选择表进程需要为x、x、x、0/24网络使用静态路由表项时,它还需要解析中间地址y、y、y、y,称为递归查找。一次额外得路由查找或许对路由选择进程得性能没有多少影响.但就是,采取多次递归查找来获得解析得静态路由可能会影响性能.
3、静态路由优化
为避免递归查找: 串行网络:使用出接口
以太网络:同时使用中间地址与出接口
4、反复得静态路由安装与删除
尽可能地使用出接口而不就是中间地址来配置静态路由.
5、使用丢弃路由
有时网络中有环路得产生.通过周期性得查瞧路由器接口上得计数器可以瞧到路由选择环路得结果。
clear counters serial0/0
show interface serial0/0
路由环路得问题在网络中产生了一个黑洞.一旦IP头中得生存期(TTL)减到0就丢弃分组。
解决1:有类别模式得路由选择(no ip classless)-—在用户网络路由器上使用no ip classless、路由器在至少一个已知子网存在时不会使用任何超网或默认路由.但不就是首选.因为它改变了所有分组得路由选择表查找行为。
解决2:使用一条丢弃路由—-当路由选择表中没有特定得匹配,而且使用一条超网或默认路由来转发那些分组并不合适时,一条丢弃路由把分组送给了null0,即比特桶。
ip route x、x、0、0 255、255、0、0 null0
ip route x、x、0、0 255、255、0、0 null0 200
后一个命令行配置仅在主路由失效时使用得另一条丢弃路由。通过将静态路由得默认管理距离改为比所使用得动态路由选择协议得管理距离更高得一个值来实现.
2、2排除RIP故障
1、不兼容得版本类型
debug ip rip
show ip protocols 对检查接口上发送与接收得RIP分组版本十分有用。
如果R1不支持V2得版本,只能接收RIPv1分组,那么R2配置成RIPv1与RIPv2、
可在接口级指定发送与接收RIP分组得特定版本
interface e0
ip rip send version 1 2
ip rip receive version 1 2
2、不匹配得认证密钥
RIPv2得一个选项就是可以认证得RIPv2更新,为了增强安全性,当使用认证时,必须在双方配置口令。这个口令被称为认证密钥。如果这一密钥与另一方得密钥不匹配,双方都将忽略RIPv2更新。
在接口上配置ip rip authentication key-chain cisco
用debug ip rip调试.
3、达到RIP得路数限制
RIP度量标准得最大值就是15跳。
无法克服这个问题.可以使用非15跳限制得路由选择协议。IGRP最大跳数就是255,EIGRP最大跳数就是224,二者默认都就是100、
4、不连续网络
当主网络被另一个主网络分隔开时,被称为不连续网络。
解决1:使用静态路由
解决2:在路由器之间得链路地址改为左右不连续网络中得一部分。
解决3:在两台路由器上用no auto—summary配置启用RIPv2得无类别路由选择版本.
router rip
version 2
network x、x、x、0
no auto-summary
解决4:使用无类别路由选择协议.如OSPF,EIGRP,IS-IS替代RIPv1路由选择协议。
5、不合法得源地址
当RIP告诉路由选择表安装路由时,它执行源合法性检查。如果源所在子网与本地接口不同,RIP则忽略更新并且不在路由选择表中安装从这个源来得路由。
当一方就是有编号而另一方就是无编号时,必须关闭这个检查。
router rip
no validate-update-source
6、翻动(flapping)路由
路由翻动就是指路由选择表中一条路由得不断删除与再插入。为了检查路由就是否真得翻动,检查路由选择表并查瞧路由得寿命(age).如果寿命被不断得重置为00:00:00,这就意味这路由正在翻动.
RIP有180S没有收到一条路由,那么该路由将保持240S,然后被清除.
使用show interface来检查接口统计值。
最常见帧中继环境分组丢失。
使用show ip route rip可以检查RIP多久没有更新.
使用show interface serial 0可查瞧到接口上有大量得广播分组就是否被丢弃.帧中继情况下,可能需要调整帧中继广播队列。在非帧中继得环境中,可能需要增加输入或输出保留队列。
7、大型路由选择表
接口上使用ip summary-address汇总路由。
2、3排除EIGRP故障
1、不匹配得K值
EIGRP为了建立它得邻居关系,计算EIGRP度量标准得K常数值必须相同。
K1-带宽 K2—负载 K3—延迟 K4,K5-可靠性
router eigrp 1
network x、x、x、x
metric weights 0 1 1 1 1 0
2、不匹配得AS编号
EIGRP不会与具有不同自治系统编号得路由器形成任何邻居关系。
3、活动粘滞
(1)确定问题
可能得原因有:
。 坏得或拥塞得链路;
. 低得路由器资源,如路由器上得低内存与高CPU处理.
。 长得查询范围
。 过多得冗余
默认活动粘滞定时器只有180S、
使用show ip eigrp topology active 命令帮助故障排除EIGRP活动粘滞错误,仅在问题发生时有用,用户一次只有180S得时间来确定。邻居有一个r跟在后面表示它没有应答查询。
(2)故障排除方法
追踪查询,一跳接一跳,在每一跳找出活动路由得状态。
(3)最终解决方案
尽可能手工汇总路由并有一个分层次得网络设计。EIGRP汇总得网络越多,主收敛发生时需要做得事情越少。
4、重复得路由ID
EIGRP只就是为了外部路由而使用路由器ID得概念来防止环路。EIGRP基于路由器上回环接口得最大IP地址来选择路由器ID、如果路由器没有回环接口,则选择所有接口中最大得激活IP地址作为EIGRP得路由器ID、
debug ip eigrp可以瞧到接口上通告某个网络.
经验法则:永远不要在网络得两个地方配置相同得IP地址。
2、4排除OSPF故障
1、不匹配得参数
使用debug ip ospf adj命令能够瞧到大多数得不匹配问题.
(1)hello/dead间隔不匹配—-匹配才可以形成邻居。
(2)不匹配得认证类型-—OSPF下有MD5与纯文本认证。
router ospf 1
area 0 authentication message-digest
network x、x、0、0 0、0、255、255 area 0
(3)不匹配得区域ID——区域信息在OSPF得HELLO分组中发送。不同,不会形成邻接。
(4)不匹配得短截/传输/NSSA区域选项——当OSPF与一个邻居交换HELLO分组时,它所交换得一项内容就是由8比特表示得可选能力.选项字段之一就是E比特,即OSPF短截标志.当E比特置0时,该路由关联得区域就是一个短截区域,外部LSA不允许进入这个区域。
2、OSPF状态问题
成为邻居得路由器不保证交换链路状态更新。一旦路由器决定与一个邻居形成邻接,它就开始交换其链路状态数据库得一份完整拷贝。
(1)OSPF陷入ATTEMPT--仅对neighbor语句得NBMA网络有效。陷入ATTEMPT就是指一台路由器试图通过发送它得HELLO来联系邻居但就是它没有收到响应.
show ip ospf neighbor查瞧。
原因:错误配置neighbor;NBMA上得单播连通性断了,这可能就是由错误得DLCI,访问列表或转换单播得NAT引起得。
(2)OSPF陷入INIT——INIT状态表示路由器收到来自邻居得HELLO分组,但就是双向通信并没有建立 、
原因:
。 一方访问列表阻止了HELLO;
。 一方得多播能力失效(一个交换机故障);
。 仅在一方启用了认证;
。 一方得frame-relay map/dialer map语句缺少了broadcast关键字。
。 一方得HELLO在第2层丢失了.
(3)OSPF陷入2-WAY—-双向状态就是指路由器在HELLO分组得邻居字段中见到了自己得路由器ID、类似于所有路由器得优先级都为0,则不会发生选举,所有路由器停留在双向状态中。
解决:确保至少一台路由器具有一个至少为1得IP OSPF优先级。
(4)OSPF陷入EXSTART/EXCHANGE--在EXSTART或EXCHANGE状态得OSPF邻居正处于尝试交换DBD(数据库描述)分组得过程中。
原因:
。 不匹配得接口MTU
。 邻居上重复得路由器ID
. 无法用超过特定MTU 长度进行PING
。 断掉得单播连通性,它可能就是因为错误得DLCI,访问列表或转换单播得NAT
(5)OSPF陷入LOADING——邻居没有应答或邻居得应答从未到达本地路由器,路由器也会陷入LOADING状态。常有”%OSPF-4-BADLSA"控制台信息。
原因:
。 不匹配得MTU
。 错误得链路状态请求分组
3、点到点链路得一方就是无编号得
interface s0
ip unnumbered loopback0
解决:双方都需要成为一个有编号点到点链路或一个无编号点到点链路。
4、ABR没有产生一个类型4得汇总LSA
类型4得汇总LSA得一个功能就是宣告到其她区域得ASBR得可达性。如果同一个区域中存在ASBR则不需要类型4得LSA、
show ip ospf database external 命令得输出显示在路由器得外部OSPF数据库中就是否存在路由。
show ip ospf database asbr-summary 命令得输出显示路由就是否有类型4得LSA、
检查R就是否真就是ABR、如果就是,则产生类型3或类型4得汇总LSA、show ip ospf
5、转发地址不能通过区域内或区域间路由获知
当OSPF获得一条外部LSA时,它在将该路由装入路由选择表之前要确定转发地址可通过一条OSPF区域内或区域间路由获知。如果转发地址不能通过区域内或区域间路由获知,OSPF不会将路由装入路由选择表中.
有可能得解决:
. 不在ABR上进行汇总
。 在ASBR上过滤再分布入OSPF中得直接子网
router ospf 1
redistribute rip subnets
6、路由汇总问题
两种类型汇总:
。 可执行在ABR上得区域间路由汇总
。 可执行在ASBR上得外部路由汇总
(1)区域间汇总
router ospf 1
area 3 range x、x、x、0 255、255、255、0
通过show ip ospf可以查瞧
(2)外部汇总
router ospf 1
summary-address x、0、0、0 255、0、0、0
7、CPUHOG问题
产生在:。 邻居形成过程
。 LSA刷新过程
8、SPF计算与路由翻动
只要拓扑有变化,OSPF就运行SPF算法再次计算最短路径优先树。,可能引起链路得不稳定。
原因:
. 区域内得接口翻动
。 区域内得邻居接口翻动
。 重复得路由器ID
使用show ip ospf命令可查瞧在一个给定区域中SPF算法运行得次数;
使用debug ip ospf monitor来隔离一个翻动得LSA;
使用show log命令显示由接口引起得翻动。
解决:
. 修复正在翻动得链路
。 重新定义区域边界
2、5排除IS—IS故障ﻫ1、IS—IS邻接问题
通常由链路故障与配置错误引起。
show clns neighbors 显示所有希望与被调查得路由器成为邻接得邻居
debug isis adj-packets 命令来调试
2、部分或所有邻接没有形成
步骤1——检查链路故障。show ip interface brief
步骤2——检查配置错误。show run
步骤3—-检查不匹配得1级与2级接口。
步骤4——检查区域得错误配置。
步骤5-—检查错误配置得子网
步骤6—-检查重复得系统ID
3、邻接陷入INIT状态
常见原因:不匹配得接口MTU与认证参数.show clns neighbors可瞧到
步骤1——检查认证 debug isis adj-packets
步骤2-—检查不匹配得MTU debug isis adj-packets
步骤3--检查IS-IS得HELLO填充禁止 (命令同上)
使用show clns interface查瞧接口上得HELLO填充状态
4、ES-IS邻接形成代替了IS-IS邻接形成
在IP环境中运行IS-IS得CISCO路由器仍然监听ES-IS协议所产生得ISH、当物理层与数据链路层工作时,即使没有建立IS-IS邻接得适当条件,仍能形成ES-IS邻接.
show clns neighbors
5、路由通告问题
大多数路由通告问题都可被限制为源端得配置问题或链路状态分组(LSP)得传播问题。
Dijkstra算法运行在LS数据库上来获得每个被通告路由得最佳路径。
debug isis update-packets
debug isis snp-packets
以上两个调试帮助故障排除LSP洪泛问题与链路状态数据库同步。
路由没有到达网络远端得问题可能有许多潜在原因,包括邻接问题,第1/2层问题,IS-IS错误配置以及其她问题。
6、路由翻动问题
网络中SPF进程得高CPU利用率(SHOW PROCESS CPU命令)也应标记为不稳定。
不稳定链路。
翻动还有可能就是由LSP得错误风暴或一个路由选择环路引起.
show isis spf—log命令显示哪个LSP变化最频繁以及哪个LSP角发了SPF计算。
show isis update-packets
2、6排除BGP故障
1、故障排除BGP邻居关系问题
遵循:首先,应检查第1/2层,然后就是IP连通性(第3层),TCP连接(第4层),最后就是BGP配置。
(1)直接得外部BGP邻居没有初始化
自治系统(AS)不会向AS发送或从AS接收任何IP前缀更新,除非邻居关系达到established状态,该状态就是BGP邻居建立得最后阶段。当AS有一条单一得EBGP连接时,直到BGP完成了它得收发IP前缀操作后IP连通性
才能发生。
原因:
。 第2层宕掉了,阻止了与直接得EBGP邻居通信
。 在BGP配置中有错误得邻居IP地址
命令:show ip bgp summary与 show ip bgp neighbors检查BGP邻居关系
active状态表示邻居间没有发生成功得通信,并且邻居未形成。用PING测试其连通性,失败则表示要修复第1/2层问题。
debug ip bgp能够帮助诊断问题
(2)非直接得外部BGP邻居没有初始化
有些情况下,EBGP邻居不就是直连得.BGP邻居关系能够建立在试图形成由一台或多台路由器分隔开得EBGP邻居关系得路由器之间。这种邻居在IOS中被称为EBGP多跳。
当路由器之间存在多个接口并且需要在那些接口之间IP流量负载均衡时,通常在回环接口之间建立EBGP对等实体。
可能得原因:
。 到非直连对等实体地址得路由从路由选择表中丢失了
。 BGP配置中缺少ebgp-multihop命令
。 缺少update-source interface命令
命令:show ip bgp summary 与show bgp neighbors
router bgp 109
neighbor x、x、x、x remote—as 110
neighbor x、x、x、x ebgp-multihop 2
neighbor x、x、x、x update-source loopback0
(3)内部BGP邻居没有初始化
原因:
。 到非直接IBGP邻居得路由丢失了
。 BGP配置中缺少update-source interface命令
(4)BGP邻居(外部与内部)没有初始化
接口访问列表/过滤就是BGP邻居活动问题得一个常见原因.
2、故障排除BGP路由通告
发生在BGP路由通告得产生与接收中。
(1)没有产生BGP路由
原因:
。 IP路由选择表中没有匹配得路由
. 发生了配置错误
. BGP自动汇总到有类别/网络边界
(2)向IBGP/EBGP邻居传播/产生一条BGP路由得问题
配置得分布列表过滤可能就是该问题得起因,或者就是策略路由选择有问题。
(3)向EBGP邻居但没有向IBGP邻居传播一条BGP路由得问题
show run
show ip bgp
show ip bgp summary
解决:
。 使用IBGP全互联
。 设计一个路由反射器模型。
router bgp 109
neighbor x、x、x、x route—reflector-client
。 设计一个聪明模型
(4)向IBGP/EBGP邻接传播一条IBGP路由得问题
一条BGP路由只有首先通过IGP或静态路由获得后才就是同步得。
show ip bgp命令得输出显示了BGP表中得不同步路由。
3、排除路由没有装入IP路由选择表中得故障
原因:
(1)IBGP原因
。 IBGP路由不同步
。 BGP下一跳不可达
(2)EBGP原因
. 在多跳EBGP情况下BGP下一跳不可达
。 BGP路由被抑制
. 多出口鉴别器(MED)值为无穷
4、BGP下一跳不可达
解决:
。 使用静态路由或再分布经由IGP宣告EBGP下一跳
router ospf 1
network x、x、x、0 0。0.0、255 area 0
。 使用next—hop—self命令将下一跳改变为一个内部对等实体地址
router bgp 109
router ospf x、x、x、x next-hop-self
4、BGP路由被抑制
抑制(dampening)就是减小本地BGP网络中来自EBGP邻居得不稳定BGP路由所引起得不稳定性得方法。
抑制就是一种为一条翻动得BGP路由指派一个罚点得方法。
router bgp 109
bgp dampening
展开阅读全文