1、单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,1,网络故障诊断,网络故障诊断以网络原理、网络配置和网络运行知识为基础,从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,恢复网络正常运行。,了解网络的拓扑结构,了解网络使用的协议及相关配置,了解网络操作系统的配置情况,网络诊断前提,2,网络故障诊断的方法,对比法,替换法,排除法,网络故障诊断方法,错误测试法,最小系统法,3,一、对比法,1.,定义:,利用相同型号的计算机
2、设置相同的参数。在设备发生故障的时候,参考相同设备的配置可以帮助网络管理员快速准确地解决问题。,2.,在采用对比法的时候,应该遵守以下原则:,只有在可以找到与发生故障的设备相同或类似的其他设备的条件下,才可以采用对比法。,在对网络配置进行修改之前,要确保现用配置文件的可恢复性。,在对网络配置进行修改之前,要确保本次修改产生的结果不会造成网络中其它设备的冲突。,4,一、对比法,3.,采用对比法的一般步骤,故障提出,故障定位,解决问题,配置故障设备,参考相近设备配置,5,二、替换法,1.,定义:,在对故障进行定位后,用能够正常工作的设备替换可能有故障设备,如果可以通过测试,那么故障也就解决了。,
3、2.,在采用硬件替换法的时候,需要遵守以下原则:,故障定位所涉及的设备数量不能太多。,确保可以找到能够正常工作的同类设备。,每次只可以替换一个设备。,在替换第二个设备之前,必须确保前一个设备的替换已经解决了相应的问题。,6,二、替换法,3.,采用硬件替换法的一般步骤,故障提出,故障定位,解决问题,测试结果,设备替换,7,三、错误测试法,1.,定义:,错误测试法是一种通过测试而得出故障原因的方法。,2.,在采用错误测试法的时候,需要遵守以下原则:,在更改设备配置之前,对原来的配置做好记,录,以确保可以将设备配置恢复到初始状态。,如需对用户的数据进行修改,必须事先备份用户数据。,确保不会影响其他网
4、络用户的正常工作。,每次测试仅做一项修改,以便知道该次修改是否能够有效解决问题。,8,三、错误测试法,3.,采用错误测试法的一般步骤,故障提出,故障定位,解决问题,测试结果,错误测试,9,四、排除法,在收集故障信息的基础上,对可能的故障原因进行分析,并通过测试、验证等方法逐步排除故障原因,缩小故障点所在区域。,基本流程:,故障信息收集,提出,故障提出,定位故障点,提出,故障原因排除,提出,故障原因,分析,10,五、最小系统法,将现有网络系统缩减为最小可用系统,并测试最小系统的可用性,然后逐渐增大系统规模,逐步确定故障点,基本流程:,最小可用系统,故障提出,定位故障点,增大系统规模,系统测试,系
5、统测试,11,处理开始,处理结束,了解故障现象,收集信息,故障判断,故障排除,判断故障可能原因,检测排除可能原因,故障是否解决,故障是否解决,是,否,否,是,辅诊断过程,主诊断过程,网络故障诊断步骤,12,网络诊断工具,网络故障的定位和排除,既需要长期的知识和经验积累,也需要一系列的软件和硬件工具,数字电压表,网络测试仪,硬件工具,网络诊断工具,软件工具,电缆测试仪,光时域反射计,操作系统诊断工具,数字电压表,网络测试仪,ping,arp,tracert,netstat,nslookup,ipconfig,13,硬件工具,1.,数字电压表,使用电压表可以确定:,电缆是否连接,(,是否有断路,)
6、电缆是否可以运载网络通信量,同一电缆的两个部分是否暴露和接触,(,因而造成短路,),电缆的暴露部分是否触及了另一个导体,如金属表面,14,硬件工具,2.,网络测试仪,网络测试仪,是一种可以检测,OSI,模型定义的物理层、数据链路层、网络层运行状况的便携、可视的智能检测设备,主要适用于局域网故障检测、维护和综合布线施工中,网络测试仪的功能涵盖物理层、数据链路层和网络层。,15,硬件工具,3.,光时域反射计(,OTDR,),OTDR,可以测试光纤链路的传输特性,OTDR,可以从所接收到的信号中计算出被测光缆的信号衰减、响应时间和信号传播速度等特性参数,这些参数可以准确的指示衰减源(如光缆接头、连
7、接器或光缆)的确切位置,16,硬件工具,4.,电缆测试仪,电缆测试仪用于检测电缆故障,17,软件工具,1,、网络监视器,网络监视器是一种软件工具,用于采集网络,数据流并提供数据分析能力。检查数据包并收集有关数据包类型、错误和每台计算机传入和传出的数据包通信量等信息。,2,、协议分析器,采用数据包捕获、解码和传输数据的方法实时地分析网络通信量,常用工具,Sniffer,NetXray,Ethereal,18,操作系统诊断工具:,ipconfig,ipconfig,命令语法格式,ipconfig,的参数介绍,19,-?,:显示,Ipconfig,的格式和参数的英文说明。,-all,:显示所有的,I
8、P,地址的配置信息。,-release,:释放指定的网络适配卡的,IP,地址。,-renew,:刷新配置。,-,flushdns,:刷新和重置客户机解析程序缓存。,-,displaydns,:显示和查看客户机解析程序缓存,-,registerdns,:续订,DNS,客户注册。,-,showclassid,:在客户机上显示,DHCP,类别,ID,信息,-setclassid,:客户机上设置,DHCP,类别,ID,信息,。,Ipconfig,命令的参数概述,20,ipconfig,21,操作系统诊断工具:,ping,在命令提示符下键入,ipconfig-,?可获得,ipconfig,的使用帮助,P
9、ing,命令语法格式,Ping,的参数,介绍,22,Ping,的参数介绍,-t,:,不间断地,Ping,指定地址,,ctrl+c,中断。,23,-a,:将地址解析为计算机名。,ping,a 172.16.0.135,和,ping 172.16.0.135,不同,Ping,的参数介绍,24,-n count,:发送,count,指定的,Echo,(空)数据包数,。,在默认情况下,,Ping,将发送,4,个数据包,通过这个参数,可以定义发送的个数。,Ping,的参数介绍,25,-l size,:指定发送到目标主机的数据包的大小,在默认的情况下,Windows,的,Ping,发送的数据包大小为,32
10、byte,,可以自定义大小,最大发送,65500byte,。,Ping,的参数介绍,26,-r count,:在“记录路由”字段中记录传出和返回数据包的路由(,valid range is from 1 to 9,),Ping,的参数介绍,27,-s count,:,count,指定的跃点数的时间。,此参数和,-r,差不多,只是这个参数几乎不记录数据包返回所经过的路由,最多也只记录,4,个。,Ping,的参数介绍,28,Ping,命令常见反馈信息,1.Unknown host,(未知主机),该远程主机的名字不能被命名服务器转换成,IP,地址。故障原因是域名服务器有故障,或者其名字不正确。,2.
11、Destination host unreachable,(目的主机不可达),本地系统没有可达目的网络的路由,3.No answer,(无响应),本地系统有一条可用路由,但却接收不到目的主机的任何反馈报文。故障原因可能是下列之一:中心主机没有工作;本地或中心主机网络配置不正确;本地或中心的路由器没有工作;通信线路有故障;中心主机存在路由选择问题。,4.Time out,(数据包超时),故障原因可能是到路由器的连接问题或路由器不能通过,也可能是目的主机已经关机或死机。,5.Source Quench Received,对方或中途服务器繁忙而无法回应。,29,30,操作系统诊断工具:,Tracer
12、t,Tracert,命令语法格式,Tracert,的,参数介绍,-d,:指定不将地址解析为计算机名。,-h maximum_hops,:指定搜索目标的最大跃点数。,-j host-list,:指定沿,host-list,的稀疏源路由。,-w timeout,:每次应答等待,timeout,指定的毫秒数。,target_name,:目标计算机的名称。,31,Tracert,命令使用,32,操作系统诊断工具:,Netstat,Netstat,命令语法格式,Netstat,的参数,介绍,33,Netstat,Netstat,命令显示有关统计信息和当前,TCP/IP,网络连接的情况,TCP,连接,计算
13、机侦听的端口,以太网统计信息,IP,路由表,IPv4,(对于,IP,、,ICMP,、,TCP,和,UDP,协议)统计信息以及,IPv6,(对于,IPv6,、,ICMPv6,、通过,IPv6,的,TCP,以及通过,IPv6,的,UDP,协议)统计信息,34,Netstat,参数使用,使用时如果不带参数,,Netstat,显示活动的,TCP,连接,。,Proto,:协议的名称,(TCP,或,UDP),。,Local Address,:本地计算机的,IP,地址和正在使用的端口号。,Foreign Address,:连接该插槽的远程计算机的,IP,地址和端口号码。,State,:表明,TCP,连接的状
14、态。,35,Netstat,参数使用,-a,:显示所有活动的,TCP,连接以及计算机侦听的,TCP,和,UDP,端口,36,Netstat,参数使用,-e,:显示所有以太网统计信息,37,Netstat,参数使用,-r,:显示本机路由表,38,操作系统诊断工具:,nslookup,nslookup,命令一般是用来确认,DNS,服务器动作的,使用方法:,在,DOS,命令行下输入,nslookup,,敲击回车,此时标识符变为,,然后键入制定网站的域名,再敲击回车就可以显示该域名的相对应的,IP,地址。,39,操作系统诊断工具:,arp,arp,命令语法格式,arp,的参数,介绍,40,arp,的参
15、数介绍,-a,:列出当前,ARP,表中的所有条目;,-d,:,host,从,ARP,表中删除某个主机的对应条目;,-s,:,host address,使用以太网地址在,ARP,表中为指定的,temppubtrail,主机创建一个条目。如果包含关键字,temp,,创建的条目就是临时的;否则这个条目就是永久的。,pub,关键字标识这个,ARP,条目将被公布。使用,trail,关键字表示将使用报尾封装;,-f,:,file,读一个给定名字的文件,根据文件中的主机名创建,ARP,表的条目。,41,分层故障诊断,1,物 理 层,2,数据链路层,5,应用层,3,网 络 层,4,传输层,42,物理层故障诊断
16、物理层的故障主要表现在设备的物理连接方式是否恰当,连接电缆是否正确,,Modem,、,CSU/DSU,等设备的配置和操作是否正确,信号衰减,噪声干扰,物理组件,物理层故障,解决方法,信号放大整形,抵消与屏蔽、良好端接和接地,按标准规范进行端接,解决方法,解决方法,43,分类,故障,双绞线故障,近端串扰未通过、衰减未通过、接线图未通过、长度未通过,同轴电缆故障,间歇性地出现网络连接丢失、整个网络完全失效、间歇性或经常性出现冲突和碎片、在安装了新电缆段后失去网络连接或间歇性地出现连接中断、过度冲突、严重噪音干扰,光缆故障,光纤头,(,尾纤,),是符合规范的,但网络无连接;无连接或出现间歇性的连接
17、故障;光线布线后与网络中心点无连接;光纤收发器无连接,中继器故障,中继器不能工作;定位冲突域;超时传输锁定机制,集线器故障,集线器不能工作;帧间距过短造成的数据信号丢失;集线器的接地问题;传输路径上集线器过多;在,“,网上邻居,”,或,“,资源管理器,”,中只能找到本机的机器名.,调制解调器故障,调制解调器正常,但不工作;调制解调器只能呼出,不能呼入;调制解调器不能工作,物理层故障分类,44,数据链路层故障诊断与排除,网卡故障,网桥故障,交换机故障,数据链路层故障,数据链路层传送以帧为单位的数据,设备有网卡、网桥、交换机,45,网卡的故障主要有两类,即软故障和硬故障,硬故障,即硬件本身损坏,一
18、般来说需要更换硬件,软故障,即指网卡硬件本身并没有坏,通过升级软件或修改设置仍然可以正常使用,网卡被误禁用,驱动程序未正确安装,与系统中其他设备冲突,网络协议未安装,病毒影响,网卡的故障诊断与排除,46,1,.,故障现象:上不了网,解决方法:,(1),用,ping,命令,ping,网卡本身的,IP,地址。如果正常就说明当前的网卡安装正确。,(2),如果,ping,局域网中其他计算机的,IP,地址时不通,则可能是其他计算机当前没有开机或网络连线有问题。,(3),如果这些原因都被排除了,那么很有可能就是网卡和网络协议没有安装好。,(4),网卡硬件损坏,或者网卡质量不过关。,(5),网线、跳线或插座
19、故障。,(6)UPS,电源故障。,网卡常见故障现象,1,47,2.,故障现象:网卡已正常工作,但不能和外界进行通信,这种故障现象不容易发现其原因,因为系统无任何错误的提示信息。,解决方法:,检查网络线路有没有问题。,检查网卡的资源部分,(,检查中断号,输入,/,输出范围为,0300-031F),。,检查设备端口,(,检查中断号是否被占用,如果已被占用,则和网卡中断号发生冲突,),。,网卡常见故障现象,2,48,3.,故障现象:网卡出现无反应的现象,可能的原因和解决方法:,网卡是否松动,?,(2),驱动程序是否更新,?,(3)CMOS,设置是否正确,?,(4),网络参数是否正常,?,(5),网线
20、的线序是否正确,?,在制作网线时,不能忽视网线的线序,(568A?568B?),网卡常见故障现象,3,49,4.,故障现象:网卡的信号指示灯不亮,解决方法:网卡的信号指示灯不亮一般是由网络的软件故障引起的。,(1),检查网卡设置,(2),检查一下网卡驱动程序是否正常安装。,(3),检查网络协议,网卡常见故障现象,4,50,网桥的,故障,吞吐量不足:通过测试网桥的吞吐量和实际的吞吐量来选择线路,数据帧丢失:因此要求选择的网桥缓存数据包的时间不能过短。,网桥不工作,网桥信号指示灯不亮,网桥数据能通,但有丢包:线路有误码或LAN口网线做法不规范,。,网桥LINK指示灯灯不亮,指示灯正常,但数据pin
21、g不通:物理连接正常。只有网络存在问题。,安装不当,配置差错,端口未被激活,支路没有使用,支路接口接反,支路松动,支路损坏,以太网接口没有使用,以太网接口松动,检查以太网连接,网桥常见的故障诊断与排除,51,交换机故障,硬件故障,端口故障,模块故障,背板故障,线缆故障,电源故障,软件故障,系统错误,配置不当,密码丢失,外部因素,交换机故障的分类,52,交换机故障排除方法,由远及近,检查沿客户端计算机,-,端口模块,-,水平线缆,-,跳线,-,交换机的线路,逐个检查,排除远端计算机故障的可能,由外而内,从外部指示灯上辨别,由软到硬,先排查系统配置或系统软件,不能解决,在检查硬件,先易后难,先从简
22、单操作或配置着手排除,53,网络层故障诊断,排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,(,静态路由、动态路由,),,同时检查路由器接口的,IP,地址。,网络层路由器故障,网络层硬件故障,网络层连通性故障,网络层故障,54,网络层路由器故障,串口,接口故障,以太接口,异步通信口,协议故障,OSPF,BGP,物理故障,开箱无法使用,安装后无法使用,使用中故障,路由器故障,55,路由器接口故障:串口故障排除,串口出现连通性问题时,为了排除串口故障一般是从,show interface serial,命令开始,分析它的屏幕输出报告内容,找出问题所在,检查接口和线路协议状态,检
23、查信息包丢失情况,56,以太接口的典型故障问题是:带宽的过分利用、碰撞冲突次数频繁、使用不兼容的帧类型。,使用,show interface ethernet,命令可以查看该接口的吞吐量、碰撞冲突、信息包丢失、和帧类型有关的内容等。,路由器接口故障:以太口故障排除,57,异步通信口故障一般的外部因素是,:,拨号链路性能低劣、电话网交换机的连接质量问题、调制解调器的设置。,show interface async,命令、,show line,命令是诊断异步通信口故障使用最多的工具,路由器接口故障:异步通信口故障排除,58,路由协议故障分析:,OSPF,OSPF,路由协议故障信息的搜集,序号,检查
24、内容,检查方法,备注,1,OSPF,邻居状态,Quidway display ospf peer,2,OSPF,邻居协商错误统计,Quidway display ospf error,3,运行,OSPF,的接口信息,Quidway display ospf interface,4,OSPF LSDB,信息,Quidway display ospf lsdb,5,OSPF,协议调试信息,debug ospf packet,将一段时间(建议,3,5,分钟)的调试信息记录为一个文件,59,BGP,路由协议故障信息的搜集,序号,检查内容,检查方法,备注,1,BGP,邻居状态,Quidway displ
25、ay bgp peer,2,邻居之间的,TCP,可达性,Quidway ping-a soure-ip distonation-ip,源,/,目的地址之间应该可以,ping,通,3,BGP,路由表信息,Quidway display bgp routing-table,发源自本地的路由信息下一条为,0.0.0.0,4,BGP,协议调试信息,debug bgp all,将一段时间(建议,3,5,分钟)的调试信息记录为一个文件,路由协议故障分析:,BGP,60,路由器物理故障的分析定位,开箱即无法使用,处理步骤:,(,1,)可先对接口卡或主板上的器件进行检查,看有无器件脱落或被压变形,对,Boot
26、Rom,或内存条的插座也要重点检查,看有无插针无法弹起。,(,2,)对,PCI,侧的插针、物理接口,(,包括电缆,),的插针进行检查,看是否有弯针。,(,3,)当没有查到上述硬件故障后,可更换或升级,BootRom,、内存条或主机驱动程序的版本。,61,安装后无法正常使用,线路连接问题,如线路阻抗不匹配、线序连接错误、中 间传输设备故障,与其他设备配合有问题,接口配置问题,电源或接地不符合要求,在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素,路由器物理故障的分析定位,62,使用过程中发生故障,电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏,传输线受到干扰,
27、中间传输设备故障,环境的温湿度、洁净度、静电等指标超出使用范围,在故障定位的过程中,可把不必要的相连设备先去掉,缩小故障定位的范围,从而有利于快速准确地定位故障,路由器物理故障的分析定位,63,网络层硬件故障,硬件故障产生的原因,线路中存在自环设置:硬件自环和软件自环。,解决方案,使用 show running-config命令查看端口设置中是否有loopback设置,若存在 loopback设置,用no loopback去掉此设置,若不存在 loopback设置,检查CSU/DSU是否存在自环设置,如果认为是路由器硬件故障,更换端口进行测试,64,路由器硬件故障排除流程,连续循环启动,并伴随
28、错误消息,物理移除所有网络模块,并打开路由器电源,路由器是否仍然,循环重新启动,故障原因可能是网络模块,或机箱中的插槽。每次安装,一个网络模块,并在每次,安装后重新启动路由器,路由器是否仍然,循环重新启动,尝试将网络模块换到其他,插槽,用于确定故障发生,在网络模块还是插槽自身,路由器是否仍然,循环重新启动,更换机箱,更换该网络模块,更换路由器内存,问题仍然出现时替换机箱,尝试下一个网络模块,直至找到发生故障模块,65,网络层连通性故障表现,网络层连通性故障通常表现为以下几种情况,计算机无法登录到服务器,计算机无法通过局域网接入,Internet,计算机在“网上邻居”中只能看到自己,而看不到其他
29、计算机,从而无法使用其他计算机上的共享资源和共享打印机,计算机无法在网络内实现访问其他计算机上的资源,网络中的部分计算机运行速度十分缓慢,66,网络层连通性故障原因,网络层连通性故障的原因:,网卡未安装,或未安装正确,或与其他设备有冲突,网卡硬件故障,网络协议未安装,或设置不正确,网线、跳线或信息插座故障,HUB,电源未打开,,HUB,硬件故障,或,HUB,端口硬件故障,UPS,电源故障,67,网络层连通性故障的排除方法,确认网络层连通性故障,LED,灯判断网卡的故障,Ping,命令排除网卡故障,在确定网卡和协议都正确的情况下,如果网络还是不通,可初步断定是,HUB,和双绞线的问题。,如果确定
30、交换机、,HUB,有故障,应首先检查交换机、,HUB,的指示灯是否正常。,如果交换机、,HUB,没有问题,则检查计算机到交换机、,HUB,的那一段双绞线故障和所安装的网卡。,通过上面的故障检测,就可以判断故障出在网卡、双绞线还是交换机、,HUB,上。,68,传输层及应用层诊断,传输层故障表现在端口配置错误,访问控制列表不正确。诊断可以用专门的工具对其传输数据流进行监测和分析。,应用层则重点检查网络浏览器设置是否正确,是否安装了杀毒软件、操作系统是否更新补丁等,69,服务器故障诊断,服务器:指管理资源并为用户提供服务的计算机软件,或运行以上软件的计算机或计算机系统。,刀片式,架构,机架式,塔式,
31、CISC,RISC,硬件配置,工作组级,企业级,部门级,入门级,应用软件,网络,打印,Web,文件,E-mail,FTP,操作系统,Windows,Unix,Linux,服务器类型划分,70,服务器故障排除所需的信息,机器型号,服务器信息,机器序列号,BIOS,版本,是否有其他设备,硬盘配置,故障信息,屏幕显示,指示灯,报警,代码表,事件记录文件,故障现象,开机无显示,自检故障,系统加载故障,所需信息,操作系统及版本,系统运行故障,71,服务器故障可能原因,服务器的软件故障,服务器硬件故障,网络服务故障,操作系统故障,服务器故障可能性分析,72,导致服务器软件故障的因素:,服务器,BIOS,版
32、本太低,服务器的管理软件或驱动程序有,Bug,应用程序有冲突,人为(非正常关机、不按操作流程操作),软件升级、病毒导致的停止运行,服务器软件故障排除:,经常对,Firmware,及,BIOS,更新,服务器软件更新、升级,人为因素操成的故障,可通过正确使用培训解决,服务器的软件故障,73,操作系统故障,导致服务器操作系统故障的因素:,病毒侵袭,磁盘空间太小,垃圾文件过多,蓝屏故障,服务器操作系统故障解决方法:,防范病毒,服务器只提供网络服务、关闭不需要服务,安装系统补丁、安装病毒防火墙,系统留有足够多的剩余空间,定期执行“磁盘清理”,74,服务器硬件故障,导致服务器硬件故障的因素:,服务器内部散
33、热受阻,硬件损耗,接触不良,硬件故障不单指硬件问题,也指硬件不兼容,非人为干预情况下,硬件故障可能性小。通常在安装新板卡、修改系统配置或扩容后发生。,75,网络服务故障,导致服务器网络服务故障的因素:,操作系统,Bug,应用程序缺陷,内存质量,硬件可靠性,服务器网络服务故障解决方法:,查看系统日志,重新启动服务,重新启动计算机,重新安装服务或应用程序,76,服务器常见故障与解决方法,1,、故障现象:服务器无法启动,解决方法:,准备一个跳线帽,检查电源线和各种,I/O,接线是否连接正常,检查连接电源线后主板是否加电,将服务器设为最小配置,看是否能够启动,市电或电源线故障,(,断电或接触不良,),
34、电源或电源模组故障,CPU,故障(一般伴有报警声),主板故障,其他插卡造成中断冲突,77,服务器常见故障与解决方法,2,、故障现象:开机自检无法通过,解决方法:,准备一个跳线帽,切断机器电源,打开机箱,将,CMOS CLEAR,跳线的另两个针短接用跳线帽,机器加点,自检,完毕后关掉电源,将跳线复原,重新开机,78,无线网络故障诊断,无线局域网络,WLAN,(,Wireless Local Area Network,)以无线信道作传输媒介的计算机局域网,无线传输媒介,无线电波,光波,超短波,短波,微波,激光,红外线,无线网络类型,无线广域网络,无线城域网络,无线局域网络,无线个域网络,79,无线网络的互连设备,无线网络互连设备,以太网桥接器,(Ethernet Bridge),无线网卡(,Client Adapter,),无线局域网接入点,(Access Point,),无线宽带路由器,(Wireless Router),无线交换机,(Wireless Switch,),80,无线网络故障诊断方法,无线网络故障通常表现为连接困难、通信困难、掉线等,可能故障原因,环境因素,人为因素,设备因素,诊断一般方法,是否是硬件故障,接入点的连通性测试,信号强度测试、频道选择,设备配置,






