资源描述
1、 例行维护介绍
设备稳定运行首先依靠于完备网络计划,其次,经过日常维护和监测发觉设备运行隐患也是很必需。
2、 设备环境检验
设备运行环境正常是确保设备正常运行前提。
No.
检验项
评定标准和说明
1
机房温度情况
长久工作环境温度:0℃~45℃;短期工作环境温度:-5℃~55℃。
机房长久工作环境相对湿度应在5%RH~85%RH之间,不结露;短期工作环境相对湿度应在0%RH~95%RH之间,不结露。
若机房环境温度长久不能满足要求,应考虑检修或更换机房空调系统。
若机房相对湿度过大,应考虑为机房安装除湿设备;若机房相对湿度过小,应考虑为机房安装加湿设备。
说明:
短期工作条件是指连续不超出48小时和每十二个月累计不超出15天。具体设备温度规格要求请参见《S7700&S9700智能&关键路由交换机 硬件描述》
2
清洁情况
全部项目全部应洁净整齐无显著尘土附着。
注意防尘网清洁情况,立即清洗或更换,以免影响机柜门及风扇框通风、散热。
3
散热情况
设备正常工作时,要求保持风扇正常运转(清理风扇期间除外),私自关闭风扇会引发设备温度升高,并可能损坏单板。
不要在设备子架上通风口处放置杂物,还应定时清理风扇防尘网。
4
线缆布放
电源线和业务线缆分开布放。电源线布放整齐、有序。业务线缆布放整齐、有序。
5
线缆标签
线缆标签清楚、正确,符合规范。
6
机框散热
机框进风口没有过多灰尘堵塞,不影响设备正常散热。假如防尘网上灰尘较多,需要立即清洗。机框防尘网清洗提议一季度进行一次。
3、 设备基础信息检验
检验设备基础信息,如软件版本、补丁信息、系统时间等是否正确。
No.
检验项
检验方法
评定标准
1
设备运行版本
<Quidway> display version
单板PCB版本号、软件版本号和要求相符。
2
检验软件包
<Quidway> display startup
设备正在使用及下次开启时将要加载产品版本软件和配置文件文件名正确。
3
License信息
<Quidway> display license
License文件已经激活,且“Expired date”为“PERMANENT”(即永久有效)或在运行截至日期之内。
4
检验补丁信息
<Quidway> display patch-information
补丁文件必需和实际要求一致,提议加载华为企业公布该产品版本对应最新补丁文件。
补丁必需已经生效,即补丁总数量和正在运行补丁数量一致。
5
检验系统时间
<Quidway> display clock
时间应和当地实际时间一致(时间差小于5分钟),便于故障时经过时间正确定位。
假如不合格,请实施clock datetime命令修改系统时间或配置NTP同时网络时间。
6
CF卡中文件
<Quidway> dir cfcard:
CFcard里文件全部必需是有用,不然请实施delete/unreserved命令删除。
<Quidway> dir slave#cfcard:
7
检验配置正确性
<Quidway> display current-configuration
经过查看目前生效配置参数,验证设备配置是否正确。
8
检验debug开关
<Quidway> display debugging
设备正常运行时debug开关应该全部关闭。
9
检验配置是否保留
<Quidway> compare configuration
业务配置正常后,要进行保留。运行配置需要和保留过配置相同。
4、 设备运行检验
检验设备运行情况,如单板运行状态、设备复位情况、设备温度等是否正常。
No.
检验项
检验方法
评定标准
1
单板运行状态
<Quidway> display device
关键关注单板在位信息及状态信息是否正常,当显示以下信息时表示为正常。
单板“Online”为“Present”。
单板“Power”为“PowerOn”。
单板“Register”为“Registered”。
单板“Status”为“Normal”。
2
风扇状态。
<Quidway> display fan
Status为normal表示正常。
3
电源状态。
<Quidway> display power
state项为supply时表示正常。
4
主用板/备用板备份状态。
<Quidway> display switchover state
主备板同时存在时,要同时有主备板显示状态信息。倒换完成,设备开始正常工作后,主用板需要显示为“realtime or routine backup”表示正常。
5
FTP网络服务端口
<Quidway> display ftp-server
不使用FTP网络服务端口要关闭。
6
告警信息
<Quidway> display alarm all
无告警信息。
假如有告警,需要统计,对于严重以上告警需并立即分析并处理。
7
CPU状态
<Quidway> display cpu-usage
各模块CPU占用率正常。假如CPU占用率假如超出80%,提议关键关注。
8
内存占用率
<Quidway> display memory-usage
内存占用情况正常,假如“Memory Using Percentage”超出60%时需要关注。
9
日志信息
<Quidway> display logbuffer
不存在异常信息。
<Quidway> display trapbuffer
5、 端口内容检验
检验设备端口信息,如端口协商模式、端口配置、端口状态等是否正确。
No.
检验项
检验方法
评定标准
1
端口错包
<Quidway> display interface
业务运行时,要检验端口有没有错包,包含CRC错包等。
2
端口协商模式
<Quidway> display interface
端口协商模式正确,两边端口要一致,不能有半双工模式。
3
端口配置
<Quidway> display current-configuration interface
接口配置项合理,如接口协商模式、速率、隔离、限速等。
4
端口状态
<Quidway> display interface brief
端口Up/Down状态满足计划要求。
5
端口统计数据
实施display ip interface 命令。分两次隔5分钟后搜集数据,然后比较。
正常情况下,两次数据没有增加,且基数小于500。
6、 业务检验
检验设备运行业务是否正常。
1
组播组员接口和路由器接口信息
<Quidway> display igmp-snooping port-info
静态组员接口、动态组员接口、静态路由器接口和动态路由器接口信息正确。
2
组播报文统计信息
<Quidway> display igmp-snooping statistics vlan
VLAN接收/发送IGMP报文和PIM Hello报文个数,和全部VLAN内发生二层事件次数统计合理。
3
组播转发表信息
实施display l2-multicast forwarding-table命令查看二层组播转发表项。
组播转发表项正确。
实施display multicast forwarding-table命令查看三层组播转发表项。
4
组播路由协议
实施display multicast routing-table命令。
域内组播路由协议采取PIM-SM。
和组播相连接口全部必需要使能IGMP。
5
DHCP Snooping绑定表
<Quidway> display dhcp snooping user-bind all
静态表项和动态表项正确。
6
MAC地址表信息
<Quidway> display mac-address
MAC地址表信息正确。
7
路由表信息
<Quidway> display ip routing-table
含有默认路由或其它正确路由,便于故障时候能够远程定位。
对于处于一个网络中同一层次设备,假如运行相同路由协议,各设备上路由条目应该相差不大(因为静态路由配置差异,路由条目上可能存在一定差异)。
8
OSPF错包情况
实施display ospf error命令。分两次隔5分钟后搜集数据,然后比较。
正常情况下,两次数据没有增加。
9
VRRP状态
实施display vrrp命令。
“State”不为“Initialize”状态。
实施display vrrp statistics命令。
备份组中设备VRRP状态“State”不能同时为“Master”。
“Checksum errors”、“Version errors”和“Vrid errors”为零。
10
防攻击检测
实施display current-configuration |include car命令。
应该有防攻击配置。
假如未配置,请使用car命令为设备配置防攻击功效。具体步骤请参见《S7700&S9700 智能&关键路由交换机配置指南-安全》中“本机防攻击配置”。
11
MSTP状态
实施display stp brief命令。
指定端口和根端口“STP State”为“FORWARDING”。
备份根端口“STP State”为“DISCARDING”。
12
MST域配置信息
实施display stp region-configuration命令。
查看交换机上目前生效MST域配置信息。
输出内容包含:域名、域修订等级、VLAN和生成树实例映射关系和配置摘要。
13
MSTP拓扑改变
实施display stp topology-change命令。
查看MSTP拓扑改变相关统计信息。
假如设备拓扑改变次数递增,则能够确定网络存在震荡。
14
TC/TCN报文收发计数
实施display stp tc-bpdu statistics命令。
查看实例端口TC/TCN报文收发计数。
15
LDT环路检测
实施display loop-detection命令。
LDT功效配置正常情况下:
实施display loop-detection [ interface{ interface-type interface-number |interface-name }]
“Following ports are block for loop”、“Following ports are shutdown for loop”下无故口,证实开启环路检测VLAN中没有出现环路。
端口“Status”为“Normal”,证实该端口所属VLAN没有出现环路。
16
OSPF邻居状态
实施display ospf peer命令。
OSPF邻居状态:
IS-IS邻居状态
实施display ospf peer last-nbr-down命令。
邻居状态“State”为“Full”。
BGP邻居状态
实施display isis peer 命令。
正常情况下,要求该邻居建立时间不应该小于一天。
实施display bgp peer命令。
正常情况下,没有邻居down掉。
IS-IS邻居状态:
邻居状态“State”为“Up”。
BGP邻居状态:
邻居状态“State”为“Established”。
17
路由信息
实施display ip routing-table命令。和前一次统计路由信息比较,检验是否由显著改变。
正常情况下,路由表中有默认路由。
并可抽样对其中路由项进行ping或tracert操作。
对于处于一个网络中同一层次设备,假如运行相同路由协议,各设备上路由条目应该相差不大(因为静态路由配置差异,路由条目上可能存在一定差异)。
18
OSPF Router ID
实施display current-configuration configuration ospf或display router id命令。
指定Router ID为Loopback口地址。
如未分配Loopback口地址,则要指定为上行口地址或其它Down掉概率最小接口地址。
配置Router ID必需和OSPF正在使用Router ID一致。
19
OSPF路由引入配置
实施display current-configuration configuration ospf命令。
尽可能使用network公布路由,也能够经过import方法引入路由。
20
OSPF虚连接
实施display ospf vlink命令。
不许可使用虚连接。
21
OSPF STUB区域
实施display current-configuration configuration ospf命令。
STUB区域,不能有import-route命令。
22
BGP路由公布
实施display current-configuration configuration bgp命令。
除了VPN路由,严禁采取import-route命令公布IP路由。
应使用network命令和ip route-static ip-address { mask | mask-length } null0命令手工聚合路由后再静态公布。
23
IBGP邻居
实施display current-configuration configuration bgp命令。
基于协议稳定性考虑,提议使用Loopback这类状态总为UP接口建立邻居关系。
24
ISIS 路由引入
实施display current-configuration configuration isis命令。
尽可能使用network-entity公布路由,也能够经过import方法引入路由。
25
VLAN信息
实施display vlan命令。
查看全部VLAN基础信息。
展开阅读全文