1、长春电信通信应急保障预案目录:一)紧急情况的定义.2二)故障解决规定.2三)现场解决规定.3四)应急处置原则.4五)应急处置工作规范.5六)应急处置保密制度.5七)故障上报规定.5八)故障上报范围.6九)故障上报时间.6十)应急处置流程.7十一)应对节假日和重大社会活动及自然灾害的安全预案.8一、紧急情况的定义紧急情况是指移动网发生重大通信故障,碰到自然灾害,网络严重超负荷、经历重大社会活动等。重大通信故障:凡因违章操作、突发事故导致通信大面积中断或计费营帐系统大范围差错,引起大量用户集中投诉,导致重大经济损失和不良社会影响的故障。自然灾害:如台风、雷电、地震、洪水等。网络严重超负荷:凡系统负
2、荷和网络负荷超过正常指标并导致网络通信质量大幅度下降等情况。重大社会活动:国家法定的公众长假及党和政府召开的全国重要会议或其他重要展览等。二、故障解决规定各级运营维护部门的首要目的为恢复通信,尽全力缩短故障历时。各级运营维护部门应遵循先抢通、后分析,先局内、后局外,先本端、后对端,先互换(无线)、后传输的原则进行解决。各级运营维护部门必须尽快采用有效措施解决故障,同时应立即逐级上报上级主管部门,在特殊情况下可以越级上报,以便及时得到有效的技术支持和帮助。移动专业运营维护人员在解决故障时,未经上级运营维护部门批准,不得擅自对互换机、基站控制器、PDSN、AAA SERVER、DNS/NTPSER
3、VER等关键设备进行重启,以免导致更大范围的影响。移动专业运营维护人员在解决故障时,必须对现场各种告警信息、故障显示、故障记录报告等进行认真分析解决,一般应不影响正在通话的用户或任意扩大影响范围,并严格按照各设备厂商提供的故障诊断手册、设备操作手册等规定的命令和操作方法进行解决。三、现场解决规定1、各省分公司移动专业运营维护部门的首要目的为恢复通信,尽全力缩短障碍历时。2、各省分公司移动专业运营维护部门应遵循先抢通、后分析,先局内、后局外,先本端、后对端,先互换(无线)、后传输的原则进行解决。3、各地市分公司移动专业运营维护人员在进行现场解决时,未经各省分公司移动专业运营维护部门批准,不得擅自
4、对互换机及基站控制器进行重启,以免导致更大范围的影响。4、移动专业运营维护人员必须对现场各种告警信息、障碍显示、障碍记录报告等进行认真分析解决,一般应不影响正在通话的用户或任意扩大影响范围,并严格按照各设备厂商提供的障碍诊断手册、设备操作手册等规定的命令和操作方法进行解决。具体参考附件各设备厂商应急解决技术方案。5、各地市分公司移动专业运营维护部门在紧急情况发生时,除尽快采用有效措施进行解决外,还应立即逐级上报上级主管部门,在特殊情况下可以越级上报。对于各种无法解决的情况,应立即报告各省分公司移动专业运营维护部门,以便及时得到有效的技术支持和帮助四、应急处置原则统一指挥,协同作战。数据、关口局
5、及互联网业务应急小组应在省分应急领导机构领导、统一指挥下工作。碰到突发事件,应急小组应根据本预案规定和处置办法,认真履行各自职责,密切配合、协同作战,充足发挥整体效能。实时监控,加强防范。加强对数据、关口局及互联网业务网络的实时监控和防范,一方面要防止不法分子运用本网络进行破坏,另一方面要加强对本网络的监控力度,及早发现网络及系统隐患,提前做好应急处置工作。快速反映,控制事态。突发事件发生时,应急处置小组可以根据预案总原则,在迅速上报上级相关单位的同时,及时采用行之有效的措施,防止事态进一步扩展蔓延,将对网络和业务的损失和危害降至最小。全程记录,追查根源。发生紧急事故时,应急小组一方面要及时做
6、好事故情况记录,以便与各有关部门紧密配合,追查事故根源,并积极协助相关单位进行解决。定期交流,提高应急处置能力。急处置小组应定期召开应急处置工作交流会,定期通报各自的工作情况,及时总结、交流应急处置经验,提高自身应急处置能力。五、应急处置工作规范应急处置小组必须及时响应、解决各种网络应急事件,保证数据、关口局及互联网业务网络安全、畅通运营。工作时间内所有处置系统均保证正常工作,各工作人员按应急工作流程工作。保证各应急处置值班电话7X24小时的畅通,并认真进行电话记录工作。应急小组对所有解决的事件要有具体记录,并定期提交给上级应急领导小组。碰到不能鉴定或特殊情况,须及时向上级应急领导小组说明,由
7、上级协调相关单位进行解决。六、应急处置保密制度保证应急事件处置系统和信息数据存放于安全的网络环境中,并定期进行备份。保证相关文献、数据的保密性,非相关人员不得接触此类文献和数据。应急小组的信息交流必须保证安全性,防止因中间环节疏漏导致信息泄密。应急处置小组必须保证所提供的各种信息的准确性。七、故障上报规定故障上报流程采用三级管理方式,地市运营维护部门直接向省分运营维护部门报告,并由后者汇总后上报至总部移动通信业务部。各分公司必须严格按照规定期限执行。八、故障上报范围移动通信网现网使用的所有移动通信主备用设备均须属于报告的范围,涉及:TMSC、STP、MSC/SSP(ECP)、GMSC、HLR、
8、SCP、SMP、VC、BSC、BTS、OMC、DNS、NTP SERVER、PDSN、AAA SERVER、ROUTER、移动网管系统等。属于报告范围的传输电路,涉及:互联互通中继、省际长途中继、省内长途中继、局间中继、国际漫游电路等。属于移动通信网重大故障、严重故障和一般故障必须按照各自相关规定进行上报。导致移动通信网用户投诉增长的其它故障必须上报。九、故障上报时间重大故障:地市运营维护部门必须立即向省分运营维护部门上报,后者应立即上报至总部移动通信业务部并组织排障工作,重大故障自故障发生至上报到总部移动通信业务部的时间不得超过30分钟。故障排除后,应立即填写移动通信网故障上报表在24小时内
9、上报至总部移动通信业务部,5个工作日内上报具体的故障报告。同时每月将本月发生的重大故障进行汇总以月报方式上报总部移动通信业务部。严重故障:地市运营维护部门必须立即向省分运营维护部门上报,后者应立即组织排障工作,同时在60分钟内将最新情况上报至总部移动通信业务部。故障排除后,应立即填写移动通信网故障上报表在48小时内上报至总部移动通信业务部,同时每月将本月发生的严重故障进行汇总以月报方式上报总部移动通信业务部。一般故障:省分运营维护部门负责网络故障的解决、分析、记录,每月进行一次汇总并以月报方式上报总部移动通信业务部。十、应急处置流程发生紧急事件应急处置小组否是是否需要寻求帮助向省分相关部门寻求
10、支持问题解决决?否报省分相关部门记录并拟定事件级别记录解决解决事件恢复数据事件解决报告报告上级相关部门结束是一般事件严重事件寻求其它支持否十一、应对节假日和重大社会活动的安全预案重要节假日:春节、元旦、五一、十一 话务高峰节假日: 中秋节、圣诞节、重大社会活动:两会、3.15 、5.17国际电信日 、汽博会、农博会、奥运会、 亚冬会在节假日和重大社会活动期间,应当严格保证系统稳定运营,当有故障出现时应当及时恢复系统运营。由于很多相关人员都在此期间放假或如有问题时的社会及政治影响很严重,所以应当以节假日和重大社会活动前对系统的检查为主,并积极做好当故障时应急解决的准备工作,以便及时恢复系统稳定。
11、1、节假日和重大社会活动前的准备工作11节假日和重大社会活动前维护工作注意事项1、避免在节假日期间对系统进行复杂操作和升级任务。2、节假日前要组织人员对系统进行全面的健康检查和机房安全巡查,检查环节应当参照平常系统检查文档,如有也许的情况下可以邀请厂家工程师协助对系统进行检查和网络安全性分析。要保证在重要节假日前系统无任何隐患存在。如发现问题,应及时解决。如自行无法解决,应与厂家工程师联系解决。3、索取厂家工程师在节假日的值班表及联系方式。这可以保证当问题出现时,可以及时取得厂家的技术支持。并把联系表张贴在机房醒目的位置。4、定期检查远程拨入系统是否可用。通过拨号进入系统检测拨入系统是否可用。
12、如拨入不成功,检查调制解调器电源是否接通,面板灯是否正常,检查电话线是否可通。如都无问题,仍然无法拨入系统,与厂家联系检查系统配置是否有问题。春节、元旦等节日,要注意监控互换机解决器系统负荷、重要网元的信令负荷和重要局向的话务负荷。具体观测项目如下:1) 互换系统信令负荷观测MSC至HLR接口分析方法及应急方案:A) 负荷超过0.35,立即增长LINK数量。B) 如LINK数量已满配置,且负荷超过0.4,调整延长BSS 周期性位置登记及MSC中DETACH TIMER。C) 调整参数后,如LINK负荷仍超过0.4,并且引起LINK拥塞或HLR OVERLOAD,并引起大量呼喊失败,建议减小无线
13、覆盖。l MSC至MSC接口分析方法及应急方案:A) 负荷超过0.4,立即增长LINK数量。B) 如LINK满配置,如MSC之间有大量的切换消息,可删除MSC之间的切换关系,减少MSC之间的MAP信令负荷。(MSC之间的TUP/ISUP负荷一般不会很高)l MSC至BSC接口分析方法及应急方案:A) 负荷超过0.35,立即增长LINK数量。B) 如LINK数量已满配置,且负荷超过0.4,调整延长BSS 周期性位置登记及MSC 中DETACH TIMER,并取消鉴权。C) 调整参数后,如LINK负荷仍超过0.4,并且引起LINK拥塞或系统 OVERLOAD,减小无线覆盖。l MSC至PSTN接口
14、分析方法及应急方案:A) 负荷超过0.4,立即增长LINK数量。B) 负荷超过0.4,并无增长LINK也许,且LINK出现拥塞,通过两个G网及PSTN GATWAY 话务调整,均衡话务及LINK负荷。如无效,告知PSTN进行响应调整。C) 如PSTN无法进行调整,且出现LINK拥塞,则闭塞部分至PSTN话路,减小信令负荷。2) 重要中继局向每线话务观测l MSC至MSC接口分析方法及应急方案:A) 话务量每线ERL超过0.8,两侧增长中继传输,并根据GW至PSTN话务情况,调整SP至GW话务路由指向。B) 话务量每线ERL达成满负荷,且无增长中继传输也许,操作如下:1、在SP及GW中取消至PS
15、TN去话的话务迂回路由。2、在GW下闭塞至PSTN的部分中继。C) 在呼喊严重溢出情况下,可通过将GW至PSTN中继改为单向去话中继,闭塞PSTN来话,保证至PSTN去话,以减少MSC之间PSTN呼喊MS的话务量。l MSC至PSTN接口分析方法及应急方案:A) 话务量每线ERL超过0.8,两侧增长中继传输,并根据GW至PSTN话务情况,调整SP至GW话务路由指向。B) 话务量每线ERL达成满负荷,且无增长中继传输也许,告知ALCATEL技术人员,并密切观测系统运营情况。C) 在呼喊严重溢出情况下,可通过将GW至PSTN中继改为单向去话中继,闭塞PSTN来话,保证至PSTN去话。l MSC至B
16、SC接口 分析方法及应急方案:A) 话务量每线ERL超过0.8,两侧增长中继传输,并根据GW至PSTN话务情况,调整SP至GW话务路由指向。如话务量每线ERL达成满负荷,且无增长中继也许,减小无线覆盖。 12节假日期间系统故障出现时应急解决方案1) 通过拨测,判断是否是全业务中断。通过在互换机系统中进行trace或通过信令监测系统观查通话情况鉴定故障影响范围和故障限度。并记录故障出现的时间,中断业务的情况。2) 跟具故障上报规定及时将故障情况报告相关领导,视故障限度决定是否需要厂家技术支持人员提供现场技术支持。3) 根据附件中的紧急情况的定义,采用相应的措施。如出现宕机情况按照系统宕机应急解决
17、流程解决。4) 配合厂家工程师分析解决问题,如有必要启动远程拨入系统。启动方法即接通拨入系统的调制解调器电源。5) 记录问题的发生时间和有关情况13节假日期间防止互换设备宕机事故注意事项1) 节假日前应提前检查系统运营情况,做好平常系统检查工作,检查环节可以参照平常系统检查文档。2) 节假日期间要加强对机房温度、湿度和环境设备的巡视工作。良好的环境是保证系统稳定的运营的前提。特别要注旨在高温季节时注意巡检空调系统运营的情况。3) 节假日期间要注意及时报告并解决系统出现的各种异常问题,避免由于小问题引起的宕机事故。4) 节假日期间要避免进行大规模短信群发等占用系统资源的作业项目,避免增长系统负荷
18、。5) 节假日期间值班人员要定期检查系统负荷情况,尽量提前预测系统负荷增长情况,避免由于系统超负荷导致的宕机事故。6) 节假日前要检查各互换系统远程拨入系统是否可用。通过拨号进入系统检测拨入系统是否可用。如拨入不成功,检查调制解调器电源是否接通,面板灯是否正常,检查电话线是否可接通。保证紧急时刻可以让厂家工程师通过远程接入系统排查问题因素。14节假日及重大社会活动期间系统过负荷或宕机时的应急解决措施 系统过负荷或宕机时解决原则:1先疏通,后排障;先抢通、后解决“作为应急通信保障的第一原则。2“先局内,后局外;先本端,后对端”作为解决故障的基本原则。3当应急情况涉及多个分公司时,按“故障所在局负责、互换负责”的业务负责顺序操作;当涉及多个专业时,按“互换、无线、传输、线路”的业务指挥顺序进行解决。4对于系统保障的优先级别,“先省际、再省内、后本地”。对于传输电路的优先级别, 党、政、军重要专线电路、信令电路、话务电路、普通出租电路;在优先级较高的重要系统、电路阻断而又无备用、迂回路由可倒换的情况下,可以中断优先级较低的系统、电路,运用其资源优先抢通优先级较高的重要系统、电路。5对于涉及军方、公安、安全、武警等需保密的重要专线电路,未经用户及省公司应急通信指挥机构确认,严禁倒入微波、卫星等无线系统,以避免泄漏机密。