资源描述
自动控制系统应急预案
总则
一 为及时、有效、迅速地解决自动控制系统失灵事件,避免控制系统失灵导致机组非停或也许导致的重大设备损坏事故,制定控制系统应急预案。
二 本预案按照“安全第一、防止为主、综合治理”的方针,坚持防止治理相结合的原则,以危急事件的预测、防止为基础,以对危急事件过程解决的快捷、准确为核心,以全力保证人身、设备安全为目的,以建立危急事件的长效管理的应急机制为主线,提高快速反映和应急解决能力,将危急事件导致的损失和影响减少到最低限度。
三 本方案所称自控系统是指在我公司生产过程中所使用的过程控制计算机系统(DCS)、可编程控制器系统(PLC)。
目录
1 系统电源所有失去应急处置预案
2 操作员站所有失去监控且无后备监视手段应急处置预案
3 控制系统网络瘫痪应急处置预案
4 控制系统冗余服务器故障应急处置预案
5 系统单路电源失去应急处置预案
6 网络失去冗余应急处置预案
7 系统重要I/O设备(模件、模块)故障应急处置预案
8 服务器失去冗余应急处置预案
1系统电源所有失去应急处置预案
1.1 故障现象
(1)运营检查
1)所有操作员站显示黑屏且独立控制系统供电电源失去报警装置发生声音报警。
2)所有服务器停止工作。
3)所有互换机停止工作。
4)所有I/O控制站停止工作。
(2)热控检查
1)工程师站电源失去,显示器所有失电显示为黑屏。
2)电子间内电源柜电源失去,电源指示为零。
3)控制系统所有模件柜指示灯熄灭,主机柜内控制器电源、互换机、控制器的所有指示灯均熄灭。
1.2 故障也许的因素
(1)保安段电源失去。
(2)UPS电源失电。
(3)电源切换装置。
1.3故障分析及后果
所有操作员站失去操作与监视,所有控制器停止工作,导致失电控制器所涉及的设备拒动或误动,导致机组跳闸,甚至因设备拒动或误动而损坏设备。
1.4维护解决
(1)自动控制人员到控制系统总电源柜检查两路进线电源是否为220VAC,假如不正常,由电气专业检查并恢复。
(2)假如进线电源为正常220VAC,自动控制人员检查控制系统总电源柜内送各机柜空气开关状态,用万用表检查到各机柜电源出线是否有接地现象,若有,检查消除接地点,再准备恢复自动控制系统供电。
假如进线电源为正常220VAC,且机柜电源出线无接地现象,则检查DCS/PLC侧切除装置是否故障,若故障则更换切换装置,若无法及时更换,紧急情况下可先将其隔离,先进行系统上电工作,待系统恢复后再尽快更换。
(3)自动控制人员确认可以恢复DCS/PLC供电时,应报告值长无运营及维护人员进行现场工作后,方可对DCS/PLC进行重新上电。恢复上电前应先将DCS/PLC系统各设备的空气开关打至断开状态,然后从上级向下级的顺序进行送电工作。
(3)DCS/PLC重新送电后,自动控制人员确认DCS/PLC功能所有恢复,检查设备状态、参数指示正常,报告值长决定是否重新开机。
2操作员站所有失去监控且无后备监视手段应急处置预案
2.1故障现象
(1)运营检查
1)所有操作员站数据显示黑屏。
2)所有操作员站响应缓慢。
3)所有操作员站死机,失去监控作用。
(2)热控检查
1)工程师站的系统监视画面上,所有工作站或者控制器显示离线。
2)互换机柜内减缓及部分端口指示灯所有熄灭,或者变为黄色
3)操作员站电源双路切换开关电源指示灯熄灭。
2.2故障因素
(1)操作员站所有电源失去。
(2)监控网络所有故障。
(3)服务器所有故障。
2.3维护解决
(1)立即至DCS/PLC总电源柜检查DCS/PLC电源,参照系统电源所有失去应急处置预案进行解决。
(2)检查DCS/PLC网络,若为网络因素,参照DCS/PLC网络瘫痪应急处置预案进行解决。
(3)检查服务器运营状况,若为服务器所有故障,参照DCS/PLC冗余服务器均故障应急处置预案进行解决。
3 DCS/PLC网络瘫痪应急处置预案
3.1故障现象
(1)运营检查
1)操作员站可以显示画面,但切换流程图非常缓慢,操作员站上操作影响延迟很大或数据显示严重超时。
2)所有操作员站离线,运营人员在这些离线的操作员站上操作无响应或所有参数不更新丧失监控功能。
(2)热控检查
1)工程师站的系统监视画面上,所有工作站或者控制器显示离线。
2)互换机柜内互换机所有端口指示灯熄灭或者变为黄色。
3)DCS/PLC网络存在数据风暴或网络病毒。
3.2故障因素
(1)互换机所有故障。
(2)冗余装置的服务器所有故障。
(3)网络数据风暴或网络病毒引起。
3.3故障分析和后果
所有操作员站无法准确控制机组运营状态,停机停炉,甚至损坏机组设备。
3.4故障解决
(1)检查上层网络互换机电源模块运营指示灯,若不亮或闪烁则说明互换机电源问题,检查互换机电源回路并进行解决。
(2)检查互换机,看是否硬件故障。
(3)检查I/O服务器或互换机冗余网络是否正常,查看是否有数据风暴或网络病毒。
(4)检查服务器运营状态,若冗余服务器故障,则解决故障服务器并上报,立即启动DCS/PLC冗余服务器均故障应急解决。
(5)系统恢复过程中随时与值班运营人员沟通,报告系统恢复进度,以备运营人员做好相应的恢复措施。
(6)系统恢复后,检查DCS/PLC各节点工作状态是否正常,若不正常及时解决;若正常,告知运营人员可根据操作员检查各画面参数是否与就地设备状态一致,并决定是否可以正常操作。
4 DSC/PLC冗余服务器均故障应急解决预案
4.1故障现象
(1)运营状态。
1)所有操作员站无响应。
2)所有数据不刷新,所有控制设备(如泵、风机、调节阀)操作无效。
3)所有趋势、报警、报表异常。
(2)热控检查
1)系统状态无法调用。
2)服务器连接的网络图标异常。
3)所有服务器已关机,电源失去。
4.2故障因素
(1)连接服务器的网络或网络设备故障
(2)服务器电源所有故障
(3)服务器部分或所有任务故障退出。
(4)服务器主机硬件故障
(5)服务器应用程序异常
4.3故障分析和后果
(1)监视画面无法监事和操作。
(2)趋势、报警、报表功能异常。
4.4故障维护解决
(1)检查与服务器相连的网络,若为网络因素则进行解决。
(2)检查服务器电源是否正常
(3)检查服务器运营的任务是否有异常。
(4)登陆服务器检查软件运营情况,若服务器所有死机,直接进入服务器硬重启。
(5)检查服务器主机硬件,若硬件故障则更换服务器,在更换服务器前应先确认服务器IP地址、配置文献设立对的无误后下装服务器。
(6)系统恢复过程中随时与当值人员沟通,报告系统恢复进度,以备运营人员做好相应的恢复措施。
(7)通过操作员站在线查看服务器工作状态,当所有显示正常后,程序自动启动完毕,告知运营人员可根据操作员站检查各画面参数显示是否与就地设备状态一致,并决定是否可以正常操作。
5 系统单路电源失去应急处置预案
5.1故障现象
(1)运营检查
1)独立的DCS/PLC供电电源失去报警装置发失电声音报警。
2)DCS/PLC设备报警画面中所有控制站单路系统电源失去报警。
(2)热控检查
1)系统状态图中I/O控制站一路视点报警。
2)所有冗余配置的电源模件系统其中一路显示红色故障。
3)DCS/PLC所有模件柜中一路电源模件指示灯熄灭。
5.2故障因素
(1)保安段电源单路失电。
(2)UPS电源单路失电。
(3)电源柜内单路空气开关跳闸。
5.3故障分析和后果
系统已失电,系统运营风险增大,若此时另一路电源不能保证正常供电,将会导致事故扩大。
5.4故障解决
(1)运营人员立即告知热控人员配合解决,此时DCS/PLC系统已单路失电,应保持工况稳定,减少操作,密切监视机组运营情况,在切除部分负载前明确确认。同时必须做好两路电源均失去的风险控制措施。
(2)热控人员根据故障报警准确判断电源失电的部位,到DCS/PLC总电源柜检查该路电源是否为220VAC,假如不正常,由电气专业检查并恢复正常供电。
(3)当失电是否由于电源柜内单路空气开关跳闸引起,则立即检查空气开关是否正常,若不正常应立即进行更换;更换完毕后,通过实验拟定正常后,再进行系统上电工作。
6网络失去冗余应急处置预案
6.1故障现象
(1) 运营检查
设备报警中出现相关网络故障报警。
(2)热控检查
1)系统状态图中显示局部网络故障。
2)单路互换机电源失去,状态指示灯异常。
3)单路互换机数据风暴。
6.2故障因素
(1)单路网络互换机故障
(2)单路网线松动或短路
(3)网卡故障
6.3故障分析和后果
系统已单网运营,运营风险增大, 若此时另一路网络不能正常工作,将导致事故扩大。
6.4运营解决
(1)运营人员立即告知热控人员配合解决,此时网络已失去冗余,应保持工况稳定,减少不必要的操作,密切监视机组运营情况,同时必须做好双网络均失去的风险预控措施。
(2)通过故障现象判断故障的网络位置。
(3)检查相关的网络互换机,检查互换机的状态指示灯,若所有的指示灯均不亮,则检查该路互换机底板或与之连接的接口和电源是否正常,若不正常,更换网线或互换机,并将各端口接线恢复至更换前状态;若正常,应进一步检查是否存在网络风暴。故障解决过程中注意避免同时中断冗余配置的两端网络。
7系统重要I/o设备(模块)故障应急解决预案
7.1故障现象
(1)运营检查
1)故障模件数据不刷新或显示错误,部分或所有控制设备(如泵、风机、调节阀)操作无效。
2)设备报警中模件或模块通道故障报警。
(2) 热控检查
1)I/O模块状态图中该设备显示异常。
2)控制柜内I/O模块run灯不亮,模件硬件故障。
3)控制柜内I/O模块com灯不亮,模件通讯故障。
7.2故障因素
(1))外界因素(强电、雷击)引起I/O设备故障。
(2)电子间环境因素(温度、湿度、灰尘)引起I/O设备故障。
(3)I/O模块质量问题或者元器件老化。
(4)模块通讯故障。
7.3故障分析和后果
故障I/O模块所相应的部分或所有设备无法正常监控。
7.4运营解决
(1)撤除相关联锁、保护和自动。
(2)如有必要则规定热控人员强制相关信号。
(3)运营人员暂停或减少相关设备的操作。
7.5维护解决
(1)在工程师站上通过状态图、报警信息及现场实际状态显示拟定故障的I/O模块,并进行故障解决。
(2)根据I/O清册查出I/O设备内的所有信号,并列出保护、自动调节的信号清单提醒运营人员做好必要的隔离和防误动措施。
(3)检查故障I/O设备数据通讯。
(4)检查故障I/O设备供电电源。
(5)检查接线端子排是否故障,测量模件输入输出信号,在限号正常的情况下更换到备用通道,如不能恢复,更换接线端子排。
(6)检查I/O模块是否故障,若故障及时更换,在更换模块时应先拟定模块的信号、版本等对的无误。
8服务器失去冗余应急解决预案
8.1故障现象
运营检查 DCS/PLC设备报警栏中发出部分服务器故障报警信号。
热控检查
(1)系统状态图中显示故障的服务器状态变红。
(2)连接到服务器的一段或所有网络中断。
(3)部分服务器已关闭,电源失去。
(4)部分服务器任务已退出。
8.2故障因素
(1)连接故障服务器的网络或网络设备故障。
(2)故障服务器电源故障。
(3)故障服务器部分或所有任务异常退出。
(4)故障服务器主机硬件故障。
(5)故障服务器应急程序及系统程序异常。
8.3故障分析或后果
故障服务器停止工作,服务器失去冗余。
8.4故障解决
8.4.1运营解决
运营人员应减少不必要的操作,并注意观测操作员站的响应情况,如有异常,立即报告。
8.4.2维护解决
(1)通过系统状态图及设备报警拟定故障的服务器并立即进行故障检查解决。
(2)检查故障服务器的网络或网络设备。
(3)检查故障服务器部分或所有任务是否异常退出。
(4)检查故障服务器主机硬件,若确认服务器硬件故障,则需要更换相应硬件。若硬件故障,则更换服务器。在更换服务器前先确认服务器IP地址、配置文献设立等对的无误后下装服务器。服务器重启后启动各服务进程。
(6)通过操作员站在线查看服务器工作状态,当所有显示正常,程序启动完毕后,告知运营人员可以正常操作。
展开阅读全文