1、服务器应用系统应急预案1.服务器应用系统出现故障(1)当服务器应用系统出现故障,系统管理员应该立即初步确定故障严重程度,估量出现故障应用系统故障排除需要时间,并依据应用系统需要保障无故障运行时间,采取不一样应用系统恢复策略。(2)假如应用系统不能停机,立即启用热备份系统进行工作。假如业务系统不能停机,而故障又能够在10分钟之内排除,那么系统管理员立即排除故障,恢复系统正常运行。业务系统能够停机而故障又能够在小时内排除,应该断开服务器网络连接,处理服务器故障,立即排除故障,恢复系统运行。应用系统能够停机但故障排除不能在小时之内完成,而业务系统有冷备份系统,应该断开服务器网络连接,通知系统管理员开
2、启冷备份系统,完成业务系统安装、设置,并进行数据恢复,确保系统正常运行。业务系统能够停机,而又没有冷备份业务系统,那么系统管理员备份现有系统数据和程序,假如不能进行备份系统数据和程序,系统管理员在确定了业务系统有之前备份情况下,重新修复或安装操作系统,并重新安装或修复业务系统并恢复最新备份数据。假如备份丢失或不存在,系统管理员应该汇报分管经理,并求援技术支持商,完成对硬盘数据恢复。(3)系统管理员在业务系统出现故障时,应该立即查找当地数据备份,当地数据备份损坏或丢失,应该立即从异地数据备份复制业务系统数据备份到当地。(4)系统管理员应在确定安全情况下,重新开启故障服务器系统;重启系统成功,则检
3、验数据丢失情况,利用备份数据恢复;若重启失败,立即联络相关厂商和技术支持,请求援助,分析故障原因,若经设备厂商或技术支持认定是硬件损坏,那么需要请求厂商更具维修协议,进行保修或维修。在服务器硬件正常情况下,立即做好系统软件恢复或重新安装,以后再进行业务系统恢复或重新安装,再进行业务系统数据恢复,业务系统完全恢复正常运行后,重新启用恢复业务系统服务器,再将备用系统停掉。(5)应急预案技术方法,假如出现网络病毒,黑客攻击等,系统管理员采取瑞星杀毒软件或卡巴斯基杀毒软件和360木马查杀工具等,对整个计算机进行杀毒。对不能确定是否为病毒文件。假如出现不良信息,系统管理员程要设法找到不良信息文件或不良信
4、息存在数据库中位置,对非法信息,进行手工删除,或编程删除,若不能清除,采取程序和数据备份进行恢复。2、软件系统故障应急预案(1)发生服务器软件系统故障后,系统管理员应立即对服务器进行查看,分析故障原因,采取并立即汇报分管经理;同时安排将故障服务器脱离网络,保留系统状态不变,取出系统镜像备份磁盘,保持原始数据,根据系统恢复应急预案进行。(2)处理结束后,系统管理员应将事发经过、处理结果等在调查工作结束后一日内汇报分管经理。(3)技术方法:系统管理员在故障发生后立即查看服务器系统状态,假如是系统软件出现故障,而且能进入系统,且能够清楚定位故障原因,并能够立即排除,那么立即进行排除。假如估量在3小时
5、之内全部不能定位故障原因,那么汇报分管经理,请求系统软件厂商及技术支持帮助排除,或依据技术支持提议进行重新安装操作系统和业务系统。排除操作系统故障方法,检验操作系统进程是否全部正常,有没有非法进程,操作系统文件有没有损坏丢失,是否受到病毒和木马程序侵害,黑客攻击。假如不是操作系统故障,应该只是对业务系统进行检验,检验方法,查看业务系统代码和数据是否被破坏,损坏,丢失,假如丢失,从正确备份进行恢复。3、服务器硬件故障应急预案(1)发生服务器设备硬件故障后,系统管理员应立即汇报分管经理,并组织查找、确定故障设备及故障原因,进行先期处理。(2)依据系统恢复应急预案,确定故障服务器上业务系统应急恢复方
6、法。(3)处理结束后,系统管理员应将事发经过、处理结果等在调查工作结束后一日内汇报分管经理。(4)技术方法:初步判定硬件故障方法,观察系统能否正常开启,统计开启时显示器屏幕上提醒信息,统计服务器状态指示灯状态,统计系统状态显示器上信息,系统管理员初步判定服务器硬件故障后,咨询硬件厂商、技术支持确定硬件故障具体原因和故障部件,并联络进行维修。4、业务数据损坏应急预案 发生业务数据损坏时,系统管理员应立即汇报信息分管经理,检验、备份业务系统目前数据。 系统管理员负责调用备份服务器备份数据,若备份数据损坏,调用异地备份数据,应立即完成数据恢复工作。系统管理员应待业务数据系统恢复后,检验历史数据和目前
7、数据差异,由相关系统操作员补录数据;重新备份数据,并写出故障分析汇报,在调查工作结束后一日内汇报分管经理操作说明:1.发生突发事件后立即通知服务方和服务器原厂商,成立应急小组,该小组由服务方工程师、我方技术人员、原厂商三方共同组成。2应急小组分析突发事件造成原因,确定硬件、软件方面故障,研究可操作性,分析处理过程多种意外情况,影响范围,制订事件处理方案。如需更换硬件应急小组讨论经过后制订紧急采购方案,以上方案制订后上报各级领导审核经过。3.待领导审核经过后对服务器数据应急备份,组织实施维护方案(末经过将重新制订方案),实施过程中如发生意外事件,应立即上报分管经理,分析出现原因,立即处理意外事件。4.维护方案完成后核查突发事件是否处理完成,如已经处理结束,视情况决定是否需要还原数据,并将事件统计存档,如末完成,再次分析原因,重新制订操作方案。主管审核是还原备份否如必需还原备份应急备份组织实施分析多种意外应对方案否通知服务器厂家配合联络运维方小组内审核否排除意外制订意外处理方案整理存档完成维护故障能否成功处理上报意外实施过程中是否出现意外经过确定维护方案制订操作方案总经理审核分管经理审核可操作性分析制订处理方案成立应急技术小组突发事件发生步骤图