资源描述
灾难恢复计划
编制:
批准:
版本:1。2
日期:2010年12月
版本历史记录 3
1.简介 4
1.1计划的使用 4
1.2灾难定义 4
1。3 概述 4
1.4 原则 4
2.恢复策略 5
2.1 自然灾难(包括:火、地震等等) 5
2。2 硬件故障 5
2。3 软件故障 5
2.4 病毒 6
3.职责 6
3.1 灾难恢复小组成员 6
3.2公司员工在灾难恢复时的职责 6
4.信息系统详细内容及设备列表 7
4.1网关、防火墙服务器 7
4.2域服务系统 7
4.3文件服务器系统 7
4.邮件、防病毒系统 8
5. QAD linux 系统 8
6 QAD windows 系统 9
7备份系统 9
4.9网络服务设备列表 9
5.备份 10
5.1系统配置备份 10
5。2数据资料备份 10
5。3备份步骤 10
6.灾难恢复内容及顺序 11
6.1主要恢复内容 11
6。2 主要软件及系统恢复步骤 11
6.3恢复备份数据的条件: 12
6.4恢复时间及顺序 12
7.主要硬件及软件供应商联系方式 13
8.风险分析 14
8。1风险等级: 14
8.2风险分析列表: 14
8。3风险评价 16
8。4降低风险的发生 17
9.培训 19
版本历史记录
版本日期
版本号
更改记录
修订页码
2009—11
1.1
2010-12
1.2
公司名变更,IT小组人员变更,异地存储保险箱位置变更和软件升级
6、8、10、17、18
1.简介
1。1计划的使用
计算机信息系统发生灾难时激活这个计划,由IT小组按照本计划标准的操作程序组织实施灾难恢复,直到全部数据和功能被修复。
1.2灾难定义
灾难包括自然灾难和人为灾难,自然灾难是指由不可抗力造成的网络瘫痪、信息服务被强制中断,这种灾难是不可预测的。人为灾难是指除自然灾难以外的信息系统的全部或部分出现瘫痪、信息服务被强制中断.
1.3 概述
灾难恢复计划是做准备、定计划,以使灾难发生后能及时恢复计算机网络系统的文件。它是一个管理公司潜在的数据丢失及灾难发生时执行的计划,它的主要目的是保护公司数据和信息资源,现在公司越来越多的应用了计算机及通信资源,当灾难发生时,这些资源的损失可能会使公司陷入瘫痪状态,它会在一段时间内直接或间接的影响到公司的运营状况,给公司造成损失。制定灾难恢复计划,可以使灾难被有计划、有步骤的得到恢复。
1.4 原则
灾难恢复计划文件是准备进行灾难恢复及测试计划有效性的文件,它必须能保证在灾难发生前、中、后都能使灾难在最短的时间内被恢复,它的详细内容是根据可能对公司网络通讯、计算机及数据资源造成损失的事件,做出实际、完整的响应步骤,使得灾难发生后能做到:
l 保证将灾难的影响降低到最小的程度.
l 在预定的时间内恢复网络系统和数据资源。
灾难恢复计划必须包括:
l 网络系统内容的详细列表.
l 软件及硬件故障的应急响应方法。
l 员工职责。
l 根据公司对网络和数据资源的要求定期做备份.
l 网络和数据资源的恢复顺序。
l 和相关人员及提供服务人员进行通信的方法。
l 风险评估及分析
l 进行灾难恢复计划的维护和测试。
n 将灾难恢复计划形成文件,并保证实时更新。
n 保证每年对灾难恢复计划进行测试.
2.恢复策略
2.1 自然灾难(包括:火、地震等等)
在发生自然灾难后,公司全体员工在保证人身安全的情况下做出紧急响应,应首先将本部门计算机转移到安全地点,在条件许可的情况下,尽力将计算机网络设备及附属设备(如打印机服务器、HUB等)转移到安全地点,然后等待灾难恢复小组进行修复。
2。2 硬件故障
使用硬件设备的人员及时通知IT工程师,由IT工程师确定发生故障的原因,如有备件应及时更换,否则应立即与销售商联系,维修或更换设备.
2.3 软件故障
使用软件的人员及时通知IT工程师,由IT工程师确定发生故障的原因,如果是一般应用软件故障,则应立即重新安装应用软件。其它应用软件故障(如QAD)应立即与软件供应商联系,通过电话支持或要求供应商上门服务的方式解决软件故障.操作系统故障应先备份数据信息,然后由IT工程师重新安装操作系统。
2.4 病毒
每位员工发现病毒后应立即将感染病毒的计算机与计算机网络断开,并通知IT工程师清除病毒。
3.职责
3。1 灾难恢复小组成员
3。2公司员工在灾难恢复时的职责
3.2.1 发生自然灾难后依据人力资源部《SP-EHS—02应急准备与响应程序》执行,计算机网络系统的灾难由IT人员报行政人事部,由行政人事部对内、外宣布灾难。
3。2。2 发生灾难后,公司办公楼无法使用时,由公司管理层和行政人事部门负责租用新的办公地点。
3。2。3 公司全体员工都有在发生灾难时做出紧急响应的责任。
3。2.4 IT小组和管理层一起制定一个详细、完整的恢复计算机网络系统的计划。
3。2。5 IT工程师定期进行网络系统信息和数据资源的多重备份,保证信息资料的完整性和可靠性。
3。2。6 IT小组对网络系统内部失效的部件(包括硬件和软件),及时进行维修和维护.
3.2.7 灾难发生后,灾难恢复小组成员协同工作,共同完成信息网络的搭建及操作系统、应用系统的安装。完成计算机网络信息数据的恢复工作。
4.信息系统详细内容及设备列表
4。1网关、防火墙服务器
计算机名称:gateway
软件:Windows 2003 server操作系统
Microsoft ISA Server 2006 中文标准版
硬件:IBM X3250 (IT机房)
Xeon X3110
4*1G内存
2*146G SAS HDD硬盘
2*1000Mb 网络适配器
IP地址:192。168。0.1(LAN),218.22。73。70(WAN)
4.2域服务系统
计算机名称:ActiveDirectory
软件: Windows 2003 server操作系统
硬件:DELL 320 (IT机房)
酷睿双核2.0G
1G 内存
160G 硬盘
10/100Mb 网络适配器
IP地址:192。168.0。2
4.3文件服务器系统
计算机名称:file—server
软件:Windows 2003 server操作系统
硬件:IBM X3550 (IT机房)
至强四核5150/2G/500G*2/RAID1/
2G 内存
500G*2 硬盘
1000Mb 网络适配器
IP地址:192.168.0。3
4。邮件、防病毒系统
计算机名称:mail-server
软件:Windows 2003 server操作系统
VisNetic MailServer
Symantec 11企业网络版
硬件:DELL 840
双核至强 2.13G
2G内存
500G*2 硬盘
1000Mb 网络适配器
IP:192.168.0.4
5. QAD linux 系统
计算机名称:qad—batabase
软件:red hat linux操作系统
硬件:IBM X3650
Xeon X5450
2G*4内存
146G*4 SAS硬盘
1000Mb 网络适配器
IP地址:192。168。0。5
6 QAD windows 系统
计算机名称:qad-app
软件:Windows 2003 server操作系统
硬件:IBM X3650
Xeon X5450
2G*4内存
146G*2 SAS硬盘
1000Mb 网络适配器
IP地址:192。168。0。6
7备份系统
软件:Windows 2003系统中的备份
硬件:BM LTO2 400-800G 磁带机
4。9网络服务设备列表
华为3COM S3600-28TP-SI交换机(IT机房)
华为3COM S1050T 交换机两台(IT机房)
光纤收发器 四台(IT机房)
华为3COM S1008A 交换机(厂房南边机柜)
华为3COM S1008A 交换机(厂房北边机柜)
光纤收发器 一台(厂房南边机柜)
光纤收发器 一台(厂房北边机柜)
光纤收发器 一台(北门门卫室)
光纤收发器 一台(功能实验室)
NETGEAR无线路由 两台(办公楼二楼)
TP-Link R403M路由器(IT机房)
5.备份
5。1系统配置备份
网关服务器IP策略、DHCP策略、ISA防火墙策略、域服务器策略由磁带机和硬盘做两份备份,其中一份存于服务器硬盘,另一份存于远离计算机中心的交通银行开发区支行的保险柜内。当硬盘损坏时可由磁带机或其它硬盘中恢复系统最新状态。
5。2数据资料备份
文件服务器中的所有存放文件及QAD每天的生产数据库由磁带备份和硬盘备份两份,其中一份存于服务器硬盘,另一份存于远离计算机中心的交通银行开发区支行的保险柜内.
5。3备份步骤
5。3.1系统配置备份:
在两台服务器中每周进行相关系统配置的备份,并用U盘将所有文件COPY到fileserver机器中d:\中,等待进行磁带备份。
5.3.2数据资料备份
批处理程序 (qad—database机器中) 每天会将QAD系统中的生产数据库备份到/backup/db/prod/ 文件夹中,IT工程师每天早晨上班后在fileserver机器中用FTP软件COPY qad-database机器的/backup/db/prod/中的所有文件到fileserver机器的D:/ QAD Production backup目录中,再用磁带对此目录进行备份;
Fileserver机器中的D盘每周用磁带全备份一次,每月完全备份一次.
5。3.3磁带备份
每天\每周使用磁带备份,将磁带放入磁带机中,对公司内所有数据进行全备份(QAD数据库文件每天备份),每月进行一次完全备份。
6.灾难恢复内容及顺序
6。1主要恢复内容
· 文件服务器 (Windows 2003 server)
· 备份系统
· 网关服务器 (Windows 2003 server)
· 网络防火墙 (ISA 2006)
· 域服务器 (Windows 2003 server)
· 电子邮件系统 (VisNetic MailServer)
· 病毒防护系统(Symantec Norton Antivirus)
· qad-database系统
· qad—app 系统
6。2 主要软件及系统恢复步骤
6。2.1 Windows 2003 server 操作系统
根据Windows 2003 server 安装时的提示,进行一步一步的安装,安装后使用备份好的"系统配置”文件恢复系统配置信息及安全策略。各系统的配置文件如下:
网关服务器:\\file-server\D:\gateway backup\DHCP
域服务器:\\file—server\D:\AD backup
6.2。2 QAD 操作系统
根据Linux 和Windows 2003server安装时的提示,进行一步一步的安装.
6.2.3 其它应用软件
包括“ISA 2006”、“Visnetic mail server”、“Symantec"、“QAD软件”都根据软件的安装提示进行安装,安装后使用备份好的各系统配置文件恢复系统配置。以下为各软件配置文件的保存路径:
ISA 2006:\\file—server\D:\gateway backup\ISA
QAD正式数据库 :\\file-server\D:\QAD Production backup
6。3恢复备份数据的条件:
l 具备计算机一台,具有Windows2003server操作系统。
l IBM LTO3磁带机一台。
6。4恢复时间及顺序
总恢复时间
网关服务器
邮件服务器
文件服务器
域服务器
QAD
系统
顺序
时间
顺序
时间
顺序
时间
顺序
时间
顺序
时间
0-24
Windows2003 server 操作系统
0-24
Windows2003 server 操作系统
0—24
Windows2003 server 操作系统
0-24
Windows2003 server操作系统
0—24
Linux
windows
0—24
24-124
124小时后可全部恢复网络内的服务器系统
网络防火墙
24-28
电子邮件系统
24—28
文件资料数据
24-48
域策略配置
24-48
QAD
软件
24—100
恢复系统策略配置
28-30
病毒防护系统
28-32
备份系统
48-52
QAD数据库数据
100—124
恢复防火墙数据
28-50
恢复系统配置
32-40
网络布局和各单机系统视缓急程度决定恢复顺序及时间
7.主要硬件及软件供应商联系方式
主要硬件名称
公司名称
联系人
联系电话
IBM磁带机、服务器
IBM中国有限公司
DELL 服务器
DELL中国有限公司
QAD SE2008软件
上海企安达
Microsoft ISA Server 2006
Microsoft中国公司
8.风险分析
风险是指对计算机网络系统潜在的威胁,风险评估是分析和评估可能发生的全部风险。它包括风险等级、风险分析、风险评价三部分。
8。1风险等级:
通过对潜在的风险进行分析,确定风险发生的可能性(高、中、低、),以及风险发生后可能造成的威胁(高、中、低).通过对两者的分析来确定风险的等级。见下表:
风险等级
发生风险的可能性
造成威胁的高低
等级
H
M
L
N/A
H
M
L
N/A
X
X
*****
X
X
****
X
X
****
X
X
***
X
X
**
X
X
*
X
X
**
X
X
*
X
X
-
8.2风险分析列表:
下表中所包含的风险依据以下信息:
1. 中国统计局
2. 美国大使馆
3. 中国平安保险公司
4. 中国2004年灾难报告
5. 中国2004年统计报告
风险分析表
潜在的风险
发生风险的可能性
造成威胁的高低
等级
H
M
L
N/A
H
M
L
N/A
地震
x
x
**
飓风
x
x
-
暴风雨
x
x
—
火山爆发
x
x
-
洪水/山洪暴发
x
x
***
暴风雪
x
x
-
泥石流
x
x
—
雷击
x
x
***
海啸
x
x
-
森林火灾
x
x
-
干旱
x
x
—
建筑物失火/爆炸/漏气
x
x
****
水管破裂
x
x
**
气候条件恶劣(如:温度过高)
x
x
*
网络设备故障
x
x
**
硬件故障
x
x
***
软件故障
x
x
-
媒体故障(磁带、光驱等)
x
x
*
人为的操作失误
x
x
—
黑客的阴谋破坏
x
x
*
数据无法打开
x
x
—
机密数据泄露
x
x
****
未被授权的访问
x
x
*
个人丢失钥匙
x
x
*
害虫侵扰 (物理设备)
x
x
-
感染计算机病毒
x
x
****
电磁影响
x
x
***
干扰特性
x
x
-
通讯故障
x
x
-
油管断裂
x
x
—
抢掠
x
x
*
入室行窃/非法挪用
x
x
*
战争
x
x
*
8.3风险评价
根据上表所列出的各种风险类型进行分析,综合考虑各方面的因素,列出下表,有四种基本的控制方法,每种方法可以单独使用,也可以共同使用。
风险 “A.T.E.R”
定义
控制方法
接受(Accept)
当控制风险的成本明显高于财务成本时,接受可能发生的风险
如果从成本角度考虑,对可能发生的风险可以不做控制。
转移(Transfer)
把财务责任转移到第三方
购买保险;
消除 (Eliminate)
完全去除可能导致灾难或网络中断的因素
重新部署设施;
改变程序文件;
清除易燃材料等
降低(Reduce)
把可能导致灾难或网络中断的因素最小化
安将防盗门、建立防火墙;
安装病毒防护系统;
进行多重备份;
认真考虑风险和实施成本,实行有效缓解措施,可以避免小问题逐渐升级成大灾难。下表中每项风险的评估(风险分析摘要)在下表作了概述。风险按优先顺序列出,其中包括风险管理和应对策略:
风险评价(\)
潜在的风险
风险等级
风险管理策略
适用范围
建筑物失火/爆炸/气体泄漏
****
ART
SLWH
机密数据泄露
****
R
SLWH
感染计算机病毒
****
R
SLWH
硬件故障
***
AR
SLWH
电磁干扰
***
R
SLWH
洪水/山洪暴发
***
ART
SLWH
雷击
***
ART
SLWH
地震
**
ART
SLWH
水管破裂
**
ARE
SLWH
网络设备故障
**
ARE
SLWH
气候条件恶劣(如:温度过高)
*
RE
SLWH
媒体故障(磁带、光驱等)
*
RE
SLWH
抢掠
*
RT
SLWH
入室行窃/非法挪用
*
RE
SLWH
战争
*
AR
SLWH
黑客的阴谋破坏
*
RE
SLWH
未被授权的访问
*
RE
SLWH
个人丢失钥匙
*
RE
SLWH
8。4降低风险的发生
8.4。1财务 :
· 所有公司的财产都在保险公司投保,在财产被盗或遇到灾难时,不会在财务上发生困难
8。4.2 IT机房:
· 机房24小时关门
· 关闭并锁上窗户
· 在IT机房放置灭火器
· 进出机房必须添写登记表,并有计算机管理人员陪同
· 保持房间清洁
8。4。3备份磁带:
· 为每一盘磁带标记序号,并标记备份日期及形式
· 备份磁带定期放到远离IT机房的交通银行开发区支行
· 对备份磁带定期做测试
8.4.4网络:
· 网络用户密码的长度必须大于7位,并符合复杂性要求(包含数字、字母、符号)
· 用户必须每30天更改一次密码,一年内密码不能重复
· 网络用户应定期清理,删除不再使用的用户名
8。4.5网络内的计算机 :
· 公司内所有计算机都必须设置开机口令和屏幕保护口令
· 所有的屏幕保护口令必须设置在10分钟以内
· 对一些机密文件也应该设置保护口令
· 将公司内重要数据保存在服务器上,防止丢失
8。4.6软件 :
· 每个月抽查每个部门的计算机,检查是否有非法软件,如果发现非法软件应当立即将其删除
9.培训
灾难恢复小组成员每年进行一次培训。
培训内容为最新的”灾难恢复计划”。
16
展开阅读全文