1、一、服务器双机热备份方案1.1 双机热备份方案描述现代IT技术认为,一个成功系统中,数据及作业关键性已远超出硬件设备本身,在一套完善系统中对数据安全及保障有着极高要求。双机容错热备系统是一个全套集群处理方案,结合IBM服务器产品安全可靠性和集群技术优点,为用户提供一个完善系统。1.1.1 双机热备份方案原理 两台服务器经过磁盘阵列或纯软件模式,连接成为互为备份双机系统,当主服务器停机后,备份服务器能继续工作,预防用户工作被中止。1.1.2 双机热备份方案适用范围 用户对系统连续工作性和实时性要求较高,系统停机对系统影响很大,造成很大损失。1.1.3 双机热备份方法磁盘阵列备份方法 两台服务器经
2、过磁盘阵列连接起来,形成备份系统,系统易于安装,确保了系统稳定性和高可用性。1.2双机热备份方案所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机可尽早通知系统管理工作人员处理,确保下一次切换可靠性)。当工作机出现异常,不能支持信息系统运行时,备份机主动接管(Take Over)工作机工作,继续支持信息运行,从而确保信息系统能够不间断地运行(Non-Stop)。当工作机经过维修恢复正常后,
3、它会将其先前工作自动抓回,恢复以前正常时工作状态。双机热备结构示意图:1.1 侦测链路RS-2321.2 Backup Server备份服务器1.3 Active Server 工作服务器1.4 磁盘阵列1.5 Ethernet以太网1.6 Ethernet以太网1.7 SAS1.8 SAS1.9 Client用户端1.10 Client 用户端 硬件连接参见结构示意图,两台服务器经过SCSI卡接口及SCSI线和磁盘阵列连接,进行数据传输;两台服务器经过RS-232接口及RS-232线连接,用于系统进行“心跳侦测”;两台服务器经过网卡及网线和网络连接,进行数据传输和故障服务器切换;服务器当地硬
4、盘上安装对应操作系统及对应应用,用户数据放在共享磁盘阵列上。 整个系统由两台IBM System x服务器x3850X5和IBM DS3400磁盘阵列组成双机热备份模式,双台服务器互为备份,当一台服务器出现问题停机时,另一台服务器能实时接管中止工作,确保业务系统正常运行。IBM DS34000磁盘柜磁盘含有热插拔功效,具能够灵活组成RAID模式,当一块硬盘损坏,数据能够恢复,确保数据不丢失。对于本系统,Active Server作为工作服务器,Backup Server 作为备份服务器。在正常情况下,Active Server为网络信息系统提供支持,负责整个网络正常运行,同时,经过侦测链路RS
5、-232监视Backup Server运行情况,但发觉Backup Server出现异常时,将立即通知管理员处理,确保切换可靠性。Backup Server经过侦测链路RS-232监视Active Server运行情况,当侦测Active Server出现异常,不能支持信息系统运行时,经过切换,将主动接管Active Server工作,继续支持信息运行,从而确保信息系统能够不间断运行。当出现异常Active Server 经过维修恢复正常后,它会自动抓回先前工作,恢复以前正常时工作状态。因为大量数据存放在磁盘阵列上,所以整个切换过程不会牵涉这些数据,而且不需要占用有限网络资源,提升了切换速度,
6、更深入提升了数据安全性。磁盘阵列用于大量数据存放,包含数据库、文件、共享资源信息等,并对存放数据提供了安全。在硬件上,磁盘阵列采取了设备冗余设计,提供热插拔技术,可在线更换磁盘、电源、风扇、磁盘等;在软件上,磁盘阵列采取RAID0,1,3,5,0+1校验算法,依据实际情况可选择对应算法,对数据进行对应保护。当一块磁盘出现故障后,磁盘阵列将提出警报,只需要更换故障磁盘,磁盘阵列将经过RAID算法将数据自动恢复,这些是由磁盘阵列自动完成,不需要服务器干预,也不会影响系统数据读写。1.3 IBM System服务器双机容错系统处理方案 因为采取了双机容错集群结构,系统含有极高可靠性。两台服务器能够作
7、为一个整体对网络提供服务,且相互间互为监控。集群含有一定负载平衡功效,可将一个任务多个进程分摊到两台服务上运行,提升系统整体性能。当一台服务器发生故障时,其上所运行进程及服务能够自动地由另一台服务器接管,确保网络用户工作不受影响。同时,假如系统采取RAID技术对数据进行保护,可确保关键数据不因系统故障而造成损失。特点:l 高可靠性l w 支持冗余磁盘阵列l w 冗余电源和风扇设计l w 全部部件均支持热插拔l w 主机可各自运行自己应用,互为备份,共享磁盘数据l 高可用性l w可扩展性强/性能价格比高/高容错性,系统安全高效二、选型产品介绍2.1 IBM System x服务器关键点以经济高效
8、高容量处理方案满足不停增加性能和存放需求 有 IBM 卓绝支持提供强大支持,能够实现极高水平系统可用性 设计配置可满足您当今需求,而且在需求伴随时间推移而发生改变时可自由地进行升级 超凡存放价值IBM System x 是一款存放丰富双插槽机架式服务器,该款服务器将传统企业级服务器产品领先功效和可为重视成本购置者提供超凡价值、经济实惠器件相结合。基于最新英特尔 至强 处理器技术,IBM System x 能够提供极高性能和最高存放量。它提供了高达 NTB 内部存放量,能够实现比外部存放低得多成本存放量比,这使其成为了存放密集型工作负载理想处理方案。高度可靠性能IBM System x 凭借可用
9、性特征帮助确保您业务顺畅运行,这些特征包含冗余散热风扇模块、热插拔/冗余电源、RAID 保护和估计性故障分析。IBM System x 还提供了一套全方面系统管理工具,能够帮助简化管理任务。产品特征在极小占用空间内提供超凡性能和超高存放量,有利于支持多种数据密集型工作负载 内置可靠性和可用性功效有利于确保应用程序正常运行时间 灵活设计提供了广泛配置选件,并许可用户在需求伴随时间推移而发生改变时能够升级至更强大功效 热插拔硬盘驱动器和电源能够改善系统易维护性 一套全方面系统管理工具,能够帮助简化管理任务 伴随企业日渐成熟,数据量也在不停增多,数据对于企业价值也在不停增加。假如数据分布在众多服务器
10、和单独存放系统上,企业将面临成本增加、复杂性增高和随之产生业务风险等问题。IBM System Storage DS系列为这些组织指明了道路,使其经过直连或 FC SAN 处理方案来充足发挥整合和共享数据优势。DS3400 易捷版将最优异前端 4 Gbps FC 技术融入 IBM 久经考验设计中,从而带来企业级 RAID 存放。利用 FC 主机连接性和 SAS 后端技术,DS系列能够经过改善数据整合、可用性、性能和可扩展性来提升生产效率。产品特征经过 DSr 轻松实现布署和管理 可灵活地和 IBMSystemx 、Systemp 和 BladeCenter 服务器结合使用 不超出中小企业预算范
11、围 对于想要最初将 DS3400 易捷版布署为 DAS 系统,准备好后再无缝过渡到 SAN 环境而言,是一款最理想系统 因为它能够轻松集成到 1、2 和 4Gbps 基础架构中并以经济价格提供了强大、可靠存放,所以它也很适合现有 SAN “由小到大,随需增加”可扩展性经过 SAS 扩展最多可支持总计 48个驱动器 高级激活密钥功效提供了额外功效性和灵活性 2.2 磁盘阵列备份模式介绍 在双机热备架构中,除了要考虑切换时间外,要依据每个系统作业环境,包含网路系统是单网或是双网,数据库安装和作业内容及用户端设备是经由广域网路、区域网路接入不一样用户有不一样需求,而要求有不一样切换模式,所以选择不一
12、样切换模式,能够使用户端改变达成最少程度。我们依据不一样行业及各行业不一样需求设计多个备援模式以弹性调适用户最好组合及选择。模式-双机双网络适配器(DualEthernetAdapter)双主机各自经过一条SAS电缆线和RAID相联双主机各自运行不一样作业每一主机定义第一网口和第二网口主机A上等一网0在故障时由第二网口接管主机B上等一网0在故障时由第二网口接管主机A故障后,主机B自动接管主机A作业和数据主机B同时接管A主机名(Host)及网络地址(IP)主机A作业将在主机B上自动运行主机A用户(client)可继续运行,无需重新登录主机A一样可作B备份机可进行数机双工备份和网卡备份三、双机热备
13、方案3.1、序言企业和机关运转越来越依靠于计算机系统,假如一旦这个数据处理中心无法正常运转,就会造成业务停顿,造成不可挽回损失。双机热备系统实现功效:是当一台服务器在工作时(称为主机)。另一台服务器作备用状态(称为备机)。当主机因为某种原因出现故障,如死机,主机断电,病毒发作,硬盘损坏、网络故障等,不能继续提供服务时,备机能够在要求时间内接替主机服务,继续提供服务,从而达成在不用人工干预情况下对服务保护。双机系统对外提供一台服务器服务(1个IP地址对外提供服务)。双机系统工作方法:分为双机互被援和双机热备份。双机互备援是两台服务器均为工作机(分别运行不一样应用,互为热备),相互检测对方运行情况
14、。当一台主机(或其应用)出现异常时,另一主机主动接管故障机工作,继续运行应用系统,确保系统不间断运行。双机热备份是一台主机为工作机,另一台主机为备份机,工作机为信息系统提供服务,备份机监视工作机运行情况(同时也在检测备份机是否正常),当工作机出现异常,备份机主动接管工作机工作,确保系统不间断运行。双机热备实现:分为两种,一个是基于磁盘阵列(另外分为基于独立磁盘阵列和基于扩展单元实现方案)公用数据存放在磁盘阵列上,另一个是纯软件双机系统,两台主机共用数据实时镜像。(一)本双机方案适用系统Windows/,Linux,SCO UNIX OpenServer&UNIXWARE(二)适用数据库系统MS
15、SQL,Oracle9i/10g,ybase,ySQL,ostSQL等数据库(三)适用第三方应用程序第三方应用程序提供监控程序,同时可为用户特有程序提供编程结口。(四)双机热备形式Active/Standby、ctive/ActiveActive/Standby方法是传统双机热备份处理方案,主机运行时,备机处于备用状态,当主机故障时,备机立即开启将服务接替。因备机平台没有其它访问量,所以故障切换后用户访问速度不会有大影响,此种容错方法关键适适用于用户只有一个应用,主备机设备配置不太一样,而且用户访问量大情况。Active/Active这种方法主备机平时各自有一个应用运行,当系统中任何一台主机出
16、现故障,应用全部会集中到一台服务器上运行,此时这台备用服务器不仅要负担以前途序运行而且还要运行宕机服务器上应用程序,所以此时备机负担会加重。这种方法故障切换往往会造成备机访问量增大,系统运行变慢。此方法关键适适用户有不只一个应用,用户主备机配置一样且数据访问量不大情况。(五)适用服务器 此双机打包方案适用服务器:为全部Intel架构服务器。(六)双机热备拓扑图Active/Standby方法可支持操作系统:win/,Linux,SCO UNIX可支持数据库:SQL,Oracle,Sybase,Notes等数据库可支持第三方应用程序保护以Active/Standby方法工作,主机宕机备机能够以最
17、快速度开启用户应用。Active/Active方法主机运行SQL数据库,备机运行Oracle数据库,主备机相互热备,当发生主备机切换时SQL和Oracle会在一台服务器上同时运行。3.2、双机工作原理(一)心跳工作过程经过IP做心跳检测时,主备机会经过此心跳路径,周期性发出相互检测测试包,假如此时主机出现故障,备机在连续丢失设定数目标检测包后,会认为主机出现故障,这时备会自动检测设置中是否有第二种心跳,假如没有第二种心跳话,备机则依据已设定规则,开启备机相关服务,完成双机热备切换。(二)IP工作过程IP地址才用虚拟IP地址方法来实现,关键原理图172.16.0.1虚拟IP地址172.16.0.
18、3172.16.0.2 主机实IP地址 备机实IP地址主机正常情况下虚拟IP地址指向主机实IP地址,用户经过虚拟IP地址访问主机,这时,HA软件将虚拟IP地址解析到主机实IP地址。当主机做相关切换时:172.16.0.1虚拟IP地址172.16.0.3172.16.0.2 主机实IP地址 备机实IP地址虚拟IP地址经过HA软件自动将虚拟IP地址解析到备机实IP地址上,这时,虚拟IP地址指向备机实IP地址。但对用户来说,用户访问仍然是虚拟IP地址。所以用户只会在切换过程中发觉有短暂通信中止,经过一个短临时间,就能够恢复通信。(三)应用及网络故障切换过程1、能够检测到操作系统故障并立即将服务切到备用服务器2、当操作系统正常情况下,数据库系统出现意外故障,这时双机容错软件能够立即发觉并将其切到备用服务器,使服务不致于停止。3、当操作系统和数据库系统全全部正常情况下,服务器网络出现故障,这时双机热备软件,能够将系统切到正常备用服务器上。