1、神州天勤高可用集群解决方案 神州天勤高可用集群解决方案1、方案背景信息化时代的来临,使企业对计算机系统的依赖程度日渐增加。尤其在一些关键行业的关键应用上,企业IT业务系统和通信网络承载了诸多商业交易和重要信息资料,因此应用的后台核心系统是否具有高可用性能力,已经成为影响一个公司业务成败的关键因素。高可用性包括保护业务关键数据的完整性和维持应用程序的连续运行等方面。这些信息处理系统中保存了大量的关键业务数据,在系统停止及数据丢失的情况下,这种破坏所导致的业务中断将带来灾难性的影响和损失。随着企业业务的不断扩大,使用的计算机及网络设备逐渐增多,如何减少运营成本(包括减少购置,部署,培训,使用,保养
2、等),同样是企业需要考虑的重要课题之一。购置价格昂贵的专有计算机系统来提高业务系统运行的稳定性,同时付出极高的系统实施及维护成本已不再是大多数企业的唯一被迫选择。如何利用价格较低的PC服务器系统来满足用户对于安全性及可用性的需求,同时保证业务的连续稳定运转,正是我们可以帮您解决的。神州天勤公司作为立足于中国市场的软件解决方案及技术服务供应商,致力于推广高可用集群软件解决方案,为客户提供一系列优秀的软件产品、专业服务与技术支持。高可用集群软件解决方案,为用户提供了具有单点故障容错能力的系统平台,是计算机应用系统稳定、可靠、有效、持续运行的重要保证。它通过系统冗余的方法解决计算机应用系统的可靠性问
3、题,并具有安装维护简单、稳定可靠、监测直观等优点。它采用主服务发生故障时备服务器接管的机制,实现在线故障自动切换,实现系统724小时不间断运行,保证了用户数据的可靠性和系统的持续运行,避免停机造成的损失。2、方案介绍神州天勤公司根据用户的不同需求提供的多种高可用方案可以应用在几乎所有的PC及服务器上,适用于i386、x86_64、ia64、ppc64等主流的硬件平台。高可用软件不但支持目前市场主流的多种服务器操作系统,而且支持众多的数据库和应用软件,操作简单、配置快捷、可靠性高。高可用软件需要同时安装在两台或多台主机上,以监视系统的状态,协调集群组主机间的工作,维护系统的可用性。它能迅速侦测到
4、硬件、应用软件发生的故障,并及时地进行故障告警、隔离、恢复,能防止应用业务主机的意外性或计划性宕机造成的服务停顿,以最低成本提供给用户几乎不停顿的信息处理平台。 根据不同的应用环境,神州天勤公司提供了基于两类产品(双机高可用和一备多高可用)、两种操作系统平台(Windows和Linux/Unix)、两种用户数据共享方式(共享磁盘阵列和数据镜像技术)的多种高可用性解决方案。如下表1:高可用解决方案操作系统平台基于共享磁盘阵列的高可用解决方案基于数据镜像技术的高可用解决方案Windows操作系统平台双机高可用Skyge WinHA系列Skyge WinHA系列(基于系统的文件镜像)一备多高可用Sk
5、yge Multi-NodeWinHA系列 Skyge Multi-NodeWinHA系列(基于系统的文件镜像)Linux/Unix操作系统平台双机高可用Skyge HA系列Skyge HA系列(基于磁盘镜像)一备多高可用Skyge Multi-Node HA系列Skyge Multi-Node HA系列(基于磁盘镜像)表1-神州天勤解决方案2.1、基于共享磁盘阵列的高可用双机解决方案基于共享磁盘阵列的高可用双机解决方案要求,分别在两台服务器(主机)的内部存储(硬盘)上安装用户的操作系统、应用软件和HA双机高可用软件,并且两台系统都与磁盘阵列(共享存储)系统直接连接,使用的用户数据库等共享数据
6、存放在磁盘阵列上,两台主机之间通过心跳网络连接。对外业务工作时,由一台主机提供服务,另一台作为备份机。客户是通过一个虚拟IP(或称浮动IP)来访问业务服务的。其架构如下图1:图1-基于共享磁盘阵列的高可用双机架构在系统开始工作后,HA双机高可用软件开始监控系统,通过心跳网络传递心跳信息,每台主机上的HA软件随时在监控另一台主机的状态。当对外业务主机(主节点)发生故障时,心跳信息就会产生变化,这种变化可以通过网络线传递到备份机(备节点)的HA软件。随后,HA就会控制系统立即进行服务切换,备份机启动和对外业务主机一样的应用程序,接管对外业务主机的工作(包括提供TCP/IP网络服务、文件共享、数据库
7、等服务),并进行报警提示管理人员对故障主机进行维护。当维护完毕后,HA可以自动或手动地将切换回原先的对外业务主机。也可以选择不切换,此时维修好的主机就作为备份机,双机系统继续工作。这种双机工作模式为主备方式(Active-Standby),即一个节点做为主节点,对外提供服务,另一个节点做为备节点,监控主节点,随时准备接管服务。是双机方案中最常见的热备方式。还有一种更高效的双机工作模式,互备方式(Active-Active) 。它是指两个节点上都有服务(两个节点上运行的服务不同)在运行,此时每个节点既是本节点上服务的主节点,又是对方节点上服务的备节点。互备方式工作模式如下图2:图2-基于共享磁盘
8、阵列的高可用双机工作模式HA工作流程:以数据库高可用为例,介绍当主节点出现故障后HA切换过程。当主节点数据库异常后,HA会自动检测出此故障。此时HA在主节点的工作过程如下: 停止数据库 卸载共享磁盘分区 释放浮动IP地址随后,HA会在备节点上将数据库应用拉起,工作过程如下: 启动浮动IP地址 挂载共享磁盘分区 启动数据库解决方案优点: 系统切换时间短,最大程度减少业务中断的影响。 切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。 系统效率高,系统中数据读写、管理及容错由磁盘阵列来完成。而系统服务器故障监控切换处理由HA软件来完成。双机监控的多条专用100/1000M网卡线路,既不占
9、用主机CPU资源也不占用基础业务网络带宽。 支持丰富的应用配置,如:数据库应用Oracle、SQL Server、Sybase、MySQL等,文件服务应用NFS、SMB/CIFS等,WEB应用Apache、IIS等,商业应用Websphere、Weblogic等。 对服务器硬件配置要求较低,且互备方式有效分摊系统负载,可充分提高服务器硬件资源的利用率。 硬件可采用机架式结构,便于维护管理。2.2、基于数据镜像技术的高可用双机解决方案通常在高可用软件中,为了保持数据一致性,不同的节点需要共享磁盘阵列。但是对于很多系统来说,一个磁盘阵列的造价太过昂贵。因此出现了通过软件来实现共享数据的镜像技术。在
10、Skyge的高可用产品中,WinHA系列产品使用的数据镜像技术是基于文件系统的镜像技术,HA(Linux版)系列产品使用的数据镜像技术是基于磁盘的镜像技术。基于文件系统的镜像技术是通过在两台机器中分别建立一个虚拟文件系统(Virtual File System),两台机器的虚拟文件系统通过网络进行通信。当一台主机进行写数据操作时,本机的VFS负责接收操作指令,并同时将指令发给另一台主机的VFS。然后两端的VFS再将操作指令传送给各自系统中的文件系统完成写数据操作,来实现数据在两台主机中的一致性。WinHA系列产品的基于文件系统的镜像技术原理如下图:3图3-VFS的实现原理DRBD(全称为:Di
11、stributed Replicated Block Device)是在Linux系统中一种基于磁盘的网络镜像软件。DRBD的基本原理相当简单,那就是把两台机器的两块磁盘通过网络连接在一起,形成一个RAID1系统。两块磁盘的数据在任何时刻都保证是一致的。DRBD负责接收数据,把数据写到本地磁盘,然后发送给另一个主机。另一个主机再将数据存到自己的磁盘中。DRBD是由内核模块和相关用户态程序构成,用以构建高可用性的集群。其实现方式是通过网络来镜像整个设备。它允许用户在远程机器上建立一个本地块设备的实时镜像。与心跳连接结合使用,也可以把它看作是一种网络RAID。DRBD的实现原理图,如下图4:图4-
12、DRBD的实现原理这种不需要共享存储的纯软高可用性解决方案,要节约很多成本,因为在价格上IP网络要比专用的存储网络经济的多。图5-基于数据镜像技术(DRBD)的高可用双机工作模式解决方案优点: 系统切换时间短,最大程度减少业务中断的影响。 切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。 不需要磁盘阵列,具有较高的性能价格比。 高效成熟的多种镜像方式,支持完全镜像、差分镜像。 最佳化的按需复制,支持自定义复制数据集。HA的数据镜像是基于文件系统之上的以字节为单位的按需复制,充分保证了系统性能和效率的最佳化。 消除备份窗口。备份时可以使备机写入暂停或主机传输暂停,在主机应用在线持续运
13、行的情况下,通过备机对数据进行备份操作。 支持丰富的应用配置,如:数据库应用Oracle、SQL Server、Sybase、MySQL等,文件服务应用NFS、SMB/CIFS等,WEB应用Apache、IIS等,商业应用Websphere、Weblogic等。 对服务器硬件配置要求较低,且互备方式有效分摊系统负载,可充分提高服务器硬件资源的利用率。 简洁直观的管理工具,体贴的应用配置向导支持,便于维护管理。2.3、基于共享磁盘阵列的一备多高可用(N-1)解决方案对于一般的双机热备来说,虽然大大提高了系统的可靠性,但是一些对于成本比较敏感的行业或者应用,双机热备显得略微奢侈了一些。基于这方面的
14、考虑,神州天勤公司提供了N-1解决方案。也就是对于多个应用服务器来说,只提供一个备节点(即中心节点)。所谓的N-1解决方案,包括基于共享磁盘阵列的N-1解决方案和基于数据镜像技术的N-1解决方案。基于共享磁盘阵列的N-1解决方案的基本结构如下图6所示。图6-基于共享磁盘阵列的N-1集群架构N-1的解决方案中,位于中间的应用服务层可以对应N台不同应用的服务器,他们和后台的Center backup server(中心节点)相连接。Center backup server充当了当前的N台应用服务器的热备机。在应用服务器和热备机之间是共享的磁盘阵列。N台应用服务器中的任意一台与中心节点的连接方式都和
15、双机高可用的方式一致。通过网络互联来达到建立连接的目的,这样也避免了需要在中心节点上安装多块网卡和网卡的数量限制,提高了灵活性。在系统初始化过程中,中心节点上要与所有应用服务器建立起心跳机制来保证随时监控的可靠性。系统运行过程中,中心节点始终对于连接到系统中的应用服务器进行监控,当任意一台应用服务器产生故障的时候,中心节点侦测到故障后,会立刻启动切换动作,将故障机上的所有应用接管到中心节点上。在故障切换发生后,系统进行报警提示管理人员对故障主机进行维护。这时候管理人员应该即刻更换应用服务器,在合适的时机将应用从中心节点切换回应用服务器,从而保证系统中中心节点始终处于待机状态。解决方案优点: 适
16、应性好,节省经费。 系统切换时间短,最大程度减少业务中断的影响。 切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。 系统效率高,系统中数据读写、管理及容错由磁盘阵列来完成。而系统服务器故障监控切换处理由HA软件来完成。监控的专用100/1000M网卡线路,既不占用主机CPU资源也不占用基础业务网络带宽。 支持丰富的应用配置,如:数据库应用Oracle、SQL Server、Sybase、MySQL等,文件服务应用NFS、SMB/CIFS等,WEB应用Apache、IIS等,商业应用Websphere、Weblogic等。 对服务器硬件配置要求较低,有效分摊系统负载,可充分提高服务器
17、硬件资源的利用率。 硬件可采用机架式结构,便于维护管理。2.4、基于数据镜像技术的一备多高可用(N-1)解决方案对于为成本考虑更为苛刻的客户来说,磁盘阵列也是负担沉重的一种设备,基于这方面的考虑,神州天勤公司的N-1解决方案中同样提供了无磁盘阵列的基于文件镜像的方式和基于DRBD镜像的实现方式。其应用场景和典型的双机模式没有区别。在Linux平台中,如下图7是Skyge Multi-Node HA的DRBD解决方案架构。图7-基于DRBD的Skyge Mult-Node HA架构从图上可以看出来,基于DRBD的N-1模式仅仅是将磁盘阵列换成了DRBD的磁盘映射。这样对于一些对性能要求不高的应用
18、,完全可以省去购买磁盘阵列的费用。DRBD是独立提供的服务,因此配置灵活,用户可以按照自己的需求来决定选取何种解决方案。解决方案优点: 适应性好,节省经费。 系统切换时间短,最大程度减少业务中断的影响。 切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。 不需要磁盘阵列,具有较高的性能价格比。 高效成熟的多种镜像方式,支持完全镜像、差分镜像。 最佳化的按需复制,支持自定义复制数据集。HA的数据镜像是基于文件系统之上的以字节为单位的按需复制,充分保证了系统性能和效率的最佳化。 消除备份窗口。备份时可以使备机写入暂停或主机传输暂停,在主机应用在线持续运行的情况下,通过备机对数据进行备份操
19、作。 支持丰富的应用配置,如:数据库应用Oracle、SQL Server、Sybase、MySQL等,文件服务应用NFS、SMB/CIFS等,WEB应用Apache、IIS等,商业应用Websphere、Weblogic等。 对服务器硬件配置要求较低,有效分摊系统负载,可充分提高服务器硬件资源的利用率。 简洁直观的管理工具,体贴的应用配置向导支持,便于维护管理。2.5、可定制的高可用集群方案神州天勤作为国内高可用集群软件开发、提供商,拥有强大的自主研发能力。除了提供通用的高可用集群解决方案外,还可以为用户提供可定制的高可用集群解决方案。必要时,也可以将HA软件嵌入到用户的应用程序中。当遇到有特殊需求的用户(如在软件中增加某些特殊功能),我们可以根据要求为用户量身定制。简单小功能的改进将在两周内完成,复杂功能改进一般不会超过四周。由于软件具有完全的自主知识产权,无论用户需要什么样的附加功能,我们都能满足用户的需求。解决方案优点: 量身定制。 深度贴近用户的应用需求。 方案响应快,在短时间内为用户提供方案。 接口开放,方便用户自行定义HA的行为,为用户提供更大的灵活性。 神州天勤软件技术有限公司地址:北京市海淀区上地信息路1号金远见大厦802室电话:010-82359411/12 邮编:100085传真:010-82359428 支持:Support 11 / 11