资源描述
2019 中国灾备行业白皮书White Paper on China Disaster Recovery Industry,2019英方研究院 灾备技术国家工程实验室 灾备技术产业联盟联合发布2019 中国灾备行业白皮书编审委员会顾问杨义先 灾备技术国家工程实验室主任、教授、博导、长江学者于 天 国际灾难恢复协会中国分会(DRI China)总裁颜 军 北明软件有限公司 首席技术官主编胡军擎 上海英方软件股份有限公司 CEO辛 阳 灾备技术国家工程实验室 常务副主任、教授、博导副主编周 华 上海英方软件股份有限公司 CTO编委会(按姓氏笔画排列)付向阳 朱洪亮 刘小亮 任祥旺 张宝君 张 东 宋希岭 宋安妮 严 俊 秦金龙 黄继生 崔立达 符云波 程 权 焦新军装帧设计文荣金 段景晨内容简介经过一年多的悉心准备,2019 中国灾备行业白皮书正式与您见面。经过多年发展,越来越多的组织和单位对灾备重视程度不断提升,整个灾备市场快速向前发展。在此背景下,此白皮书的定位为灾备行业基础性科普读物,力求尽量全面地向读者呈现灾备的相关概念、术语、法规条文,以及技术原理、流派、趋势和灾备行业市场、特点、解决方案等内容,并希望借此白皮书起到抛砖引玉的作用,让更多的人了解灾备行业正在发生的改变和创新。本白皮书共分为六个章节。第一章介绍灾备的相关知识与技术概述,包括灾备定义、等级以及复制、归档、切换、去重等具体技术。第二章介绍灾备行业合规性要求,包括国际、国家标准以及相关认证等内容。第三章介绍灾备业务实施及服务质量评价,包括建设内容、灾备演练以及灾备服务质量评价等内容。第四章介绍企业上云与云灾备相关知识,包括上云等具体步骤,云灾备相关发展历程和具体实施事项等。第五章重点介绍相关行业灾备建设特点及方案,包括政府及组织、金融、医卫、制造、教育、电信、电力等内容。第六章主要谈灾备行业的趋势,包括灾备市场规模以及相关趋势等内容。2019 中国灾备行业白皮书极大地丰富了此前几版白皮书的相关内容,同时从更 广阔的维度去看待灾备行业。在此要特别感谢中国灾备技术产业联盟的大力支持,以及包括英方十几位高级售前工程师在内的众多行业专家对重点章节内容提出的宝贵意见。与此同时,在白皮书编写的过程中,我们也借鉴 了相关出版物、网络权威文章及行业报告,在此一并感谢:1探讨双活灾备的建设思路J 谢志勇 通信电源技术 2018(09)2关于企业信息系统灾备中心建设方案探讨J 周琦 中国管理信息化 2018(12)3公共安全-业务连续性管理体系要求国家标准(GB/T 301462013).4云灾备技术与应用白皮书R 北京信息灾备技术产业联盟,2017.5数据迁移在医院多院区建设中的实践J 王梓名、张怡琳 科技风 2018(10)6核心数据容灾系统建设方案J 何欢 网络安全和信息化 2018(11)推荐语在我们可以预见的未来,数据安全行业将迎来迅猛发展,作为数据安全最后一道防线,灾备技术具有巨大的市场前景。当前,每个数据中心每一业务系统所关心的最主要问题就是业务如何连续运转的问题,这其中,既有业务模式方面的,也有系统支撑方面的,还有传输效率方面的,它们都属于灾备技术所需要考虑的问题。未来,每一个用户或服务提供商都需要考虑数据的重要级别、成本投入、系统兼容等方面的问题,这些问题的解决可以从这本白皮书中获得一些启发。华中科技大学计算机学院院长、长江学者、国家杰青 冯丹这是我第三次收到英方所编著的灾备行业白皮书,也是第一次正式向大家推荐这本白皮书。与其说是白皮书,不如说这是一本灾备行业的解决方案指南,白皮书中关于灾备业务的设计、执行、演练等内容,不仅是对灾备行业,对其他的IT 业务同样具有指导作用,此外,这本白皮书对已经制定了云端战略的企业以及像 Oracle 这样的云计算公司而言,也都是一本非常实用的书。Oracle ISV&OEM 事业部中国区总经理 李奔2016 年 51CTO 作为独家发布平台第一次参与了英方这本白皮书的发布,并见证了英方及整个灾备行业这些年的发展。英方本次白皮书的发布,通过详实的解决方案和项目案例,进一步展现了不同行业目前的发展和未来的趋势。无疑,这是一本技术性的白皮书,也是一份有洞察性的白皮书,是整个灾备行业发展的重要路标。51CTO 传媒总裁 熊平信息安全是当今各个行业面临的重大的问题之一,它关乎国家战略乃至全人类的命运。数据、系统、业务层面的灾备建设是信息安全的最后一道防线,已经成为所有信息系统中最重要的组成部分。如何来规划、建设以及采购适合自己的灾备系统,曾经困惑了许多单位的相关负责人。这本白皮书详细介绍了灾备的知识与技术、相应的标准与规范、灾备业务实施及服务质量评价、企业上云与云灾备的有关知识。特别是有针对性地介绍了不同行业灾备建设的特点及方案,为信息主管们提供了可靠的依据,是一个具有里程碑意义的文献。焦作市人民医院信息科 古金鹏2019 中国灾备行业白皮书是英方研究院编著的一本灾备行业基础性科普读物。全书分为灾备知识及技术概述、灾备行业合规性要求、灾备业务实施及服务质量评价、企业上云与云灾备、重点行业灾备建设特点及方案分析和灾备行业发展趋势六大部分。本白皮书从理论知识出发,结合具体典型案例,详细介绍了政府、企事业单位等行业信息化灾备面临的问题,并提出相应的解决方案及未来发展趋势,这样对知识的理解和实际应用有机结合为一体,能更好的帮助政府,企事业单位,个人了解灾备技术发展现状和相关应用。本白皮书也可以作为云灾备技术服务的建设方和服务方提供技术参考和理论支撑。贵州大学副教授、公共大数据国家重点实验室办公室主任 陈玉玲这是一本白皮书,同时也是一本教科书。在这本白皮书里,你将了解几十年的灾备历史、了解当下的灾备行业现状、洞察整个行业的未来趋势。这是一次集体智慧的结晶,是英方人不懈努力的成果。他们结合自己的实践经验,解答了很多关于灾备、关于数据管理的问题,为他们点赞。山西医科大学第二医院信息管理处 柴国丽应英方之邀,为“2019 年中国灾备行业白皮书”撰写一个推荐语。本着负责任的态度,仔细阅读了白皮书,其中,企业上云和行业解决方案带来了惊喜,也抓住了当今行业的热点和市场的核心。毫无疑问,云计算的趋势不可阻挡,不论你是否喜欢和接受,云计算都是你必须要面对的问题。表面看来,企业上云,云化和灾备并不是一个维度的问题,二者之间的关系也不能够简化为云计算系统的灾备问题,更不能够简单理解为传统容灾保护技术的云化问题。在云的环境中,数据保护,安全性、可靠性、稳定性的问题并没有随着云化而自然消失;在云环境中,仍然需要备份和容灾技术应用,其中,核心的还是数据的问题。而其中复制技术的应用是关键,这也是英方最擅长的技术。以这个技术作为保障,结合行业管理的需要和行业需求的特征,针对性行业解决方案真正做到了有的放矢,具有行业指导和借鉴的意义。作为数十位专家心血的结晶,“2019 年中国灾备行业白皮书”在专业性、知识性以及行业前瞻性方面具有代表性,也是行业用户、业内从业者不可或缺的有益的指南。更为难能可贵的是,灾备的问题已经不仅仅是备份、容灾的应用问题,实质也是数据的使用和管理问题,不管是数据备份、容灾到云,还是云计算应用的本地化保护问题,何尝不是混合云的应用和方法问题呢?至少是一个可以落地的开始。存储在线(Dostor)总编 宋家雨和英方是老朋友了,当得知由英方编写的2019 中国灾备技术白皮书即将发布,所以送上真诚的祝福。满满 97 页的干货,对于做文字工作的我来说,完全可以体会这其中包含多少辛劳,编写者要熬过多少个漫漫长夜。这样一本饱含诚意,兼具专业与实用性的白皮书,一定可以让灾备行业的专业人士受益匪浅,同时也是想对灾备行业有全盘性了解的人的理想选择。从 2016 开始,英方已经连续第三年编写中国灾备技术白皮书,不仅内容越来越充实,而且具有前瞻性,这得益于英方多年的技术积累和实践经验的总结。从最早推出云灾备概念和服务开始,英方的专注与创新总能带来惊喜。就在前不久,英方发布了数据统一管理平台(i2UP),进一步扩展了灾备的外延,明确了“灾备将成为重要的数据管理平台”这一趋势。这与数据驱动业务的大方向完全吻合。在数字化、智能化大行其道的今天,安全、业务连续性比以往任何时候都更重要。未雨绸缪,让世界早有准备,这不仅是灾备存在和持续发展的重要意义,也是英方的价值所在。网络安全和信息化杂志总编助理 郭涛有幸拿到这份白皮书的抢鲜版,一口气读完 108 页的干货,这让我对灾备行业拥有了更全面的认知。从基本概念到行业标准,再到技术流派、前瞻趋势,最可贵的是多个主流行业的灾备落地实践,涵盖了金融、政府、电信、医卫、教育、制造业,这是一副灾备技术的全景图。现阶段,灾备建设在整个 IT 建设中,往往变成“意识上重视、执行中忽视”的环节。IT 事故虽是小概率事件,但一旦被“锅”砸中,就成为 100%的灾难。随着 IT 技术成为企业生产力、数据成为企业核心资产,灾备的重要性会越来越凸显。这个世界没有侥幸,我们能做的,就是“让世界早有准备”!知名自媒体人 小黑羊处于客户时代下的数字商业需要可靠、可预测的技术基础架构,而 Disaster Recovery 不仅是实现这一目标的关键支柱,也日益成为企业架构数据管理的重要考量。包括云原生、机器学习、边缘计算、区块链等新兴科技的快速发展不仅推动着灾备市场的持续演进,而且为企业技术决策者和实践者带来了新的挑战。此份白皮书从不同视角探讨了中国灾备行业的发展趋势与行业实践,是普及灾备知识、推广灾备理念的有益探索。Forrester 企业架构首席分析师 Charlie Dai9.11 之后,云计算之前,灾备已成为企业 IT 的必修课。如果说 9.11 促使有足够实力的企业接受了两地三中心的理念,那么云计算基础设施普遍追求的局部三点或多点布局、全球范围分布,则让相当一部分用户误以为灾备不再是需要自己操心的事情。然而,从物理断网到人为失误,云计算提供商的故障时有发生。所以,无论是出于业务连续性还是合理利用资源的考虑,都促使企业采用多云及混合云的部署方案,并构建一套行之有效的灾备体系。2019 中国灾备行业白皮书可谓生逢其时,希望它能帮助广大企业免受业务中断或数据丢失之苦。E 企研究院 首席分析师 张广彬推荐序(一)打造信息系统的“诺亚方舟”信息网络技术、生产活动方式、管理决策等诸方面产生了深远的影响,云计算、大数据、区块链和人工智能等信息产业成为推动中国经济增长的强大引擎,“互联网+”已成为创新驱动下的互联网发展新业态,推动经济形态不断地发生演变,从而带动社会经济实体的生命力,为改革、创新、发展提供广阔的网络平台。信息系统是企业和组织运营的基础平台,数据则是关系到自身利益的核心资源,信息化时代的工业生产、企业管理、社会治理和和人员交流需要 IT 基础设施和业务系统提供强有力的支撑。以电商平台为例,业务系统的停机不仅会中止交易,损坏数据,给企业带来重大损失,还会影响用户体验,导致用户流失;在高校,多媒体教学、校园管理、科研实验、各种校园活动等都离不开信息系统的支持,一旦出现问题,将导致学生不能选课、教学中断,科研实验数据丢失,给后续工作带来严重影响。因此,业务连续性和数据可用性关系到企业生存、社会治理、教育发展等方方面面,保证信息系统数据和业务安全,为企业和组织的运营提供连续性服务显得至关重要。随着信息化上升为国家战略,国家对于信息安全防护和保障越来越重视,并将“信息安全”纳入总体国家安全观,越来越多的个人和单位逐渐意识到建设信息系统安全保障体系的紧迫性和必要性,正所谓:“居安思危,思则有备,有备无患”。作为一个教育工作者,30 多年来我一直从事网络信息系统安全教育和管理工作,见证了很多信息系统的灾难事件,也参与了多个行业灾备系统的规划、设计、评审和建设工作,深深体会到灾备建设对保障企业信息系统安全和业务的重要性。英方公司作为一家专注于数据安全及业务连续性管理领域的科技企业,注重总结多行业灾备建设实践和管理经验,在数据安全和业务连续性领域展现出了强大的自主创新能力,能为各行业用户提供可靠的技术保障服务,英方公司成熟的灾备技术产品、完善的灾备保障体系可为信息系统打造坚固的“诺亚方舟”。灾备是利用 IT 技术对信息系统的数据和应用程序进行保护,确保系统遭受灾难时数据的安全,为业务连续性和数据可用性提供重要保障。这本白皮书从灾备的概念、规范和案例等不同角度介绍了灾备的技术知识、实施方案及应用成果,涵盖了几乎所有的灾备系统架构和技术方案,内容全面,技术专业,通俗易懂;既能作为初学者的“引路人”,也能成为管理人员的“技术手册”,这样的白皮书并不多见。英方公司花费大量人力物力编写灾备行业白皮书,并无私地将其一线工程师在行业实践上取得的重要成果与广大IT从业人员和灾备技术人员分享,也体现了英方公司“未雨绸缪,防患未然,让世界早有准备”的初心与使命。华东理工大学计算机技术研究所信息安全研究室主任 黄建华2018 年 12 月推荐序(二)未雨绸缪,有备无患中国互联网应用技术的日新月异,正在加速以互联网商业为中心的生态圈建设。企业为了能够全天候不间断地为用户提供服务,必须保障其购物网站稳定可靠地运行,尤其是在每年一度的“双 11”购物疯狂节期间,企业更是必须确保其电商网站对外服务的连续性。因此,业务连续性管理已受到越来越多包括电商在内的企业的高度重视。近十年来,虽然业务连续性管理已在中国的金融、电信等大型企业得到越来越多的应用,但其应用范围仍局限在少数关键领域,其他更多的行业对其认知度还不够高,还没有认识到业务连续性管理与其生存和发展的紧密关系。事实上,在很多重大的灾难事件中,比如“汶川地震、911 恐怖袭击、卡特里娜飓风”等,由于许多企业没有建立业务连续性管理体系和制定业务连续性计划,遭受了无法挽回的重大损失。另一方面,随着中国社会信息化指数的不断提升,云计算、大数据、人工智能等前沿科技的蓬勃发展,给人类生活和生产带来诸多便利的同时,也遭受越来越多的网络攻击、勒索病毒、钓鱼软件等日益猖獗的威胁。如何确保组织的信息安全及业务连续性,使组织从容应对各种大灾小难,是大多数企业共同面临的挑战。而灾难恢复(灾备)在实现组织业务连续性目标中又起着至关重要的作用,因此,研究探讨灾备技术的发展,总结各种实用有效的灾备方案及其实施经验,供各行各业的相关从业人员在实践中加以参考,就是件非常有意义的事。英方公司作为中国灾备领域的长期实践者,能够投入如此多的时间,组织许多经验丰富的专家将自己长期在各行业灾备项目实践中积累的宝贵知识和心得总结出来,并编写成灾备技术白皮书无私地分享出来,实在是难能可贵。国际灾难恢复协会(DRI International)是一个非营利的学术机构,其致力于通过专业的培训活动来推广有关业务连续性和灾难恢复的知识,并对个人进行有关 BC/DR 领域国际权威的从业资格认证。作为国际灾难恢复协会中国分会(DRI China)的负责人,我多年来有幸参与和见证了中国各行各业的灾备建设与发展,并从业务连续性管理角度为许多企业的灾备建设提供了自己的建议,帮助企业理解业务连续性管理方法对灾备建设的重要指导意义。尤其是很高兴能与像英方这样的专注于灾备产品开发和服务并掌握核心灾备技术的专业公司合作,共同在各行业推广业务连续性管理和灾备技术的知识和应用,帮助各企业做好应对各种突发事件的准备,确保企业具备抵抗任何灾害袭击的能力,正所谓“未雨绸缪,有备无患”。这本汇集各方专家见解的灾备技术白皮书涵盖的内容很全面,涉及的技术很专业。据我所知,中国目前像这样全面系统地论述灾备技术专业资料并不多见,免费公开的就更少。英方公司从 2016 年起就一直坚持不懈地花费大量时间组织多方专家编写中国灾备技术白皮书,并无私地供广大灾备从业者分享,确实体现了英方公司作为灾备行业领先者的应有担当。国际灾难恢复协会中国分会总裁 于天2018 年 12 月推荐序(三)让世界早有准备!当今世界,以互联网产业化、工业智能化和工业一体化为代表的第四次工业革命已经悄然到来。在这个进程中,全新的技术革命带来数据信息瞬息万变的交汇、管理和利用,并普惠社会的方方面面。作为这场技术革命的参与者和引领者之一,中国政府从“互联网+”到“中国制造2025”,与时俱进地为全行业指明了未来发展的方向。中国高铁、移动支付、量子通信、北斗导航等一张张响彻世界的中国名片,是产业信息化带来的生产效益和经济效益快速提升的必然结果。在这些宏大的产业信息化领域,越来越多的人和单位已经意识到,信息安全保障体系的作用非常关键。为此,中国政府已经将信息安全的工作提升到国家战略高度,并制定相关的法律法规贯彻下去。灾备,被誉为企业信息安全的最后一道防线,是新时代产业信息化运营的保障体系之一。它的终极目标是确保组织单位的数据不丢,业务不停,在规定的时间内持续、稳定地对外提供服务。我觉得,这也是英方的价值所在。今天,英方已经能够为客户快速找回丢失的数据,能够让用户的业务永续,并在操作的过程中,摒弃了以往传统容灾备份诸多的不确定性,让整个灾备的运维体系更加便捷、智能、安全和经济。这一切离不开信息技术日新月异对行业带来的利好。英方作为一家长期专注于容灾及业务高可用领域的高新科技企业,时刻关注着灾备领域国内外的最新动态,并在长期的灾备建设实践中总结了很多宝贵的实战经验。这本白皮书是我们全国各地一线工程师厚积薄发的工作成果,特别是在行业实践方面,本书非常详细地阐述了八个主要行业的灾备情况,希望能够给大家带来启迪,同时也希望大家多提宝贵意见,共同服务行业的健康发展。未雨绸缪,防患未然,让世界早有准备!这是英方人的使命。我们深知抵达这一使命的艰辛与不易,但这并不能撼动我们将灾备事业进行到底的决心。板凳要坐十年冷,在软件这个高科技行业,在过去,中国企业长期处于模仿学习的阶段,但是随着中国全球发展战略的提速,核心软件技术国产化,我们正处于迈向弯道超车的绝佳黄金时期。一个民族有一群仰望星空的人,这个民族才有希望。今天,构建高效的 IT资产保护体系,服务全球客户,英方人的愿景正在一步步的实现。上海英方软件股份有限公司 CEO 胡军擎2018 年 12 月目录第一章 灾备知识与技术概述 11.1 灾备定义与演进.11.2 灾备的重要性.11.3 信息灾备发生方式.21.4 灾备知识及技术.21.4.1 备份.21.4.2 容灾.51.4.3 业务连续性.61.4.4 灾难恢复衡量指标 81.5 灾备的三个等级91.5.1 数据级灾备.91.5.2 应用级灾备.91.5.3 业务级灾备.91.6 灾备技术概述.101.6.1 数据复制技术.101.6.2 归档和快照技术 161.6.3 切换技术 171.6.4 数据去重技术 201.6.5 数据加密与传输技术 211.6.6 常见存储形态及架构.221.6.7 相关技术创新.25本章小结 30第二章 灾备行业合规性要求 312.1 国际标准及法规.312.1.1 SHARE78 312.1.2 ISO 22301 322.1.3 BS 25999 332.1.4 GDPR 332.2 国家标准及法规.332.2.1 GT/T20988-2007 332.2.2 GB/T30146-2013 352.2.3 GB/T 31595-2015 362.2.4 中华人民共和国网络安全法 362.3 DR 及 BCM 相关认证.36本章小结 37第三章 灾备业务实施及服务质量评价 383.1 灾备建设三部曲383.1.1 业务连续性规划 383.1.2 方案设计.393.1.3 方案实施.393.2 灾备演练403.3 专家服务(ADTIS)413.4 灾备服务质量评价.42本章小节 43第四章 企业上云与云灾备 444.1 企业上云444.1.1 什么是企业上云 444.1.2 企业要上什么云 444.1.3 企业要如何上云 454.1.4 政府部门组织上云 454.2 云灾备.464.2.1 云灾备定义.464.2.2 云灾备发展历程.464.2.3 云灾备的特点.474.2.4 云灾备实施注意事项.494.2.5 虚拟化及混合云化.504.3 云灾备业务模式.504.3.1 SaaS 层灾备.514.3.2 PaaS 层灾备.514.3.3 IaaS 层灾备.514.3.4 DRaaS 524.4 云灾备的主要产品形态.524.4.1 云迁移.524.4.2 云备份与恢复.534.4.3 云容灾.54本章小结 55第五章 重点行业灾备建设特点及方案分析 565.1 政府及组织灾备建设特点及方案分析.565.1.1 行业概览 565.1.2 需求与解决方案 575.1.3 典型用户案例.595.2 金融行业灾备建设特点及方案分析.615.2.1 行业概述.615.2.2 需求及解决方案 635.2.3 典型用户案例.685.3 医卫行业灾备建设特点及方案分析.705.3.1 行业概览.705.3.2 需求与解决方案.725.3.3 典型用户案例.745.4 制造业灾备建设特点及方案分析.765.4.1 行业概述.765.4.2 需求与解决方案 775.4.3 典型用户案例.785.5 教育行业灾备建设特点及方案分析.805.5.1 行业概述 805.5.2 需求与解决方案 805.5.3 典型用户案例.825.6 电信运营商灾备建设特点及方案分析.835.6.1 行业概览.835.6.2 需求与解决方案 845.6.3 典型用户案例.865.7 能源行业灾备建设特点及方案分析.875.7.1 行业概览 875.7.2 需求与解决方案 885.7.3 典型用户案例 90本章小结 92第六章 灾备行业发展趋势 936.1 灾备市场规模.936.1.1 中国市场 936.1.2 全球市场.946.2 主要趋势.946.2.1 云灾备依旧是趋势.946.2.2 灾备将成为重要的数据管理平台.956.2.3 灾备是网络信息安全的重要保障.966.2.4 灾备依托于数据复制技术的发展.966.2.5 灾备人才队伍建设持续加快.97本章小结 97第一章 灾备知识与技术概述1第一章 灾备知识与技术概述数据安全、业务连续和用户隐私,是信息化环境下各类用户最重要的安全原则。用户通过自身的技术创新和领先的灾备供应商的解决方案,为新 IT 环境下的数据和应用规划统一的灾备策略,将灾备变成真正意义上的能带来运行效益和声誉的信息系统工程。1.1 灾备定义与演进灾备是指组织的灾难备援。在信息化的IT系统中,灾备是指在灾难未发生前,利用 IT 技术对信息系统的数据和应用程序进行保护,包括本地及异地的数据备份、应用和场所的接管等,确保系统遭受灾难时数据的安全,以及业务的快速恢复,为企业的正常运行提供服务。灾备起源于上世纪 70 年代的美国。1979 年,IT 公司 SunGard 在美国费城建立了全世界第一个灾备中心。当时人们关注的重点是企业 IT 系统的数据备份和系统备份等。随后 IT 备份发展到了灾难恢复规划(DRP),并在 IT 备份中加入了灾难恢复预案、资源需求和灾备中心的管理,形成了对生产运行中心的保障概念。此后,人们进行灾难恢复规划时,将保护 IT 系统的灾备范畴拓展到 IT 所支持的业务领域,并根据保护业务的要求衡量灾备的目标哪些业务最重要?哪些业务需要最先恢复?美国“911 恐怖袭击事件”后,全球用户提升了对灾备的重视程度,异地灾备建设一时成为趋势,并且从全面风险管控的角度出发,以及 IT 技术的不断更新,灾备的范畴从传统的数据和系统备份、恢复,业务连续性规划、灾难恢复规划、灾备演练、灾备从业资质认证、人才培养、法律法规制定等方面,拓展到了通信保障、危机公关、紧急事件响应、第三方合作机构和供应链危机管理等。1.2 灾备的重要性信息系统灾备的重要性不言而喻,如存储专家 Jon Toigo 认为,如果不做DR/BC 的规划,就可能有 5%的概率引发企业的财务危机。对于灾备的重要程度,科研机构已经进行了量化的分析:美国德克萨斯州大学较早的一次调查显示只有 6%的公司可以在数据丢失后生存下来,43%的公司会彻底关门,51%的公司会在两年之内消失。另一份针对这一课题的研究报告也显示灾难发生之后,如果无法在 14 天内恢复信息作业,有 75%的公司业务会完全停顿,20%的企业图 1.1-1 911 事件造成多家跨国公司数据损毁2019 中国灾备行业白皮书2在两年之内被迫宣告破产。美国明尼苏达大学的研究也表明,在遭遇灾难时,在没有灾难恢复计划的企业中,将有超过 60%的企业在两到三年后退出市场。而随着企业对数据处理依赖程度的递增,该比例还有逐渐上升的趋势。IDC 在全球范围内,针对多个行业的中小型企业(员工数 1000 名)的调研结果显示近 80的企业预计每小时的停机成本至少在 2 万美元以上,超过20的企业估算其每小时的停机成本至少为 10 万美元。2016 年灾备行业的一份可用性报告显示,企业每年因应用停机造成的损失达到 1600 万美元,“可用性差距”(这一差距存在于用户所需,例如全天访问关键性应用和数据,与 IT 部门的交付能力之间)进一步扩大。该报告指出,尽管去年发生了诸多备受瞩目的宕机事件,但依然没有引起足够的重视。比如,全球84%的资深 IT 决策者承认,他们正在经历“可用性差距”的困境,这个比例只比去年增加了 2%。1.3 信息灾备发生方式虽然每个行业面对的应用场景不一样,但是万变不离其宗,根据已经发生的灾备事件总结分析,通常情况下灾难发生的原因会有以下几种方式:IT 系统问题服务器、应用程序、硬件操作系统、数据库、虚拟机等故障网络安全技术问题网络/病毒攻击、数据窃取/丢失、篡改、加密、泄露信息安全管理问题人为误操作、rm-rf/*删除、升级失败,无灾备演练、供应商过失灾害类事件地震、洪灾、火灾、雷电、战争、城市建设表 1.3-1 信息灾备发生方式1.4 灾备知识及技术灾备行业在信息化环境下,有很多的专业灾备知识及技术,理解这些内容对于业务和系统的灾备规划建设会有很大的帮助。1.4.1 备份备份是指数据或系统的备份,它是容灾的基础,是指为防止系统出现操作失误或故障导致的数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它存储介质的过程。文件服务器数据库服务器文件服务器存储介质图 1.4-1 备份第一章 灾备知识与技术概述3按照备份数据量,可以分为:全量备份、增量备份、差量备份。全量备份用存储介质对整个数据及系统进行完全备份。这种备份方式的好处是很直观,容易被人理解,易恢复;缺点是在备份数据中有大量重复数据,由于需要备份的数据量相当大,因此备份所需时间较长。增量备份每次备份的数据只是相当于上一次备份后增加和修改后的数据。这种备份的优点很明显:重复数据少,即节省存储空间,又缩短了备份时间。差量备份是拷贝所有新产生或更新的数据,这些数据都是最近一次全量备份后产生或更新的。增量备份与差量备份的区别是,增量备份判断数据更新标准是依据上一次备份检查点,而差量备份一定是依据全量备份检查点。如没有全量备份,就没有差量备份。差量备份的主要目的是限制完全恢复时使用的介质数量。备份类型原理优点缺点全量备份对备份集合中所有数据进行备份完全恢复系统需要的时间最短费时,如果文件不频繁进行更改,备份内容几乎完全相同增量备份对自上次备份后改变的数据进行备份存储的数据最少,备份速度最快完全恢复系统需要的时间比全量备份或差异备份长差量备份对自上次全量备份后改变的数据进行备份恢复时仅需要最新全量备份和相应的差分备份,备份速度比全量备份快完全恢复系统需要的时间比全量备份长,如果大量数据发生变化,备份所需的时间长于增量备份表 1.4-1 三种备份方式比较Image 备份是映像级备份(Image Level Backup)的简称,是指对整个文件卷进行数据块级别备份,备份传输的是数据块而不是文件。这种备份不仅做全备份时效率高,而且在随后的增量备份时会更快。它采用快照技术来创建一个近似于及时的数据映像,然后对快照数据映像进行备份,对应用的影响很小。适合文件个数在百万量级以上的大型文件系统,以及更多要求恢复整个文件卷的应用环境。图 1.4-2 Image 备份按照备份时间频率,可以分为:定时备份、实时备份。定时备份是指有时间间隔的数据备份方式,比如一天一次,一周一次,或者一个月一次,定时备份不能保证数据的零丢失。生产服务器生产服务器LAN/SAN磁盘云存储磁带备份副本2019 中国灾备行业白皮书4实时备份是指无时间间隔的数据备份方式,通过实时数据复制,保证主备两端的数据读写一致,确保数据的零丢失。持续数据保护 CDPCDP(Continual Data Protection)是一种连续数据保护技术,被称为高级的实时备份,它兼具数据备份与数据恢复的功能,通过 CDP 实时备份技术,可以实现到秒级的细粒度抓捕效果。目前,主流的 CDP 有很多维度,包括基于存储数据块的,存储快照的,操作系统 I/O 层的,采取不同的技术维度,所获得的数据还原细粒度也有所差别,根据恢复的细粒度的大小,业界将 CDP 分为真 CDP(True CDP)和准 CDP(Near CDP)。真 CDP 技术是持续不间断的监控并备份数据变化,可以恢复到过去任意时间点,是真正的实时备份,不会造成数据的丢失。准 CDP 是指接近持续数据保护,数据备份存在延时,也就是意味着存在部分数据丢失的风险。根据用户对 RPO 的要求以及灾备策略的不一样,CDP 技术方案选择有很大自主性,但是随着数据量的增长和业务信息化的加快,未来的趋势将是以真CDP 为主。英方 i2CDP 属于真 CDP 技术,能够提供细粒度数据持续保护,可恢复至任意历史时间点。此外,根据数据备份时服务器是否停机又可分为冷备和热备;按照数据存储介质之间的距离又可以分为本地备份和异地备份。通过网络进行备份是热备的主要方式,其主要的传输模式如图:图 1.4-3 持续数据保护 CDPLAN BackupLAN-free BackupSANServer-free BackupSAN备份服务器LAN生产系统SAN备份服务器LAN生产系统Server-less Backup图 1.4-4 四种常见的备份传输方式第一章 灾备知识与技术概述5在国内,基于高可用系统中的两台服务器的热备(或高可用)使用较多,因此双机热备常被人提起。双机热备按工作中的切换方式分为:主-备方式(Active-Standby 方式)和双主机方式(Active-Active 方式)。主-备方式是一台服务器处于某种业务的激活状态(即 Active 状态),另一台服务器处于该业务的备用状态(即 Standby 状态)。而双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即 Active-Standby 和 Standby-Active状态)。注:Active-Standby 的状态指的是某种应用或业务的状态,并非指的是服务器状态。1.4.2 容灾严格意义上讲,双机热备不属于备份,更像是容灾。从广义上讲,任何提高系统可用性的措施都可称之为容灾,它分为本地容灾、异地容灾、云容灾。本地容灾 一般指主机集群,当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续进行正常的工作。异地容灾 一般指在与生产机房有一定距离的异地建立与生产机房类似的信息平台(备份中心),并采用特定的技术将生产中心的数据传输到该备份中心,从而在生产中心发生较大的灾难如火灾或地质灾害时,仍能对生产数据进行保护的容灾系统。云容灾 一般指云数据中心的物理机或虚拟机容灾。云主机系统由大量服务器组成并分布在不同的地点,同一时间为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式(集群计算、数据冗余和分布式存储)保证数据的可靠性。这种方式保证分布式数据的高可用、高可靠和经济性,即为同一份数据存储多个副本。一个容灾系统的实现可以采用不同的技术,而容灾系统的划分,由其最终要达到的效果来决定。从其对系统的保护程度来分,可以将容灾系统分为数据级容灾和应用级容灾。容灾半径是衡量容灾方案所能承受的灾难影响范围的指标。不同灾难的影响范围是不同的,而距离也会影响到容灾技术的选择。比如在地震灾难频发的地区,对关键信息保护必须做好容灾备份,尤其是异地容灾备份是十分必要的。做异地容灾备份,必须保证三百公里之外,同时还必须做到“三不”,即不在同一地震带,不在同一电网,不在同一江河流域。图 1.4-5 容灾半径2019 中国灾备行业白皮书6容灾的承载体是数据中心及其IT设施。数据中心是全球协作的特定设备网络,也是用户用来在 Internet 网络基础设施上传递、加速、展示、计算和存储数据信息的 IT 基础设施。数据中心按两地三中心定义可以划分:本地生产数据中心、同城双活数据中心、异地数据中心,实现的功能如图:备份与容灾的区别备份是为了应对灾难来临时造成的数据丢失问题,容灾是为了在遭遇灾害时能保证信息系统继续正常运行,帮助企业实现业务连续性的目标。备份系统与容灾系统在容灾备份一体化产品出现之前是相互独立的两个系统,容灾备份产品的最终目标是帮助企业应对人为误操作、软件错误、病毒入侵等“软”性灾害以及硬件故障、自然灾害等“硬”性灾害。1.4.3 业务连续性业务连续性(Business Continuity 简称“BC”)是指在中断事件发生后,组织在预先确定的可接受的水平上连续交付产品或提供服务的能力。它明确一个机构的关键职能以及可能对这些职能构成的威胁,并据此采取相应的技术手段,制定计划和流程,确保这些关键职能在任何环境下都能持续发挥作用。业务连续性(BC)针对的事件场景应包括三类:一般故障、紧急事件和灾难事件。实现业务连续性所需的 IT 措施包含三个方面:业务状态数据的备份和复制、业务处理能力的冗余和切换、外部接口冗余和切换。业务连续性管理(Business Continuity Management,简称“BCM”)是一套一体化的管理流程,通过该流程可识别组织面临的潜在威胁以及这些威胁一旦发生可能对业务运行带来的影响,并为组织提供了一个指导框架来建立有效应对威胁的自我恢复能力,从而保护关键相关方的利益、声誉、品牌和创造价值的活动。业务连续性管理是一个长期的、不断完善的循环过程,需遵循国际标准的 PDCA 循环模型,即策划(Plan)实施(Do)检查(Check)改进(Act)。图 1.4-7 业务连续性管理 PDCA 模型本地生产数据中心建设当以全冗余数据中心为标准进行建设,全冗余指数据中心的网络层、计算层、存储层全冗余部署,确保任意单一硬件设备出现损坏,对业务影响为零,零停机,零数据丢失,提供业务系统的第一层防护。本地生产数据中心同城双活数据中心两地三中心在本地数据中心的基础上,在同城建立业务级别的容灾中心,具备本地数据中心1/2的业务处理能力,日常情况下可分担业务及管理系统运行,在主数据中心或业务系统自身出现故障情况下,可以将故障业务系统切换至同城业务级容灾中心运行,提供业务系统的第二层防护。在同城双活数据中心基础上,在异地城市建立一个备份的灾备中心(含云灾备中心),用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复,提供业务系统第三层防护。图 1.4-6 两地三中心模式第一章 灾备知识与技术概述7业务连续性管理为企业的灾备建设提供了基本原则和方法,业务连续性管理确定的业务恢复目标就是设计灾备方案的依据。首先,按照业务连续性管理方法对潜在的灾难事件加以识别并进行分析,从而确定可能造成企业运行中断的威胁,以及业务中断给企业带来的影响和损失。其次,再根据业务中断的影响及其恢复时所需的资源来制定灾难恢复策略,从而使灾难事件给企业带来的损失最小化。它含盖了风险管理、应急管理、IT灾难恢复、设备管理、资源管理、安全管理、人员管理等多项内容。实现业务连续性的技术手段通常包括以下两种:1.高可用性(High Availability,简称“HA”)高可用性指通过技术手段,尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时
展开阅读全文