1、 张晨曦 刘依 肖晓强186.3 可靠性、可用性和可信性 反映存储外设可靠性能的参数l 可靠性(ReliabilityReliability)l 可用性(AvailabilityAvailability)l 可信性(DependabilityDependability)与可靠性相关的三个术语l 故障(faultfault)l 错误(errorerror)l 失效(failurefailure)第六章 输入/输出系统 张晨曦 刘依 肖晓强281.故障、错误和失效之间的关系(1)(1)一个故障可能会导致一个或者多个错误;(2)(2)错误通常具有以下特性 错误在潜在状态和有效状态间相互转换;潜在的错
2、误可能通过激活而有效;有效错误的影响可以传递,引起新的错误。(3)(3)如果错误影响到部件正常的服务时,部件就发 生了失效;(4)(4)系统中的所有部件的故障、错误和失效均存在 这样的关系。6.3 可靠性、可用性和可信性 张晨曦 刘依 肖晓强382.故障的分类(1)(1)按故障产生的原因分 硬件故障:设备失效产生的故障 设计故障 操作故障:由于用户操作的失误引起的故障 环境故障(2)(2)按故障出现的周期分 暂时性故障 间歇性故障 永久性故障6.3 可靠性、可用性和可信性 张晨曦 刘依 肖晓强483.系统可靠性 系统从初始状态开始一直提供服务的能力 用平均无故障时间MTTFMTTF来衡量4.系
3、统可用性 系统正常工作时间在连续两次正常服务间隔时 间中所占的比率 用MTTF/MTBFMTTF/MTBF(平均失效间隔时间)来衡量5.系统可信性 多大程度上可以合理地认为服务是可靠的 可信性不可度量6.3 可靠性、可用性和可信性 张晨曦 刘依 肖晓强58例6.26.2 假设磁盘子系统的组成部件和它们的MTTFMTTF如下:(1)(1)磁盘子系统由1010个磁盘构成,每个磁盘 的MTTFMTTF为10000001000000小时;(2)1(2)1个SCSISCSI控制器,其MTTFMTTF为500000500000小时;(3)1(3)1个不间断电源,其MTTFMTTF为200000200000
4、小时;(4)1(4)1个风扇,其MTTFMTTF为200000200000小时;(5)1(5)1根SCSISCSI连线,其MTTFMTTF为10000001000000小时;6.3 可靠性、可用性和可信性 张晨曦 刘依 肖晓强68 假定每个部件的正常工作时间服从指数分布,即部件的工作时间与故障出现的概率无关;同时假定各部件的故障相互独立,试计算整个系统的MTTFMTTF。解:整个系统的失效率为:100000023100000012000001200000150000011000000110=+系统失效率6.3 可靠性、可用性和可信性 张晨曦 刘依 肖晓强78系统的MTTFMTTF为系统失效率的倒数,即:小时43500231000000MTTF=大约为5 5年。6.3 可靠性、可用性和可信性 张晨曦 刘依 肖晓强886.提高系统可靠性的方法 有效构建方法 纠错方法 具体的说,可分为:l 故障避免技术l 故障容忍技术l 错误消除技术l 错误预报技术6.3 可靠性、可用性和可信性