资源描述
第二章 概率统计基础第一节 随机变量数字特征 一.数学期望简称期望或称为均值。假如随机变量x是离散型,它分布律为若级数 绝对收敛,则称级数 为数学期望,记为 。(2-1)对于概率密度函数为 连续型随机变量x,若积分(2-2)1第1页绝对收敛,则称此积分为x数学期望,记为 假如y是随机变量x函数yg(x)(f是连续实函数),且x是离散型随机变量,它分布律为若 绝对收敛,则有(2-3)2第2页若x是连续型随机变量,它概率密度函数为且 绝对收敛,则有二、方差是用来度量随机变量与其数学期望偏离程度。对于离散型随机变量X,若其分布律为则方差表示式为(2-4)(2-5)3第3页 式中 假如X是含有概率密度函数为 连续型随机变量,则方差表示式为 方差平方根称为随机变量标准差或均方差。它是与随机变量X含有相同量纲量,记为 有(2-6)(2-7)(2-8)4第4页 衡量随机变量离散程度另一参量是变异系数,定义为:它是无量纲系数。描述随机变量概率分布对称程度用歪扭系数。定义为:(2-9)(2-10)式中 随机变量x三次中心矩。对于离散型随机变量X,可表示为:(2-11)5第5页对于连续型随机变量x,三次中心矩为:(2-12)图2l示出歪扭系数值为零、为正和为负时概率密度函数曲线。6第6页7第7页8第8页 正态分布是应用最为广泛一个分布。许多自然现象可用正态分布来描述。当研究对象随机性,是由很多互不相干随机原因之和所引发,每一个随机原因又都不是控制原因,这类问题普通都服从正态分布。比如,在可靠性分析中,材料强度、零部件加工尺寸和寿命常服从正态分布。正态分布概率密度函数可用下式表示,X为连续型随机变量。第二节 惯用概率分布一、正态分布(2-20)9第9页累积概率分布函数为:式中x随机变量均值标准差,正态分布可记为 。数值大小表征分布曲线中心线距离坐标基准点位置,而 数值大小则表征随机变量离散程度、或者分布曲线陡坦程度。参阅图22。(2-21)10第10页图22 正态分布概率密度函数11第11页 当 时,称X服从标准正态分布。记为N(0,1)。概率密度函数和累积分布函数分标准正态分布别用 和 表示,即(2-22)(2-23)12第12页13第13页14第14页15第15页二.对数正态分布 随机变量正态分布含有对称性。但在许多工程实 设连续性随机变量X自然对数呈正态分布,则称X函数分别为:服从对数正态分布。它概率密度函数和累积概率分布时间等随机变量经常采取分布。是描述材料强度、疲劳寿命、结构几何尺寸和工程完成正态分布是许多不对称概率分布中最为主要一个。它际问题中,事件随机变量分布往往是不对称。对数16第16页 式中均值;标准差(2-26)(2-27)17第17页对数正态分布概率密度函数图形示如图:18第18页对数正态分布统计参量可求之以下。令:随机变量X均值由式(2-2)求得:19第19页上式中 括号内为正态概率分布函数 ,总和,其值为1。因而有:(2-28)式(228)表示均值 、随机变量X均值 与 方差 之间关系。依据式(26),有20第20页故由此得(2-29)式中 为变异系数,见式(29)。假如 ,则因而得:(2-30)21第21页 伽玛分布惯用于结构承受风、雪载荷、活载荷以及一些焊接热影响区表面裂纹尺寸分布等。随机变量X含有以下概率密度函数时称为伽玛分布。(2-34)式中和k是两个参数;。当为正整数时,三、伽玛分布累积概率分布函数为:22第22页伽玛分布统计参量可求之以下:(2-36)(2-37)23第23页 该图为伽玛分布概率密度函数曲线图:24第24页 四、威布尔分布 1.三参数威布尔分布:概率密度函数为累积概率分布函数:式中 形状参数;()尺度参数:可记为 特征参数;位置参数。25第25页在疲劳强度试验中,威布尔分布函数中时间t用疲劳寿命N(循环数)代替。这是威布尔分布函数能够写成以下形式。式中最小寿命,循环数;特征寿命,循环数。26第26页2.二参数威布尔分布在疲劳强度试验中,27第27页 下列图为威布尔分布概率密度函数:时间t28第28页形状参数 对威布尔分布概率密度函数影响。求得不一样值,就能够判断引发失效控制过程。情况,反应耗损寿命期、即老化衰竭现象。依据试验失效过程;,曲线表示失效随时间增加而递增特征;时,曲线表示了失效率为常量,描述偶然效随时间增加而降低情况,亦即反应了早期失效率 影响示如图27,当 ,这时曲线表示失这里 取值为零。形状参数对可靠度 和失效29第29页时间a.威布尔可靠度函数30第30页b.威布尔失效率时间31第31页 五、指数分布 设备最正确工作期称为偶然失效期,其失效率与时间无关、保持为定值。在这期间,没有一个失效原因对失效起主导作用,失效纯属偶然。依据方程(18),当 常量时,有:(2-51)式(251)表示指数分布概率函数。图28为指数分布概率密度函数图。32第32页指数分布中随机变量数学期望(均值)和方差以下:(2-52)指数分布概率密度函数33第33页六、极值分布 极值分布是一个特殊分布,适合用于寿命分析和应力分析。当装置或零部件中存在有缺点或杂质时,假如正是这些缺点或杂质决定了装置或零部件寿命,则含有最大杂质或缺点部分就决定了装置或零部件寿命。除此以外,可能施加在装置或零部件上应力,如最大冲击、最大风裁荷等决定其寿命者,亦属极值分布。极大值、极小值分布在许多实际问题中,起着主要作用。假设 是独立随机变它们有相同分布函数 。34第34页极大值(M)分布函数为:假如 对应概率密度函数为 ,则 对应(2-54)概率密度函数为:极小值(N)分布函数为:故(2-55)(2-56)(2-57)35第35页极值型最小值累积概率分布函数为:概率密度函数为:Gumbel研究了极大值、极小值分布性质,从理论上得出了极值分布三种类型:极值型、极值型、极值型。极值型最大值累积概率分布函数为:上式中,a、k是参量。(2-59)(2-60)(2-58)36第36页式中,a、k是参量。极值型中随机变量数学期望(均值)和方差为:(2-61)(2-62)极值型、最大值型累积概率分布函数为:(2-63)随机变量数学期望(均值)和方差为:(2-64)(2-65)37第37页极值型、最小值累积概率分布函数为:式中a、k是参量。随机变量数学期望(均值)和方差为:(2-66)(2-67)(2-68)38第38页第三节统计推断 客观世界总体普通多能够用随机变量来模拟。而这种随机现象数量规律是从大量实际事件中总结出来。要得到这一规律,人们不可能从随机现象全部事件进行观察和分析,只能对它们作有限数量观察和分析。从局部观察来预计和分析整体随机规律性,要用统计推断方法。统计推断法是依据对子样观察来推断母体情况。它是一个推测性判断方法。所谓母体,指是研究对象全体。譬如,我们研究某种材料断裂韧性,那么它就是一个母体。又如我们研究是零部件加工尺寸误差,那么这个零部件某个尺寸全部误差就是一个母体。所以,母体能够是尺寸、寿命、时间等表征研究对象某种性质数量全体。39第39页 从母体中抽取一个个体做试验或者进行观察,这个抽出个体称为样品、或者子样。设 是从母体中抽取n个样品,它称为容量等于n一个子样。子样含有母体各种信息,它是十分宝贵。为了充分地利用子样所含有各种信息,经常把子样表示成一个或m个函数:这些函数普通是连续函数,而且不含有未知参数。这种不含未知参数子样函数称为统计量。40第40页惯用统汁量有:子样均值子样均值正平方根称为子样标准差或子样均方差。子样K阶矩子样K阶中心矩41第41页何为置信度 既然统计推断法是一个推测性判断方法,所以结果能够信任程度标志。人为给定,如0.1,0.05等。置信度就是衡量推测判断显著水平或称风险度系数。它数值依据要求精度中称之为置信度。惯用(1-a)表示置信度,其中。a称为把握,因而这里存在可信赖程度问题。在数理统计对于这种方法所取得结果就不可能有百分之百正确42第42页 按照可靠性工程分析需要,本节拟择统计推断相关内容作简明叙述。一、分布适应性检验 系统、装置或零部件往往需要从它们失效数据中提供适当分布函数,亦即,对失效分布作出假设,然后再对这种假设正确性作出检验。1 检验法 设母体分布函数为 ,利用从此母体中抽取子样,检验假设 ,即:其中为某已知分布函数。为寻找检验统计量,首先将母体X取值范围分成m个区间43第43页要求 是分布函数 连续点。令 表示母体X子样 ,落入第i个区间概率,记作假如子样容量为n,则 是随机变量X落入 区间理论频数。倘若n个观察值中落入此区间实际频数为 ,则当成立时,应是较小值。因而这些量和能够用来检验是否成立。皮尔逊定理。如 成立,当 时,有它是自由度为m-1分布,此值越小表示理论计算值对观察值适应性越好。44第44页45第45页46第46页47第47页48第48页2柯尔莫哥洛夫一斯米尔洛夫检验法 假设其中 是连续型分布已知函数。检验此假设是否为真,所用统计量是 其中 是容量为子样经验分布函数,是一个阶梯形函数。令 是子样 按数值大小次序排列统计量。则49第49页 K-S 检验法是在子样每个次序统计量 上,求子祥经验分布函数和分布函数之间偏差中大一个。即求这是因为 和 都是 单调非降函数,所以式(280a)表示偏差上确界可在个点处寻求。求得n个 中最大一个就是K-S检验统计量 取值。从图29能够看出,当 较小时,与 适放性很好当 较大时,与 适应性不好。K-S检验法检验标准以下:50第50页式中 为在给定显著性水平和子样容量n下KS检验临界值或记作 。参阅附表4。图29 K-S检验法中函数拟合51第51页52第52页53第53页54第54页55第55页 二、概率分布中参数预计 在可靠性分析中,除了分布面数适应性外,还必须对母体分布参数进行预计。对于参数预计,经常碰到三种情况:随机变量X母体分布函数 未知,需要求它数学期望 和方差 ;随机变量X母体分布函数形式已知,但含有未知参数 ,譬如式(252)中指数分布概率密度函数 ,其中未知参数,要求确定 值;随机变量x分布形式已知,不过其数字特征值均不知道,如产品某项指标服从正态分布 ,而都是未知,需要进行预计。56第56页 依据实际问题需要,处理参数预计问题有两种方法:点预计与区间预计。对于点预计要求是,无偏性、一致性和有效性。而区间预计则要求得到未知参数预计值与此参数真值差包在一定范围概率之内。设是未知参数,它能够是分布中参数成各种可靠性指标。设 是容量为n一个子样,取子样一个函数 作为未知参数预计值,称之为点预计值。这是因为 当一定时,是一个数、或点。点预计值将表示未知参数大致是多少给出明确数量概念。不过,因为这种预计值不能反应所得结果可信程度。所以,往往引用参数值所在区间去赔偿仅仅一点预计值。这种区间称之为置信区间这种方法称为区间预计法。57第57页下面叙述几个主要参数预计方法。使用各种分布概率坐标纸能够对相关分布参数进行图解预计。惯用概率坐标纸有正态概率坐标纸,对数正态概率坐标纸,威布尔概率坐标纸和极值概率坐标纸等。概率坐标纸横坐标普通取子样观察值,纵坐标则取对应子样观察值累积概率分布因数,图解法优点在于简便,但准确度不够,可能有一定误差。倘若对参数预计要求较高,往往将图解法与参数统计估结合起采,这么能够到达很好效果。图解祛详细内容详见资料2。1图解法58第58页 2矩法 矩法就是用子样各阶矩或中心矩去预计母体各阶矩或中心矩。母体Xk次方数学期望 称为母体k阶矩,母体X对其数学期望 偏差次方数学期望称为母体k阶中心矩。显然,母体一阶矩就是母体数学期望,母体二阶中心矩就是母体方差。设是来自某母体一个子样,则子样k阶矩 和k阶中心矩 能够定义为:显然,子样各种矩反应了母体各种矩特征。59第59页3最小二乘法(详细见书中例题)4最大似然法 点预计最惯用方法是最大似然法。这种方法能够直接提供取得参数点预计值,且含有较小偏差。当母体分布类型巳知时,设分布函数待定参数为 ,它能够取很多值,在这些很多可能值中选出一个使子样观察结果出现概率值为最大,作为 预计量,用符号 表示之,称 为最大似然预计。设母体为离散型分布。随机变量X取值为x概率(母体分布列)按以下形式表示:其中 为未知参数。60第60页 令 代表从该母体中抽得子样观察值,假如子样是独立,这一观察结果出现概率应是:称为似然函数。对于不一样 ,这个函数值不一样,即概率值不一样。如欲寻找一个 值,使 到达极大值,显然,这就是求似然函数 最大值问题。在关于为可微时,有:这个方程称为似然方程。因为似然函数往往是多函数相乘,所以用对数似然函数求最大值较为方便。因为与在同一处取值,所以,也能够从下式求得:61第61页 5区间预计 上面叙述了点预计值计算方法。因为它们不能满足所得值准确度,所以,往往使用区间预计来填补。本段拟依据不一样情况将区间预计内容作简明介绍。62第62页(二)概率分布中参数预计下面叙述几个主要参数预计方法:1图解法2矩法3最小二乘法4最大似然法5区间预计63第63页第四节 回归与相关 在可靠性分折中,往往需要寻求变量之间关系,以及判断所寻求这个关系准确度。这就是本节所要讨论内容。一、回归分析 回归分析目标在于确定某一自变量或多个自变量(或称回归自变量)与因变量(或称回归因变量)之间关系。回归分析普通能够分为线性回归分析与非线性回归分析两大类,它们又 能 够 分 为 一 元 或 多 元 回 归 分 析。64第64页65第65页66第66页67第67页二、相关 相关量度是相关系数。它是衡量变量设n维随机变量为 。定义下式为相之间相互关系彼此靠近程度尺度。关系数为 与 协方差。分别 为 与方差。分别 为 与均值。68第68页
展开阅读全文