资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,例如,考察,某型号电视机的质量:,平均寿命,18000,小时,200,小时,.,考察一射手的水平,:,既要看他的平均环数是,否高,还要看他弹着点的范围是否小,即数据的,波动是否小,.,由上面例子看到,与随机变量有关的某些,数值,虽不能完整地描述随机变量但能清晰地,描述随机变量在某些方面的重要特征,这些数,字特征在理论和实践上都具有重要意义,.,r.v.,的平均取值,数学期望,r.v.,取值平均偏离均值的情况,方差,描述两,r.v.,间的某种关系的数,协方差与相关系数,本,章,内,容,随机变量某一方面的概率特性,都可用,数字,来描写,4.1,随机变量的数学期望,例,设连续,r.v,.,X,的,d.f.,为,若广义积分,绝对收敛,则称此积分为,X,的数学期望,记作,E,(,X,),即,定义,2,例4.1.1,求服从两点分布的随机变量,X,的数学期望。,解,设两点分布的分布列为,X,0,1,P,q,p,由定义4.1.1得,E,(,X,)=0*,q,+1*,p,=,p,.,解,按第二种检验办法,每个人的血样需检验的次数,X,是随机变量,其可能取值为1/,k,或(,k,+1)/,k,.,若记,q,=1-,p,,表示每个人血样呈阴性反应的概率,故,k,个人混合成的血呈阴性的概率是,q,k,,呈阳性的概率是 1-,q,k,。,X,的,数学期望,(每个人平均需化验的次数)为,E,(,X,),=1/k*,q,k,+,(,1+1/k,),*,(,1-,q,k,),=1-q,k,+1/k,由于,p,一般很小,从而,q,接近于1。,当,k,2,时,,q,k,1/k,,故,E,(,X,),0,D,(,Y,)0,称,为,X,Y,的 相关系数,记为,若,称,X,Y,不相关,.,当(,X,Y,)分别是,离散型,和,连续型,随机变量时,协方差的计算公式分别为:,计算协方差时,常用公式:,Cov(,X,Y,)=,E,(,XY,)-,E,(,X,)E(,Y,),Cov,(,X,Y,)=,E,(,XY,),-,E,(,X,),E,(,Y,),可见,若,X,与,Y,独立,,Cov,(,X,Y,)=0.,由协方差的定义及期望的性质,可得,Cov,(,X,Y,)=,E,X,-,E,(,X,),Y,-,E,(,Y,),=,E,(,XY,)-,E,(,X,),E,(,Y,)-,E,(,Y,),E,(,X,)+,E,(,X,),E,(,Y,),=,E,(,XY,)-,E,(,X,),E,(,Y,),即,同理,E,(,Y,)=1/2,,D,(,Y,)=1/4,又,E,(,XY,)=1*1*(1/2)=1/2,故 Cov(,X,Y,)=,E,(,XY,)-,E,(,X,),E,(,Y,)=1/8,例4.3.1,设随机变量(,X,Y,)的分布律为,求,Cov(,X,Y,),,XY,Y,X,0,1,0,1/4,0,1,1/4,1/2,解,E,(,X,)=0*(1/4)+1*(3/4)=3/4,E,(,X,2,)=02*(1/4)+12*(3/4)=3/4,D,(,X,)=,E,(,X,2,)-,E,2,(,X,)=3/4-(3/4)2=3/16,解,由例4.1.11可知,E(,X,)=4/5,E(,Y,)=8/15,E(,XY,)=4/9,故 Cov(,X,Y,)=E(,XY,)-E(,X,)E(,Y,)=4/225,又,例4.3.2,求例4.1.11中随机变量(,X,Y,)的 Cov(,X,Y,),,XY,则,D(,X,)=E(,X,2,)-E2(,X,)=2/3-(4/5)2=2/75,同理,D(,Y,)=11/225,。所以,解,由例3.2.3知 故 令,例4.3.3,设 ,求,XY,则有,大括号中的积分恰好是服从正态分布,N,(,v,1-,2,)的随机变量的数学期望,故,于是,因而,二维正态分布(,X,Y,)的分布中所含的,参数,就是X和Y的,相关系数,。,协方差和相关系数的性质,(1),存在常数,a,b,(,a,0),,,使,P,(,Y,=,aX,+,b,)=1,,,即,X,和,Y,以概率,1,线性相关,.,性质14容易依据协方差的定义推得,性质5可利用柯西-施瓦茨不等式推得,性质 5、6 刻画了,X,与,Y,之间的,线性关系的程度,一般地,当,XY,较大时,,X,与,Y,的线性关系程度较好,反之,,X,与,Y,的线性关系程度较差。,X,Y,相互独立,X,Y,不相关,X,Y,不相关,因为,若,(,X,Y,),服从二维正态分布,,X,Y,相互独立,X,Y,不相关,例,4.3.4,显然,是不相互独立的,X,Y,不相关,X,与,Y,之间没有线性关系并不表示没有关系!,讨论,X,Y,的相关性和独立性,例4.3.5,已知,D,(,X,)=4,,D,(,Y,)=1,,XY,=1/2,求,D,(3,X,-2,Y,),解,由方差及协方差的性质:,矩和协方差矩阵,定义4.3.2,设X和Y是随机变量,,若 E(,X,k,),k,=1,2,存在,则称它为,X,的,k,阶原点矩,。,若EX-E(,X,),k,k,=1,2,存在,则称它为,X,的,k,阶中心矩,。,若E(,X,k,Y,l,),k,l,=1,2,存在,则称它为,X,和,Y,的,k,+,l,阶混合矩,。,若EX-E(,X,),k,Y-E(,Y,),l,k,l,=1,2,存在,则称它为,X,和,Y,的,k,+,l,阶中心混合矩,。,数学期望,E(,X,),E(,Y,)是随机变量,X,Y,的,一阶原点矩,方差,D(,X,),D(,Y,),是,二阶中心矩,协方差,Cov(,X,Y,)是,X,和,Y,的,二阶混合中心矩,二维随机变量 则其协方差矩阵为,定义4.3.3,设(,X,1,X,2,X,n,)为,n,维随机变量,记,c,ij,=Cov(,X,i,X,j,),,i,j,=1,2,n,,若它们都存在,则称矩阵为n维随机变量(X,1,X,2,X,n,)的,协方差矩阵,。,协方差矩阵是非负定对称矩阵。,4.4,大数定律与中心极限定理,概率论与数理统计是研究随机现象统计规律性的学科,.,随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来,.,也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象,.,研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究,.,极限定理的内容很广泛,其中最重要的有两种,:,与,大数定律,中心极限定理,设随机变量,X,的期望,E,(,X,),与方差,D,(,X,),存在,则对于任意实数,0,切比雪夫不等式,或,因为 为对立事件,所以切比雪夫不等式也可以写成如下形式:,证明,这里仅对X是连续型随机变量证明。设X的概率密度函数为f(x),对于任意,0,有,由切比雪夫不等式可看出:当误差,取定时,随着,方差,D,(,X,)减小,X 围绕,E,(,X,)取值的概率增大。反之,,随着,方差,D,(,X,)增大,,X,围绕,E,(,X,)取值的概率减少。进一步说明,方差,D,(,X,)能描述,X,对其均值,E,(,X,)的偏离程度,。,解,设该车间的月生产量为,X,,则,E,(,X,)=9500,,D,(,X,)=10000,取,=500,由切比雪夫不等式得,例4.4.1,某车间生产一种电子器件,月平均产量为9500只,方差为10000,试估计车间月产量为9000至10000只之间的概率。,即该车间月生产量为9000至10000之间的概率不小于0.96.,2.,大数定律,大量的随机现象中平均结果的稳定性,大数定律的客观背景:,大量抛掷硬币,正面出现频率,贝努里大数定律,设,n,A,是,n,次独立重复试验中事件,A,发生,的次数,p,是每次试验中,A,发生的概率,则,有,或,在概率的统计定义中,事件,A,发生的频率,“稳定于”事件,A,在一次试验中发生的概率,在,n,足够大时,可以用频率近似代替,p,.,这种稳定称为依概率稳定,.,贝努里大数定律的意义,切比雪夫,大数定律,且具有相同的数学期望和方差,则,有,或,相互独立,,设,r.v.,序列,当,n,足够大时,算术平均值几乎是一常数,.,具有相同数学期望和方差的独立,r.v.,序列的算术平均值依概率收敛于数学期望,.,算术,均值,数学,期望,近似代替,可被,定理的意义,3.,中心极限定理,中心极限定理的客观背景,:,在实际问题中,常常需要考虑许多随机因素所产生总影响,.,观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大,.,则这种量一般都服从或近似服从正态分布,.,设随机变量序列,独立同一分布,且有期望和方差:,则对于任意实数,x,定,理,一,林德伯格,-,列维中心极限定理,独立同分布的中心极限定理,注,即,n,足够大时,,Y,n,的分布函数近似,于标准正态随机变量的分布函数,记,近似,近似服从,它表明,:,当,n,充分大时,,n,个具有期望和方差,的独立同分布的,r.v,之和近似服从正态分布,.,设,Y,n,B,(,n,p,),0,p,1,n=,1,2,则对任一实数,x,,有,Y,n,N,(,np,np,(1,-p,)(,近似,),定,理,二,棣莫弗,-,拉普拉斯中心极限定理,二项分布以正态分布为极限分布,即,n,足够大时,,例4.4.2,一生产线生产的产品成箱包装,每箱的质量都是随机的,假设每箱平均重50kg,标准差为5kg。若用最大载重量为5t的汽车承运。问每辆车最多可以装多少箱,才能保障不超载的概率大于0.977?,解,设,X,k,(,k,=1,2,n,),是装运的第,k,箱产品的质量(单位:,kg,),n,是所求箱数。由已知条件知,X,1,X,2,X,n,独立同分布,则有,E(,X,k,)=,50,,D(,X,k,)=,2,5,。,根据定理,4.4.4,n,箱的总质量 近似服从正态分布,N,(50,n,25,n,),,则,即,n,98.02。可见每辆车,最多可以装98箱,才能使不超载的概率大于0.977。,查标准正态分布表可得,(2)=0.977,,故,例,4.4.3,某单位有,200,台电话分机,每台分机使用外线的概率为,0.2,假定每台分机是相互独立的,问要安装多少条外线,才能以,95%,以上的概率保证分机用外线时不等待?,解:,设有,X,部分机同时使用外线,则有,设有,N,条外线。由题意有,由德莫佛,-,拉普拉斯定理有,例,设有一批种子,其中良种占,1/6.,试估计在任选的,6000,粒种子中,良种比例与,1/6,比较上下不超过,1%,的概率,.,解,设,X,表示,6000,粒种子中的良种数,X B,(6000,1/6),近似,由德莫佛,拉普拉斯中心极限定理,则,有,比较几个近似计算的结果,中心极限定理,二项分布,(,精确结果,),Poisson,分布,Chebyshev,不等式,
展开阅读全文