1、1、事件(随机变量)间的关系AB=A+A+B=AB A-A A B=AB;A+A=SA+B=A+ABA=AB+AB(互斥分解)A+B=S,ArB=(p,n Z与B对立,即/与5构成S的一个划分AB=:4与与互不相容 AB=,P(HB)=O,P(Z+B)=P(A)+P(B)(注意彳与豆;A与B等不一定也互不相容)P(AB)=P(A)P(B):4方相互独立(注意彳与豆;A与B等相互独立)/xy=OnX与y不相关豕,哪互独立 n E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);Cov(X,Y)=0独立一定不相关,反之不一定2、概率运算(1)P(A U 为=P+P(B)-P(4B)45
2、互斥 P(A)+P(B)(2)P(AB)=P(A)P(B|A)=P(B)P(A 6)独立 P(A)P(B)(3)尸(彳)=1-P(A);P(BA)=1-P(BA)(条件概率)(4)P(Z-B)=P(A)-P(AB)(5)Q=与 H-卜Bk,4=Ail=AB H-F ABy 瓦 ryB.=(/)P(N)=ZP(4BA)(全概率)kP(纭|N=J,?,(逆概率)二尸(力当)k(7 二项分布A=P(N恰好发生九次)=Cfpi尸 A发生不多于1次)=Po+A+”P A发生不少于1次)=Pk+PA 8 多个独立事件的和:设4,4相互独立,则他们至少发生一个的概率是P(4+4)=I-P(4+-+4)=1
3、p(a4 =1 1P(4)1-P(H)1P(4)练习题1设事件4万互不相容尸(Z)=0.6,PCB)=07贝!|尸(彳豆)=,2 设事件4万独立,尸(Z)=06P(为=07则P(AB)=_,P(AB)=,P(A-B)=,P(A+B)=3.随机变量X服从二项分布5(100,0.2),则P(X 1)=P(A DB)=1-P(A)-P(B)0.42;Q-0.6)(l-0.7);0.6-0.6X0.7;0.6+0.7-0.42=P(X=0)+P(X=1)=0.2 x(l-O.2)100+0.2x(l-0.2)例 已知有10件产品,其中有2件为不合格品,现从中任取5件,问(1)所取5件恰好有1件为不合格
4、品的概率;(2)取出5件产品恰好有2件为不合格品的概率,(3)取出5件产品有不合格品的概率。解:设A:恰有1件是不合格,B:恰有2件不合格,C:有不合格尸二,尸二 T;Jo JoC=AKJB,AB=P(C)=P(A)+P(B)例、玻璃杯成箱出售,每箱10只.已知各箱中残次品个数为0,1,2 的概率分别为0.8;0.15;0.05,现有一顾客欲购一箱玻璃杯,售货员 任意取一箱,顾客开箱随机地检验一只,若不是残次品,顾客则买 下该箱玻璃杯.试求:1.顾客买下该箱玻璃杯的概率;2.在顾客买下的一箱玻璃杯中,确实无残次品的概率.解:记为为箱中有A个残次品,Z为“顾客买下该箱玻璃杯”3l.P(A)=Z
5、P(Bk)P(ABk)=0.8x1+0.15x0.9+0.05 x 0.8=0.975仁02.P(4|A)=P(5)P(川与2=9=0.8205P(Z)0.975有朋友至远方来参加聚 会,他坐火车、轮船、汽车、飞机来的概率 分别为0.3,0.2,0.1,04若坐火车迟到的概率 是0.25,若坐船迟到的概 率是03坐汽车迟到的概率是0.1,坐飞机则不会迟到。求他最后可能迟到的 概率。(2)结果他迟到了,求是 坐轮船来的概率。=P(4)=尸(41 B)=0.3x0.25+0.2X0.3+0.1x0.1=0.145P(A2)P(BA2)0.2X03 _ 0.06 _ P(B)0.145 0.145二
6、、一维随机变量离散型随机变量分布律与分布函数的关系 连续型随机变量概率密度与分布函数的关系 由密度求随机变量的分布函数几个常用的一维随机变量求随机变量函数的分布律或概率密度 求数字特征:期望,方差1、一维随机变量及其分布离散型随机变量X的分布律可以用表格形式给出:X x2 xn Pk Pk Pk P一二项分布:PX=k=C:pk (0ko是常数。k为连续型随机变量,其中,(x)称为X的概率密度分布函数:F(x)=fJ-oo概率密度:/(x)=Fx)Px.Xx2=f(x)dx L均匀分布/(*)土,xb0 xa x a,F(x)=-a xb其它02.指数分布/(X)=4 e 0X03正态分布f(
7、x)=一12%ax 0其它(X-/)2JToo X 00例X-1 2A 1/4 1/20 1/4 分布函数歹(x)=3/41/4x -1-lx22x 3随机变量函数的分布8 V X V 8设随机变量X的概率密度为4(x),又设函数g(x)单调且可导,A(y)是g(x)的反函数,则 y=g(x)是连续型随机变量,其概率密度为一、fxlh(y)hy)ayB川)寸。其它函数g(x)可导,反函数有两单值枝(y),42(7)则fy)h;(y)+fxh2(y)|(j)ayp%()=0 其它例.设连续性随机变量X的概率密度为/(*)=kx 0 x 10 其它求常数A;(2)分布函数F(x);(3)P0.3X
8、0.7;(4)E(XD(X)工求y的分布声度fY(y)解:“f(x)dx=1/.J-oo Jkxdx=1:.k=2 o/(x)=2x 0 xl0 其它 Co(2)F(x)=PX f X*=Jo/(,)山山J ux 00 x10 x 0,0X X(2)F(x)=PX x=J j 2tdt,0 x 0、ox 00 xl(3)P0.3 X0 厂 fx(6)+。;o(5)4O0=j2jyIo;j0 Io;y00 x 0例:设X的分布函数为F(x)=kx2 0 xl求(1)A及概率密度/(x)(2)P0.3 X 0.7;(3)E(XD(X)y=x2求y的概率密度fY(y)解:1=lim F(x)=lim
9、 kx=kf(x)=Fx)=Xf+8 X 12X9 0 x 10,其他(2)P03 V X 5=(y)=(x),1-(In j)2 1X(y)=-=e 2 x=ln y v 2T y(2)产 21+1 不单调。1,+8),当丁1时,/(丁)=0;y-1 时 F(y)=P(Y y)=P(2X2+ly)=pX51弁1 T=271rs/,一(广1)/4f(y)=三、二维随机变量二维离散型随机变量的分布律离散型的条件分布二维连续型随机变量的联合概率密度概率P(X,Y)e D的计算 尸(X,Y)eD=f(x,y)dxdyD边缘分布律或边缘概率密度的计算独立性与联合分布的关系数字特征:期望,方差,协方差,
10、相关系数三、二维随机变量离散型:联合分布与边缘分布的关系设(X,y)取(0,1);(0,3);(1,1);(1,3);(2,1);(2,3);(3,1);(3,3);的概率1 3 3 1分别为o;-;-;o;-;();();-;写出(x,y)的分布律表及边缘分布 8 8 8 8(2)x,y是否独立由联合分布可以确定边缘分布但由边缘分布一般不能确定联合分布.若相互独立,则由边缘分布律可确定J13尸X=xJ001/81/813/803/823/803/8t 301/81/8P=6/82/8X设x,y相互独立,且口A1-2-4 B.p.i=!X 号,21=。=Pl.p.i w PiI不独立1111
11、8 84 3 12 3Y概3 1 2111 求联合分布律2 4 4连续型:联合分布与边缘分布的关系(x,y)的联合分布函数与密度/(羽)=匚匚fududv(乂卜)关于乂,y的边缘概率密度为1eOOfxM=)(rydy(-gv%vg)J-OOfY(y)=f(x,y)dx(-oo joo)Joo若尸(%y)=&(x)K(y)对x,y成立,则称则X与丫独立 若y)=fxQ)力(y)几乎处处成立则X与丫独立例填空:设随机变量X:相互独立,其部分联合分布和边缘分布的数据如下%为 为Pi.解:rXJ1 乃 乃Pi.为x281_ 38 8Pj 46 81YX%乃 乃Pi.1241_ 8 T6834 28 6
12、4YX%乃 为Pi.1Pn=Pi.P.i 16=Xpu=夕1.=6 1 1 241411248123884 42 4 6 2 3例1设(x,y)的概率密度是f(,y)=cy(2-x),0 xl,0yx 其它求 c的值;(2)两个边缘密度;(3)P(OX+y-)解(1)=fx,y)dxdyR2=J dx cy(2-x)dy=(2x2-x3)Zx拯=5clM,故 c=24/5.=X0yx 1A*仆 =12j),0 xl,0 y 1或X 0时,Vj6 -8,+8),都有/(%,)=0,故/%x =0 y当04%)打 一一JU当OVxVl时,=匚/(%,)刈4-00+/(2)。rx 24 1,-y-x
13、ydy yy=x12 9=x(2 x),综上,5(12x 0 xl XA%fxM=i 5X2(2-X),0 x 1,0,,其它.一注意取值范围y 1c4(y)=J/(X,y)dx=J(2-X)dx=-y(2-y)1 2*4-j,0ylyfY(y)=j)2 一 刃,0 yl I 0,其它1 P(0 X+F -)=jj/(x,y)dxdy2 Di i4 2y=Jcy(2-x)dxo y不独立yK随机变量的数字特征r 8xf(x)dxJ-oo00OO1.期望E(X)=尸k=l+8函数 y=g(x)的期望E(F)=Eg(x)=f g(x)f(x)dx=Eggm-oo k=loo oo.+00+00函数
14、 Z=g(X,y)的期望 E(Z)=Eg(X,y)=Zg(%,匕)为=J Jg(x,y)fMdxdyjT iToo-oo2.方谢(X)=EXE(X)2=E(*).E(X)23.Cov(X,Y)=E X-E(X)Y-E(Y)=E(XY)-E(X)E(Y)D(X+Y)=D(X)+D(Y)+2Cov(X,Y)4.相关系数)灯=Co似豕/匕 若p打=0,称X与Y不相关。7D(x)p(y)若&独立,则px”o,反之不真D(X+Y)=D(X)+D(Y)+2E X-E(X)Y-E(Y)若 X,Y 相互独立,贝!|E(XY)=E(X)E(Y)D(X+Y)=D(X)+D(Y)Cov(aX,bY)=ab Cov(
15、X,F)a,b 是常数Coy(X+&,F)=Cov(XvY)+COV(X2,Y)例2.填空题已知X N(2,0.42),则(乂+3)2=1.16解:由均值的性质得E(X+3)2=E(X2+6X+9)=E(X2)+6E(X)+9=D(X)+E(xy+6E(X)+9=0.16+4+6(2)+9=L16例4.设随机变量(X,y)的联合分布律为 y 0求边缘分布律;求,E(X),E(V);E(3XF)必 X),D(Ycov(X,F),PXY,o 03问x,y是否独立,是否相关。1 0.40.7 0.3解:优=0.1,E(X)=0.5,E(Y)=0.5,D(X)=0.5-0.52=0.25z)(y)=0
16、.3-0.32=0.21,E(3XF)=3E(XY)=3(0+0+0+lx 1x0.1)=0.3cov(X,F)=E(XY)-E(X)E(Y)=0.1-0.5x03=-0.05cov(X,y)0.050=-=-、D(X)D(Y)VO25VO21pn=0.l,i x p.i=0.5x 0.7=0.35 W pn.不独立。相关例/(1)=cy(2-x 0 xl90 x0,其它写出A(x)=12X2(2-X)?0 x 5、0,,其它.fY(y)=|J(2-J)2 一切,0 J)E或P|X-E(X)|1-rE2这个不等式与有关,当。=时,PX-E(X)l-=02五、大数定律,中心极限定理.I大数定律设
17、随机变量Xp X2,X.相互独立,且具有相同的数学期望和方差:E(Xk)=JLL,D(Xk)=(y2(A=1,2,),则序列又=/依概率收敛于,即 tl k=l又(样本均值依概率收敛于期望)中心极限定理I设随机变量X1,X2,X,相互独立同分布,且具有数学期望和方差:E(xp=/Z,z)(xp=b2n(n、fXk-E fx,(k=1,2,),随机变量之或豕人的标准化量I I 近似地N(O,1)k=l j,V yk=i 7例.已知一大批产品中有T是一等品,现抽取oo件该产品,每次抽一件,看后放叵!抽下一件。问在这样oo次的抽取 中取到一等品的次数彳超过45件的概率约等于多少?i解:设X时100件
18、中的一等品数,X 6(100,-)2(1X=仇 1,不)=1,100r 27E(X)=100 x0.5=50,D(豕)=100 x0.5x0.5=25由中心极限定理%5P(X 45)=PX-50 5近似N(0,l)=0(-1)=1-0(1)=1-0.841=0.159六、抽样分布常用的抽样分布吩布;/分布的分位点来自正态总体的抽样分布定理结论:LX (/,)n /N(O,1)_n E(X)=E(X)=ju;x-u H2.T T(l);D(X)-n nQ/_I(n-l)SI 2“一 2/(1)常用的统计量样本平均值i=l1 _样本方差$2=,(X厂R21 i=l样本标准差 s=n-li=i样本方
19、差、均值的分布设X1,,匕是来自总体NO!,?)的样本,x,2 分别是样本均值和样本方差,则有(1)Z=N(O,1)a/yln(2)t=-t(n-1)S/n2(n-l)S2 2,一%=-2-%(T)七、参数估计1.矩估计法需X-1 n _S2=2(Xj-又)2 口 D(X)=1 i=i例1设总体X的概率密度为/X(a+l)x,0 x 1是未知参数,X,X2,X”是取自X的样本,求参数a的矩估计.f1解:x=xk=E(X)=j x(a+l)xadx n k ri a+1 2x-l=(a+l)xa+1dx=-n a=j。a+2 1-x2最大似然估计原理当给定样本乂应,.冬时,定义似然函数为:L(e
20、)4(*,”2,X;e)这里 占,2,,匕是样本的观察值.求其最大值,即令色经丝=0得 0=0 dO3估计值的评选标准(无偏性)0=E(0)V设总体X具有分布律一P12 302 20(1-0)(1-8)2(06 6=;(3-戏=。=j(3-x),3(2)z=n P(Xi=芍)=P(X1=1)P(X2=2/(X3=1)1=1=e2 26(1-6)4=2式(I-6)In Lg)=In 2+5 In 夕+ln(l-8)dlnLg)5 1 人 5de e i-e练习:设/(巧6=1之1(X,X2,,X)0,其余是来自总体X的样本。求未知参数0 的矩估计和极大自然估计。解:矩估计E(X)=x=O-l)x
21、x0dx=1 n 0=办,所以=Jo 夕+2 1-x 1-x极大自然估计 L(0)=(6+l)n X*就;In=n ln(6+1)+疙 ln|xz|咏竺一1 I油 力中.1i=l二、单个正态总体均值与方差的区间估计总体 XN 小(y2 已知,未知,求的置信度为的置信区间由已讨论的:一个置信区间为豕-长2吆 7 n 公所用的统计量是Z=幺 N 0,l ITT%)/7n例 设总归 可(/,。2),取1 0=0.95,。=1,n=16,样本均值面的观测面=5.20,求M的置信区间注意:(一)=P(X Za/)=l-0.025=0.975 解:1一一=1 0.025=0.975,2即/=Z0025=1
22、96 查正态分布表中。.975所对应的x=1.96,4的置信区间为(土土一xL96)n(5.20-0.49,520+0.49)n(4.71,5.69)162。2未知,未知,求6/的置信度为L-a的置信区间用统计量,=与W 心-1)(。2未知,用2替代)同1 一样讨论得L个置信区间为冬/5-1),%+7n&例 设总体XN(4,cr2),已知容量为4的样本均值元=生处100标准差s=0.03%;求总体均值的95%的置信区间解:1-a=0.95,=a=0.05,y=0.025,1。s 0.03%c-vc/Ti=4,一 I=3;-j=-j=0.015 Io V4 V4查表S)25(3)=3.1824,
23、则置信度为1-a=0.95的置信区间为X 34 一(-3.1824x0.015%)=(8.292%,8.388%)1003.方差02的置信区间均未知)用统计量=5一?$2 42(一1)(不出现)由于R(1)x52到T)(T2(n-l)x5237得到方差。2的一个置信度为1-0的置信区间(n-l)xs2-2,(n-l)xs2;-b -;-%d)%_%d)这里一是S2的一个观测值方差置信度为1-。的置信区间力%(1)例1 一批灯泡的寿命f N(/,z%检验Z双侧检验备择检验名:拒绝域 检验水平a,单侧检验检验o:No;备择检验/:/vo拒绝域zv-弓Z单侧检验检验水平a,单侧检验2。2未知,4未知
24、,检验4选统计量公?心_1)(1)检验:4=4o;备择检验%:4 w为检验水平a,双侧检验-拒绝域|川,5-1)检验备择检验之:40拒绝域小心(-1)、检验水平a,单侧检验t双侧检验t单侧检验检验o:No;备择检驱力/v M粗绝域 一小 T)检验水平a,单侧检验2.正态总体方差的检验设X 样本(天,豕2,XJ取值(占,/)用统计量5一?相 2(-1)检验。2(1)%:二;匕:工 拒绝域为 之?(一1)(2):b;拒绝域为/(一1)(3)4:之端;匕:/v可拒绝域为/覆5一1)双侧检验 HQ:a2=al;H1:a2;拒绝域为 z2 戚 5-1)(2)单侧检验 HQ.a1 cr:拒绝域为炉 被(_
25、 i)(3)单侧检验 HQ:a2%)=。2拒绝域名-。分位点的值,查出分位点匕5-1)拒绝域为Z2 Zl-a(n-1)例酒厂用自动装瓶机装酒,每瓶规定重量500克,标准差不超过10克。每天定时检查,某天抽取9瓶,测得平均重量为499克,标准差16.03克设重量X 问这台机器工作是否正常?。=0.05解:此题要检验均值与方差”标准差不超过10克”表示方差检验是单侧的 均值检验是双侧的。方差检验?:a2 102(a0=10)查分位点始05=15.507 拒绝域是=的值 15.507计算=(?=20.56%10该样本/的值 15.507,拒绝接受Hi,即机器不够稳定。例酒厂用自动装瓶机装酒,每瓶规定
26、重量500克,标准差不超过10克。每天定时检查,某天抽取9瓶,测得平均重量为499克,标准差16.03克 设重量X 问这台机器工作是否正常?a=0.05解了标准差不超过10克”表示方差检验是单侧的 均值检验是双侧的。均值的检验4:=500;区:4工500,0未知,用,双侧检验%025(8 =2.306,拒绝域为 2.306将土=499代人0.187 1与=0.1372现土=0.06 0.1372,不在拒绝域内,接霸”此两台仪器无显著差异 由于这总体误差X是由随机误差引起的,认为服从正态分布XN(3 问在a=0.01的显著水平下,(1)是否有=0(2)求均值的99%的置信区间(3)总体差虎否超过
27、0019元=0.06/2=Z(Xj _君2=0.01505,%二九005(8)=3.3554解 置信区间为 白牡(8)(0.060.1372)=(-0.072,0.1972)、J /2 j解(3)HQ:a2 0.01拒绝域如y/。1(8)空X=18.1202,若m=20.09缶/5一?一=18.1202 /oi(8)=20.09 接受外,。匕(1)=a n拒绝域/%a(k-D例1在a=0.05的水平下,为检验计算机随机产生的数字0,1,2,9 是否等可能,现让计算机打印800个数字,其结果如下:数字i 023456789频数 fi 74 92 83 79 80 73 77 75 76 91解:
28、在a=0.05的水平下,假设是等可能的,即设:P(X=0)=P(X=1)=P(X=9)=做统计数字n=800,p.=-,1 10拒绝域/(儿-1)他=80=1,2,,10,A;=10,左一1 二 9a=0.05(9)=16,919808080808080808080806123-10-7-35411%2二三(力-叨)2二525/=5.125 V 16.919,接受第九章一元线性回归(最小二乘法)研究一元回归模型y=a+bx+,1eN 0,02)取样本(巧遇 i=12,*显然有 必=+巧+书,由于G相互独立且与同。同分布,则y,-N l+bxi9a2 1.用最小二乘法求/,的估计设直线3=a+版
29、表示拟合的直线,由样本(巧,人),每个巧,就有一个无n记嗔y(“a-bxj 求的最小值所得到的”,就是&范 1 1=1这里。(0花)的含义:Z g一 D=ECr,T-标,2是。(4,)的最小最小二乘法求?(,)二(人一 一如 2的最小i=l求2 向的驻点:掣=就(入一。一 2=o 加 1=1曹=5 _a_bxJXj=0关于,线性,有唯一解,则驻点就是最小解&花 回归方程为y=a+bx例 某医院用光电比色计检 验尿汞,得尿汞含量(mg/l)与消光数读数的结果如下 尿汞含量X)2 4 6 8 10消光系数匕|64 138 205 285 360已知它们之间服从线性模型E(K)=+bXi9求和的最小二乘估计o解:Q(a,b)=E(X-bx)2 i=l孚二-2(X bxj=0da i=i曹=-咚 5-a-bxjXj=0 5 55+方义2巧=必v i=l i=l 5 5 54xZ a+xZ%;=Z、i=l i=l i=lXyXyxy264446961284138161904455262053642025123082856481225228010360100129600360030105222027659077905a+30b=105230+220A=7790 A=36.95,a=-11.3