资源描述
第一章 概率论的基本概念
定义:
随机试验E的每个结果样本点组成样本空间S,S的子集为E的随机事件,单个样本点为基本事件.
事件关系:
1.AB,A发生必导致B发生.
2.AB和事件,A,B至少一个发生,AB发生.
3.AB记AB积事件,A,B同时发生,AB发生.
4.A-B差事件,A发生,B不发生,A-B发生.
5.AB=Ø,A与B互不相容(互斥),A与B不能同时发生,基本事件两两互不相容.
6.AB=S且AB=Ø,A与B互为逆事件或对立事件,A与B中必有且仅有一个发生,记B=.
事件运算:
交换律、结合律、分配率略.
德摩根律:,.
概率:
概率就是n趋向无穷时的频率,记P(A).
概率性质:
1.P(Ø)=0.
2.(有限可加性)P(A1A2…An)=P(A1)+P(A2)+…+P(An),Ai互不相容.
3.若AB,则P(B-A)=P(B)-P(A).
4.对任意事件A,有.
5.P(AB)=P(A)+P(B)-P(AB).
古典概型:
即等可能概型,满足:1.S包含有限个元素.2.每个基本事件发生的可能性相同.
等概公式:
.
超几何分布:
,其中.
条件概率:
.
乘法定理:
.
全概率公式:
,其中为S的划分.
贝叶斯公式:
,或.
独立性:
满足P(AB)=P(A)P(B),则A,B相互独立,简称A,B独立.
定理一:
A,B独立,则.P(B|A)=P(B).
定理二:
A,B独立,则A与,与,与也相互独立.
第二章 随机变量及其分布
(0—1)分布:
,k=0,1 (0<p<1).
伯努利实验:
实验只有两个可能的结果:A及.
二项式分布:
记X~b(n,p),.
n重伯努利实验:
独立且每次试验概率保持不变.其中A发生k次,即二项式分布.
泊松分布:
记X~π(λ),,.
泊松定理:
,其中.当,应用泊松定理近似效果颇佳.
随机变量分布函数:
,.
.
连续型随机变量:
,X为连续型随机变量,为X的概率密度函数,简称概率密度.
概率密度性质:
1.;2.;3.;4.,f(x)在x点连续;5.P{X=a}=0.
均匀分布:
记X~U(a,b);;.
性质:对a≤c<c+l≤b,有
指数分布:
;.
无记忆性:
.
正态分布:
记;;.
性质:
1.f(x)关于x=μ对称,且P{μ-h<X≤μ}=P{μ<X≤μ+h};2.有最大值f(μ)=()-1.
标准正态分布:
;.
即μ=0,σ=1时的正态分布X~N(0,1)
性质:.
正态分布的线性转化:
对有;且有.
正态分布概率转化:
;.
3σ法则:
P=Φ(1)-Φ(-1)=68.26%;P=Φ(2)-Φ(-2)=95.44%;P=Φ(3)-Φ(-3)=99.74%,P多落在(μ-3σ,μ+3σ)内.
上ɑ分位点:
对X~N(0,1),若zα满足条件P{X>zα}=α,0<α<1,则称点zα为标准正态分布的上α分位点.
常用
上ɑ分位点:
0.001
0.005
0.01
0.025
0.05
0.10
3.090
2.576
2.326
1.960
1.645
1.282
Y服从自由度为1的χ2分布:
设X密度函数fX(x),,若Y=X2,则
若设X~N(0,1),则有
定理:
设X密度函数fX(x),设g(x)处处可导且恒有g′(x)>0(或g′(x)<0),则Y=g(X)是连续型随机变量,且有
h(y)是g(x)的反函数;①若,则α=min{g(−∞),g(+∞)},β=max{g(−∞),g(+∞)};②若fX(x)在[a,b]外等于零,g(x)在[a,b]上单调,则α=min{g(a),g(b)},β=max{g(a),g(b)}.
应用:
Y=aX+b~N(aμ+b,(|a|σ)2).
第三章 多维随机变量及其分布
二维随机变量的分布函数:
分布函数(联合分布函数):,记作:.
.
F(x,y)性质:
1.F(x,y)是x和y的不减函数,即x2>x1时,F(x2,y)≥F(x1,y);y2>y1时,F(x,y2)≥F(x,y1).
2.0≤F(x,y)≤1且F(−∞,y)=0,F(x,−∞)=0,F(−∞,−∞)=0,F(+∞,+∞)=1.
3.F(x+0,y)=F(x,y),F(x,y+0)=F(x,y),即F(x,y)关于x右连续,关于y也右连续.
4.对于任意的(x1,y1),(x2,y2),x2>x1,y2>y1,有P{x1<X≤x2,y1<Y≤y2}≥0.
离散型(X,Y):
,,.
连续型(X,Y):
.
f(x,y)性质:
1.f(x,y)≥0.
2..
3..
4.若f(x,y)在点(x,y)连续,则有.
n维:
n维随机变量及其分布函数是在二维基础上的拓展,性质与二维类似.
边缘分布:
Fx(x),Fy(y)依次称为二维随机变量(X,Y)关于X和Y的边缘分布函数,FX(x)=F(x,∞),FY(y)=F(∞,y).
离散型:
和分别为(X,Y)关于X和Y的边缘分布律,记,.
连续型:
,为(X,Y)关于X和Y的边缘密度函数,记,.
二维正态分布:
.
记(X,Y)~
N(μ1,μ2,σ12,σ22,ρ)
,.,.
离散型条件分布律:
.
.
连续型条件分布:
条件概率密度:
条件分布函数:
含义:当时,.
均匀分布:
若,则称(X,Y)在G上服从均匀分布.
独立定义:
若P{X≤x,Y≤y}=P{X≤x}P{Y≤y},即F(x,y)=Fx(x)Fy(y),则称随机变量X和Y是相互独立的.
独立条件或可等价为:连续型:f(x,y)=fx(x)fy(y);离散型:P{X=xi,Y=yj}=P{X=xi}P{Y=yj}.
正态独立:
对于二维正态随机变量(X,Y),X和Y相互对立的充要条件是:参数ρ=0.
n维延伸:
上述概念可推广至n维随机变量,要注意的是边缘函数或边缘密度也是多元(1~n-1元)的.
定理:
设(X1,X2,…,Xm)和(Y1,Y2,…,Yn)相互独立,则Xi和Yj相互独立.又若h,g是连续函数,则h(X1,X2,…,Xm)和g(Y1,Y2,…,Yn)相互独立.
Z=X+Y
分布:
若连续型(X,Y)概率密度为f(x,y),则Z=X+Y为连续型且其概率密度为
或.
fX和fY的卷积公式:
记,其中除继上述条件,且X和Y相互独立,边缘密度分别为fX(x)和fY(y).
正态卷积:
若X和Y相互独立且X~N(μ1,σ12),记Y~N(μ2,σ22),则对Z=X+Y有Z~N(μ1+μ2,σ12+σ22).
1.上述结论可推广至n个独立正态随机变量.2.有限个独立正态随机变量的线性组合仍服从正态分布.
伽马分布:
记,
,.
,其中.
若X和Y独立且X~Γ(α,θ),记Y~Γ(β,θ),则有X+Y~Γ(α+β,θ).可推广到n个独立Γ分布变量之和.
:
,若X和Y相互独立,则有.
分布:
,若X和Y相互独立,则有.
大小分布:
若X和Y相互独立,且有M=max{X,Y}及N=min{X,Y},则M的分布函数:Fmax(z)=FX(z)FY(z),N的分布函数:Fmin(z)=1-[1-FX(z)][1-FY(z)],以上结果可推广到n个独立随机变量的情况.
第四章 随机变量的数字特征
数学期望:
简称期望或均值,记为E(X);离散型:.连续型:.
定理:
设Y是随机变量X的函数:Y=g(X)(g是连续函数).
1.若X是离散型,且分布律为P{X=xk}=pk,则:
.
2.若X是连续型,概率密度为f(x),则:
.
定理推广:
设Z是随机变量X,Y的函数:Z=g(X,Y)(g是连续函数).
1.离散型:分布律为P{X=xi,Y=yj}=pij,则:
.
2.连续型:
期望性质:
设C是常数,X和Y是随机变量,则:
1.E(C)=C.2.E(CX)=CE(X).3.E(X+Y)=E(X)+E(Y).
4.又若X和Y相互独立的,则E(XY)=E(X)E(Y).
方差:
记D(X)或Var(X),D(X)=Var(X)=E{[X-E(X)]2}.
标准差(均方差):
记为σ(X),σ(X)= .
通式:.
,.
标准化变量:
记,其中,,称为X的标准化变量.
,.
方差性质:
设C是常数,X和Y是随机变量,则:
1.D(C)=0. 2.D(CX)=C2D(X),D(X+C)=D(X).
3.D(X+Y)=D(X)+D(Y)+2E{(X-E(X))(Y-E(Y))},若X,Y相互独立D(X+Y)=D(X)+D(Y).
4.D(X)=0的充要条件是P{X=E(X)}=1.
正态线性变换:
若,是不全为0的常数,则.
切比雪夫不等式:
或,其中,,为任意正数.
协方差:
记.
X与Y的相关系数:
.
D(X+Y)=D(X)+D(Y)+2Cov(X,Y),Cov(X,Y)=E(XY)-E(X)E(Y).
性质:
1.Cov(aX,bY)=abCov(X,Y),a,b是常数.
2.Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).
系数性质:
令e=E[(Y-(a+bX))2],则e取最小值时有
,
其中,.
1.|ρXY|≤1.2.|ρXY|=1的充要条件是:存在常数a,b使P{Y=a+bX}=1.
|ρXY|越大e越小X和Y线性关系越明显,当|ρXY|=1时,Y=a+bX;反之亦然,当ρXY=0时,X和Y不相关.
X和Y相互对立,则X和Y不相关;但X和Y不相关,X和Y不一定相互独立.
定义:
k阶矩(k阶原点矩):E(X k ).
n维随机变量X i的协方差矩阵:
,
=E{[Xi-E(Xi)][X j-E(X j)]}.
k+l阶混合矩:E(X kY l ).
k阶中心矩:E{[X-E(X)] k }.
k+l阶混合中心矩:
E{[X-E(X)]k[Y-E(Y)]l}.
n维正态分布:
,.
性质:
1.n维正态随机变量(X1,X2,…,X n)的每一个分量Xi (i=1,2,…,n)都是正态随机变量,反之,亦成立.
2.n维随机变量(X1,X2,…,X n)服从n维正态分布的充要条件是X1,X2,…,X n的任意线性组合l1X1+l2X2+…+l n X n服从一维正态分布(其中l1,l2,…,l n不全为零).
3.若(X1,X2,…,X n)服从n维正态分布,且Y1,Y2,…,Y k是X j (j=1,2,…,n)的线性函数,则(Y1,Y2,…,Y k)也服从多维正态分布.
4.若(X1,X2,…,X n)服从n维正态分布,则“Xi 相互独立”与“Xi 两两不相关”等价.
第五章 大数定律及中心极限定理
弱大数定理:
若X1,X2,…是相互独立并服从同一分布的随机变量序列,且E(X k)=μ,则对任意ε>0有
或,.
定义:
Y1,Y2,…,Y n ,…是一个随机变量序列,a是一个常数.若对任意ε>0,有
则称序列Y1,Y2,…,Y n ,…依概率收敛于a.记
伯努利大数定理:
~
对任意ε>0有或.
其中f A是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率.
中心极限定理
定理一:
设X1,X2,…,X n ,…相互独立并服从同一分布,且E(X k)=μ,D(X k)=σ2 >0,则n→∞时有
近似的
N(0,1)或~N(0,1)或~N(μ,).
定理二:
设X1,X2,…,X n ,…相互独立且E(X k)=μ k,D(X k)=σ k2 >0,若存在δ>0使n→∞时,
,则~N(0,1),记.
定理三:
设,则n→∞时,(0,1),.
第六章 样本及抽样分布
定义:
总体:全部值;个体:一个值;容量:个体数;有限总体:容量有限;无限总体:容量无限.
定义:
样本:X1,X2,…,X n 相互独立并服从同一分布F的随机变量,称从F得到的容量为n的简单随机样本.
频率直方图:
图形:以横坐标小区间为宽,纵坐标为高的跨越横轴的几个小矩形.
横坐标:数据区间(大区间下限比最小数据值稍小,上限比最大数据值稍大;小区间:均分大区间,组距Δ=大区间/小区间个数;小区间界限:精度比数据高一位).
图形特点:外轮廓接近于总体的概率密度曲线.
纵坐标:频率/组距(总长度:<1/Δ;小区间长度:频率/组距).
定义:
样本p分位数:记xp,有1.样本xi中有np个值≤xp.2.样本中有n(1-p)个值≥xp.
箱线图:
xp选择:
记.
分位数x0.5,记为Q2或M,称为样本中位数.
分位数x0.25,记为Q1,称为第一四分位数.
分位数x0.75,记为Q3,称为第三四分位数.
图形:
min Q1 M Q3 max
图形特点:M为数据中心,区间[min,Q1],[Q1,M],[M,Q3],[Q3,max]数据个数各占1/4,区间越短数据密集.
四分位数间距:记IQR=Q3-Q1;若数据X<Q1-1.5IQR或X>Q3+1.5IQR,就认为X是疑似异常值.
抽样分布:
样本平均值:
样本方差:
样本标准差:
样本k阶(原点)矩:
,k≥1
样本k阶中心矩:
,k≥2
经验分布函数:
,.
表示F的一个样本X1,X2,…,X n 中不大于x的随机变量的个数.
自由度为n的χ2分布:
记χ2~χ2(n),,其中X1,X2,…,X n是来自总体N(0,1)的样本.E(χ2 )=n,D(χ2 )=2n.
χ12+χ22~χ2(n1+n2).
.
χ2分布的分位点:
对于0<α<1,满足,则称为的上α分位点.
当n充分大时(n>40),,其中是标准正态分布的上α分位点.
自由度为n的t分布:
记t~t (n),,
其中X~N(0,1),Y~χ2(n),X,Y相互独立.
h(t)图形关于t=0对称;当n充分大时,t分布近似于N(0,1)分布.
t分布的分位点:
对于0<α<1,满足,则称为的上α分位点.
由h(t)对称性可知t1-α(n)=-t α(n).当n>45时,t α(n)≈zα,zα是标准正态分布的上α分位点.
自由度为(n1,n2)的F分布:
记F~F(n1,n2),,其中U~χ2(n1),V~χ2(n2),X,Y相互独立.1/F~F(n2,n1)
F分布的分位点:
对于0<α<1,满足,则称为的上α分位点.
重要性质:F1-α(n1,n2)=1/Fα(n1,n2).
定理一:
设X1,X2,…,X n 是来自N(μ,σ2)的样本,则有,其中是样本均值.
定理二:
设X1,X2,…,X n 是来自N(μ,σ2)的样本,样本均值和样本方差分别记为
,,则有1.;2.与相互独立.
定理三:
设X1,X2,…,X n 是来自N(μ,σ2)的样本,样本均值和样本方差分别记为
,,则有.
定理四:
设X1,X2,…,X n1 与Y1,Y2,…,Y n2分别是来自N(μ1,σ12)和N(μ2,σ22)的样本,且相互独立.设这两个样本的样本均值和样本方差分别记为
,,,,则有1..
2.当σ12=σ22=σ2时,,其中,.
第七章 参数估计
定义:
估计量:,估计值:,统称为估计.
矩估计法:
令=()(k为未知数个数)联立方程组,求出估计.
设总体X均值μ及方差σ2都存在,则有
,.
最大似然估计法:
似然函数:离散:或连续:,化简可去掉与θ无关的因式项.
即为最大值,可由方程或求得.
当多个未知参数θ1,θ1,…,θk时:可由方程组
或()求得.
最大似然估计的不变性:若u=u(θ)有单值反函数θ=θ(u),则有,其中为最大似然估计.
截尾样本取样:
定时截尾样本:抽样n件产品,固定时间段t0内记录产品个体失效时间(0≤t1≤t2≤…≤tm≤t0)和失效产品数量.
定数截尾样本:抽样n件产品,固定失效产品数量数量m记录产品个体失效时间(0≤t1≤t2≤…≤tm).
结尾样本最大似然估计:
定数截尾样本:设产品寿命服从指数分布X~e(θ),θ即产品平均寿命.产品ti时失效概率P{t=ti}≈f(ti)d ti,寿命超过tm的概率,则,化简得,由得:,其中s(tm)=t1+t2+…+tm+(n-m)tm,称为实验总时间.
定时截尾样本:与定数结尾样本讨论类似有s(t0)=t1+t2+…+tm+(n-m)t0,,,.
无偏性:
估计量的存在且,则称是的无偏估计量.
有效性:
与都是的无偏估计量,若,则较有效.
相合性:
设的估计量,若对于任意有,则称是的相合估计量.
置信区间:
,和分别为置信下限和置信上限,则是的一个置信水平为置信区间,称为置信水平,.
正态样本置信区间:
设X1,X2,…,Xn是来自总体X~N(μ,σ2)的样本,则有μ的置信区间:
枢轴量W W分布 a,b不等式 置信水平 置信区间
其中zα/2为上α分位点
θ置信区间的求解:
1.先求枢轴量:即函数W=W(X1,X2,…,Xn;θ),且函数W的分布不依赖未知参数.
如上讨论标注
2.对于给定置信水平,定出两常数a,b使P{a<W<b}=,从而得到置信区间.
(0-1)分布p的区间估计:
样本容量n>50时,
若令,,,则有置信区间(,).
单侧置信区间:
若或,称(,)或(,)是θ的置信水平为的单侧置信区间.
正态总体均值、方差的置信区间与单侧置信限(置信水平为)
待估
其他
枢轴量W的分布
置信区间
单侧置信限
一个正态总体
μ
σ2已知
,
μ
σ2未知
,
σ2
μ未知
,
两个正态总体
μ1-μ2
σ12,σ22
已知
μ1-μ2
σ12=σ22=σ2
未知
σ12/σ22
μ1,μ2
未知
,
单个总体X~N(μ,σ2),两个总体X~N(μ1,σ12),Y~N(μ2,σ22).
第八章 假设实验
定义:
H0:原假设或零假设,为理想结果假设;H1:备择假设,原假设被拒绝后可供选择的假设.
第Ⅰ类错误:H0实际为真时,却拒绝H0.第Ⅱ类错误:H0实际为假时,却接受H0.
显著性检验:只对犯第第Ⅰ类错误的概率加以控制,而不考虑第Ⅱ类错误的概率的检验.
P{当H0为真拒绝H0}≤α,α称为显著水平.拒绝域:取值拒绝H0.临界点:拒绝域边界.
双边假设检验:H0:θ=θ0,H1:θ≠θ0.右边检验:H0:θ≤θ0,H1:θ>θ0.左边检验:H0:θ≥θ0,H1:θ<θ0.
正态总体均值、方差的检验法(显著性水平为α)
原假设H0
备择假设H1
检验统计量
拒绝域
1
σ2已知
μ≤μ0
μ>μ0
z≥zα
μ≥μ0
μ<μ0
z≤-zα
μ=μ0
μ≠μ0
|z|≥zα/2
2
σ2未知
μ≤μ0
μ>μ0
t≥tα(n-1)
μ≥μ0
μ<μ0
t≤-tα(n-1)
μ=μ0
μ≠μ0
|t|≥tα/2(n-1)
3
σ1,σ2
已知
μ1-μ2≤δ
μ1-μ2>δ
z≥zα
μ1-μ2≥δ
μ1-μ2<δ
z≤-zα
μ1-μ2=δ
μ1-μ2≠δ
|z|≥zα/2
4
σ12=σ22
=σ2
未知
μ1-μ2≤δ
μ1-μ2>δ
t≥tα(n1+n2-2)
μ1-μ2≥δ
μ1-μ2<δ
t≤-tα(n1+n2-2)
μ1-μ2=δ
μ1-μ2≠δ
|t|≥tα/2(n1+n2-2)
5
μ未知
σ2≤σ02
σ2>σ02
χ2≥χα2(n-1)
σ2≥σ02
σ2<σ02
χ2≤χ21-α(n-1)
σ2=σ02
σ2≠σ02
χ2≥χ2α/2(n-1)或χ2≤χ21-α/2(n-1)
6
μ1,μ2
未知
σ12≤σ22
σ12>σ22
F≥Fα(n1-1,n2-1)
σ12≥σ22
σ12<σ22
F≤F1-α(n1-1,n2-1)
σ12=σ22
σ12≠σ22
F≥Fα/2(n1-1,n2-1)或
F≤F1-α/2(n1-1,n2-1)
7
成对
数据
μD≤0
μD>0
t≥tα(n-1)
μD≥0
μD<0
t≤-tα(n-1)
μD=0
μD≠0
|t|≥tα-2(n-1)
检验方法选择:
主要是逐对比较法(成对数据)跟两个正态总体均值差的检验的区别,如上表即7跟3、4的区别,成对数据指两样本X和Y之间存在一一对应关系,而3和4一般指X和Y相互对立,但针对同一实体.
关系:
置信区间与假设检验之间的关系:未知参数的置信水平为1-α的置信区间与显著水平为α的接受域相同.
定义:
施行特征函数(OC函数):β(θ)=Pθ(接受H0).功效函数:1-β(θ).功效:当θ*∈H1时,1-β(θ*)的值.
展开阅读全文