资源描述
第1章 随机事件及其概率
1排列组合
2关系运算
A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C (AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)
,
3几何概型
v (1)S是直线上的某个线段,长度为l(S),A是S的一个子集,则落在A中的概率为:P(A)=l(A)/l(S)。
v (2)S是平面上的某个区域,面积为u(S), 则落在A中的概率为:P(A)=u(A)/u(S)。
v (3)S是空间上的某个立体,体积为v(S), 则落在A中的概率为:P(A)=v(A)/v(S)。
甲乙两人相约在7点到8点之间在某地会面,先到者等候另一人20分钟,过时就离开。如果每个人可在指定的任一小时内任意时刻到达,试计算二人能够会面的概率。
根据题意,这是一个几何概型问题,于是
解:
4加法公式
P(A+B)=P(A)+P(B)-P(AB) 当P(AB)=0时,P(A+B)=P(A)+P(B)
5减法公式
P(A-B)=P(A)-P(AB) 当BA时,P(A-B)=P(A)-P(B) 当A=Ω时,P()=1- P(B)
6条件概率
事件B在事件A发生条件下发生的条件概率为 。
7乘法公式
P(ABC)=P(A)P(B|A)P(C|AB) [P(AB)>0]
8独立性
①两个事件的独立性
设事件、满足,则称事件、是相互独立的。
若事件、相互独立,且,则有
若事件、相互独立,则可得到与、与、与也都相互独立。
必然事件和不可能事件Ø与任何事件都相互独立. Ø与任何事件都互斥。
②多个事件的独立性
设ABC是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)
并且同时满足P(ABC)=P(A)P(B)P(C)
那么A、B、C相互独立。 对于n个事件类似。
9伯努利概型
概率P(A)=p , 发P()=1-p=q,用表示重伯努利试验中出现次的概率,
,。
第二章 随机变量及其分布
1离散型随机变量
P(X=xk)=pk,k=1,2,…, (1), (2)
2连续型随机变量概率密度
(1) ;(2) 。
3分布函数
1 ; 2、单调不减性:若x1<x2, 则F(x1)£F(x2);
3 , ;
4 右连续性:
对于离散型随机变量,; 对于连续型随机变量,
二项分布
,
当时,就是(0-1)分布:P(X=1)=p, P(X=0)=q
泊松分布
或者P():,,,
泊松分布为二项分布的极限分布(np=λ,n→∞)。
超几何分布
随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。
几何分布
,其中p≥0,q=1-p。(k次试验,前k-1次失败,第k次成功)
随机变量X服从参数为p的几何分布,记为G(p)。
均匀分布
a≤x≤b
a≤x≤b
X~U(a,b): 其他,
0, x<a,
1, x>b。
当a≤x1<x2≤b时,X落在区间()内的概率为。
指数分布
,
0, ,
,
x<0。
积分公式:
正态分布
X~N(m, s2);
(s越大,曲线越平坦,s越小,曲线越陡峭)
X~N(0, 1): ~N(0, 1)
X落在以m为中心,3s为半径的区间(m-3s, m +3s)内的概率相当大(0.9973),落在(m-3s, m +3s)以外的概率可以忽略不计
函数分布
离散型
连续型
FY (y) =P(Y£y)=P(g(X) £y)=
第三章 二维随机变量及其分布
联
合
分
布
离
散
型
Y
X
y1
y2
Y3
P(X=xi)
(1)pij≥0(i,j=1,2,…);
(2)
x1
p11
p12
p13
x2
p21
p22
p23
X3
P31
P32
P33
P(Y=yj)
1
连
续
型
二维随机变量的本质
联
合
分
布
函
数
称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。
(1) (2)F(x,y)分别对x和y是 减的
(3)F(x,y)分别对x和y是右连续的,即
(4)
(5)对于.
离散型与连续型的关系
边
缘
分
布
离散型
; 。
连续型
条
件
分
布
离散型
连续型
;
独
立
性
一般型
F(X,Y)=FX(x)FY(y)
离散型
有零不独立
连续型
f(x,y)=fX(x)fY(y) 充要条件:①可分离变量②正概率密度区间为矩形
二维正态分布
=0
随机变量的函数
若X1,X2,…Xm,Xm+1,…Xn相互独立, h,g为连续函数,则:
h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。
特例:若X与Y独立,则:h(X)和g(Y)独立。例如:若X与Y独立,则:3X+1和5Y-2独立。
二维均匀分布
其中SD为区域D的面积,称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D)。
若(X,Y)服从矩形区域a≤x ≤ b,c ≤ y ≤ d上的均匀分布,则(X,Y)的两个边缘分布仍为均匀分布,且分别为
二维正态分布
二维正态分布,(X,Y)~N(
可以推出 X~N( 但若X~N(,(X,Y)未必是二维正态分布。
函数分布
Z=X+Y
, 对于连续型,fZ(z)=
两个独立的正态分布的和仍为正态分布()。
卷积公式:
M=max(X,Y),N=min(X,Y)的分布(极值分布)
设随机变量X,Y相互独立且分布函数分别为FX(x),FY(y)则M与N的分布函数分别为
分布
设n个随机变量相互独立,且服从标准正态分布,可以证明它们的平方和
的分布密度为
我们称随机变量W服从自由度为n的分布,记为W~,其中
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
分布满足可加性:设
则
t分布
设X,Y是两个相互独立的随机变量,且
可以证明函数 的概率密度为
我们称随机变量T服从自由度为n的t分布,记为T~t(n)。
F分布
设,且X与Y独立,可以证明的概率密度函数为
我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2).
第四章 随机变量的数字特征
一维随机变量的数字特征
离散型
连续型
期望(平均值)
E(X+Y)=E(X)+E(Y); E(XY)=E(X) E(Y),充分条件:X和Y独立;充要条件:X和Y不相关。
函数的期望
Y=g(X)
Y=g(X)
方差,标准差
,
(1) D(C)=0; D(aX)=a2D(X); D(aX+b)= a2D(X); D(X)=E(X2)-E2(X)
(2) D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))]
D(X±Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。
矩
①k阶原点矩νk=E(Xk)=
②k阶中心矩
=, k=1,2, ….
①k阶原点矩νk=E(Xk)=
②k阶中心矩
= k=1,2, ….
切比雪夫不等式
E(X)=μ, D(X)=σ2 :
期望E(X)
方差D(X)
E[X(X-1)}/备注
0-1分布
p
二项分布
np
n(n-1)p2
泊松分布
几何分布
超几何分布
均匀分布
指数分布
正态分布
n
2n
t分布
0
(n>2)
二维随机变量的数字特征
期望
函数的期望
=
=
方差
协方差
cov(X,Y)=E(XY)-E(X)E(Y).
, D(X)= cov(X,Y)= ; D(Y)=。
Cov (X, Y)=cov (Y, X) cov(aX,bY)=ab cov(X,Y) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y)
X与Y的相关系数(标准协方差):=
X的标准化变量:即“随机变量与期望之差除以均方差”
若记
则E(X*)=0, D(X*)=1
||≤1,当||=1时,称X与Y完全相关:
1. 若随机变量X与Y相互独立,则;反之不真。
2. 若(X,Y)~N(),
则X与Y相互独立的充要条件是X和Y不相关。
完全相关
而当时,称X与Y不相关。
以下五个命题是等价的:① ②cov(X,Y)=0 ③E(XY)=E(X)E(Y)
④D(X+Y)=D(X)+D(Y)+2Cov(X,Y) ⑤D(X-Y)=D(X)+D(Y)-2Cov(X,Y).
矩
1、A =E(X )为X的k阶原点矩(k阶矩)(k=1,2,…),数学期望E(X)即为X的一阶原点矩;
2、B =E{[X-E(X)] }为X的k阶中心矩(k=1,2,…),方差D(X)即为X的二阶中心矩。
3、=E(X Y )为X、Y的k+l阶混合原点矩(k,l=1,2…)。
4、为随机变量的k+l阶混合中心矩(k,l=1,2,…)。
协方差矩阵C
C=(C ) =
第五章 大数定律和中心极限定理
大数定律
切比雪夫
若X1,X2,…具有相同的数学期望E(XI)=μ,则
伯努利
当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小
辛钦
中心极限定理
列维-林德伯格/独立同分布的中心极限
棣莫弗-拉普拉斯
随机变量X1,X2,…相互独立,服从同一分布,且具有相同的数学期望和方差:
二项定理
若当,则
超几何分布的极限分布为二项分布。
泊松定理
若当,则 其中k=0,1,2,…,n,…。
第六章 样本及抽样分布
数理统计的基本概念
所研究的对象的全体称为总体,总体的每一个基本单位称为个体.
设总体X的分布为F(x),则样本(X1,X2,…,Xn)的联合分布为
从总体X中抽出若干个个体称为样本,一般记为(X1,X2,…,Xn)。n称为样本容量。
当总体X是离散型时,其分布律为
样本的联合分布律为
当总体X是连续型时, X~f(x),则样本的联合密度为
()为样本函数,其中为一个连续函数。若中不包含未知参数,则()为一个统计量。
常见统计量及其性质
样本均值 样本方差 样本标准差
样本k阶原点矩 样本k阶中心矩
,,,,其中为二阶中心矩。
正态
分布
设为来自正态总体的一个样本,则样本函数
t分布
定义 若X~N(0, 1),Y~c2(n),X与Y独立,则
t(n)称为自由度为n的t—分布。
p
3、(1) t分布表构成(P296):
P{t(n)>λ}=p
(2) P{t(n)> tp(n)}=p,tp(n)为水平p的上侧分位数
(1) f(t)关于t=0(纵轴)对称;
(2) f(t)的极限为N(0,1)的密度函数,即
=
。。。。。。。。。。。。。。。。。。。。。。。。。。。。样本函数 其中t(n-1)表示自由度为n-1的t分布。
设n个相互独立的 X1,X2,…,Xn,Xi~N(0,1),
则
称为自由度为n的c2分布。
λ
(1)
求
解:
(2) c2分布的可加性
X1,X2 相互独立,则X1+X2 ~c2(n1+n2)
p
(1)构成 P{c2(n)>λ}=p,已知n,p可查表(P298)求得λ;
水平为的上侧分位数分位点
(2)
。。。。。。。。。。。样本函数其中表示自由度为n-1的分布。
F
分
布
若X~c2(n1),Y~c2(n2) ,X,Y独立,则
称为第一自由度为n1 ,第二自由度为n2的F—分布,其概率密度为
F分布表(P294)及有关计算
(1)构成:P{F(n1,n2)>λ}=p
(2)有关计算P{F(n1,n2)>λ}=p λ=Fp(n1,n2)
性质:
样本函数 其中
表示第一自由度为,第二自由度为的F分布。
正态总体的抽样分布定理
4、(双正态总体的抽样分布)设(X1,X2,…,Xn1)是N(μ1,σ12)的样本,(Y1,Y2,…,Yn2)是N(μ2,σ22)的样本,且相互独立,S12,S22是样本方差,则
(1)
(2) 称为混合样本方差。
1.若
则
2.设(X1,X2,…,Xn)是正态总体
N(μ,σ2)的样本,则
(1)
与S2独立
(2)
(3)
3.设(X1,X2,…,Xn)是正态总
体N(μ,σ2)的样本,则
第七章 参数估计
(1)点估计(用某个函数值作为总体未知函数的估计值)
矩估计
极大似然估计
样本的k阶原点矩为
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
样本的似然函数,简记为Ln.
为样本的似然函数。
最大似然估计量。
估计量的评选标准
无偏性
若E ()=,则称 为的无偏估计量。 E()=E(X), E(S2)=D(X)
有效性
若,则称有效。
一致性
设是的一串估计量,如果对于任意的正数,都有 则称为的一致估计量(或相合估计量)。若为的无偏估计,且则为的一致估计。
只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
区间估计(对未知参数给出一个范围,并给出在一定的可靠度下使这个范围包含未知参数的真值)
置信区间和置信度
设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即
那么称区间为的置信区间,为该区间的置信度(或置信水平)。
单正态总体的期望和方差的区间估计
设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下:
(i)选择样本函数;
(ii)由置信度,查表找分位数;
(iii)导出置信区间。
已知方差,估计均值
(i)选择样本函数
(ii) 查表找分位数
(iii)导出置信区间
未知方差,估计均值
(i)选择样本函数
(ii)查表找分位数
(iii)导出置信区间
方差的区间估计
(i)选择样本函数
(ii)查表找分位数
(iii)导出的置信区间
第八章 假设检验
基本步骤
1)提出零假设H0(2)选择统计量K(3)对于检验水平α查表找分位数λ(4)由样本值计算统计量之值K;
将进行比较,作出判断:当时否定H0,否则认为H0相容。
第一类错误(弃真错误)
当H0为真时,作出拒绝H0的判断, 记α=P{拒绝H0| H0真};
第二类错误(取伪错误)
当H0不真时,作出接受H0的判断, β=P{接受H0| H0假}
单正态总体均值和方差的假设检验
条件
零假设
统计量
对应样本
函数分布
否定域
已知
N(0,1)
未知
未知
展开阅读全文