1、第四节 总体分布函数的假设检验
上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的假设.例如检验假设:“总体服从正态分布”等.本节仅介绍检验法.
所谓检验法是在总体的分布为未知时,根据样本值x1,x2,…,xn来检验关于总体分布的假设
H0:总体X的分布函数为F(x);
H1:总体X的分布函数不是F(x) (8.22)
的一种方法(这里的备择假设H1可不必写出).
注意,若总体X为离散型,则假设(8.22)相当于
H0:总体X的分布律为P{X=xi}
2、pi,i=1,2,…;(8.23)
若总体X为连续型,则假设(8.22)相当于
H0:总体X的概率密度为f(x). (8.24)
在用检验法检验假设H0时,若在假设H0下F(x)的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.
检验法的基本思想与方法如下:
(1) 将随机试验可能结果的全体Ω分为k个互不相容的事件A1,A2,…,Ak(=Ω,AiAj=Æ,i≠j;i,j=1,2,…,k),于是在H0为真时,可以计算概率=P(Ai)(i=1,2,…,k).
(2) 寻找用于检验的统计量及相应的分布,在n次试验中,事件Ai出现的频率与
3、概率往往有差异,但由大数定律可以知道,如果样本容量n较大(一般要求n至少为50,最好在100以上),在H0成立条件下的值应该比较小,基于这种想法,皮尔逊使用
= (8.25)
作为检验H0的统计量,并证明了如下的定理.
定理8.1 若n充分大(n≥50),则当H0为真时(不论H0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k-r-1的分布,其中r是被估计的参数的个数.
(3) 对于给定的检验水平α,查表确定临界值使
P{>)}=α,
从而得到H0的拒绝域为
>).
(4)由样本值x1,x2,…,xn计算的值,并与比较.
(5) 作
4、结论:若>,则拒绝H0,即不能认为总体分布函数为F(x);否则接受H0.
例8.10 一本书的一页中印刷错误的个数X是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.
表8-5
错误个数i
0
1
2
3
4
5
6
≥7
页数fi
36
40
19
2
0
2
1
0
Ai
A 0
A 1
A 2
A 3
A 4
A 5
A 6
A7
其中fi是观察到有i个错误的页数.问能否认为一页书中的错误个数X服从泊松分布(取α=0.05)?
解 由题意首先提出假设:
H0:总体X服从泊松分布.
5、
P{X=i}=,i=0,1,2,…,
这里H0中参数λ为未知,所以需先来估计参数.由最大似然估计法得
=1.
将试验结果的全体分为A0,A1,…,A7两两不相容的事件.若H0为真,则P{X=i}有估计
,i=0,1,2,….
例如
………………
计算结果如表8-6所示.将其中有些npi<5的组予以适当合并,使新的每一组内有npi≥5,如表8-6所示,此处并组后k=4,但因在计算概率时,估计了一个未知参数λ,故
计算结果为=1.460(表8-6).因为=5.991>1.46,所以在显著性水平为0.05下接受H0,即认为总体服从泊松分布.
表8-6
Ai
6、
fi
A0
36
e-1
36.788
-0.788
0.017
A1
40
e-1
36.788
3.212
0.280
A2
19
e-1/2
18.394
0.606
0.020
A3
A4
A5
A6
A7
2
0
2
1
0
e-1/6
e-1/24
e-1/120
e-1/720
6.131
1.533
0.307
0.051
0.008
-3.03
1.143
Σ
1.460
例8.11 研究混凝土抗压强度的分布.200件混凝土制件的抗压强度以分组形式列出(表8
7、7).n==200.要求在给定的检验水平α=0.05下检验假设
H0:抗压强度X~N(μ,σ2).
表8-7
压强区间(×98kPa)
频数fi
190~200
10
200~210
26
210~220
56
220~230
64
230~240
30
240~250
14
解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ2的极大似然估计值.由第七章知,μ与σ2的极大似然估计值为
,
.
设为第i组的组中值,我们有
=221,
=152,
=12.33.
原假设H0改写成X是正态N(221,12.332)分布,计算每个区间的理论概率
8、值
, i=1,2,…,6,
其中
,
.
为了计算出统计量之值,我们把需要进行的计算列表如下(表8-8).
表8-8
压强区间X
频数fi
标准化区间[μi,μi+1]
190~200
10
(-∞,-1.70)
0.045
9
1
0.11
200~210
26
[-1.70,-0.89)
0.142
28.4
5.76
0.20
210~220
56
[-0.89,-0.08)
0.281
56.2
0.04
0.00
220~230
64
[-0.08,0.73)
0.299
59.8
17.64
0.29
230~240
30
[0.73,1.54)
0.171
34.2
17.64
0.52
240~250
14
[1.54,+∞)
0.062
12.4
2.56
0.23
Σ
1.000
200
1.35
从上面计算得出的观察值为1.35.在检验水平α=0.05下,查自由度m=6-2-1=3的分布表,得到临界值=7.815.由于=1.35<7.815=,不能拒绝原假设,所以认为混凝土制件的抗压强度的分布是正态分布N(221,152).
4 / 4