资源描述
假设检验概述
一、假设检验的基本概念
1.假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。
2.与原假设对立的是备选假设(alternative hypothesis) ,备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。
构造一个统计量来决定是“接受原假设,拒绝备选假设”,还是“拒绝原假设,接受备选假设”。对不同的问题,要选择不同的检验统计量。检验统计量确定后,就要利用该统计的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平α下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平α的区域,是原假设的拒绝区域;大概率区域是概率为1-α的区域,是原假设的接受区域。
二、两种类型的错误
接受
拒绝
真实
判断正确
弃真错误(第一类错误或α错误)
不真实
取伪错误(第二类错误或β错误)
判断正确
原假设
1. 研究者想收集证据予以反对的假设
2. 又称“0假设”
3. 总是有符号 =, £ 或 ³
4. 表示为 H0
n H0 : m = 某一数值
n 指定为符号 =,£ 或 ³
备择假设
1. 研究者想收集证据予以支持的假设
2. 也称“研究假设”
3. 总是有符号 ¹, < 或 >
4. 表示为 H1
n H1 : m <某一数值,或m >某一数值
n 例如, H1 : m < 10cm,或m >10cm
提出假设(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且相互对立
n 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)
显著性水平a
1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域
3. 表示为 a (alpha) 常用的 a 值有0.01, 0.05, 0.10
4. 由研究者事先确定
总体参数检验
一、单侧检验与双侧检验
1. 备择假设没有特定的方向性,并含有符号“¹”的假设检验,称为双侧检验或双尾检验(two-tailed test)
2. 备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)
n 备择假设的方向为“<”,称为左侧检验
n 备择假设的方向为“>”,称为右侧检验
假设
双侧检验
单侧检验
左侧检验
右侧检验
原假设
H0 : m = m0
H0 : m ³ m0
H0 : m £ m0
备择假设
H1 : m ≠m0
H1 : m < m0
H1 : m > m0
用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。
二、参数检验
参数检验都是先对样本所属总体的性质作出若干的假定,或对总体的分布形状加以限定,然后对总体的有关参数情况进行统计假设检验。因此,参数检验又称为限定分布检验。如在总体服从正态分布条件下,对其均值进行检验。下面通过具体例子来说明参数检验方法。
在例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:
• 第一步:确定原假设与备选假设。
• : =250; : <250
• 以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。
• 第二步:构造出检验统计量。
• 我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:
•
• 可用z作为检验统计量。
• 第三步:确定显著性水平,确定拒绝域。
• 通常显著水平由实际问题确定,我们这里取α=0.05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:
• - =-1.645,拒绝域是z<-1.645。
• 第四步:计算检验统计量的数值。
• 样本平均数 ,n=50,代入检验统计量得
• 第五步:判断。
• 检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌
• 总体标准差未知时对总体均值检验经常用t统计量:
•
• 但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。
三、p-值检验
p-值检验就是通过计算p-值,再将它与显著性水平α作比较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。p-值判断的原则是:如果p-值小于给定的显著性水平α,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果p-值很小,拒绝原假设,p-值很大,接受原假设。请大家注意的是这里的p-值是指概率,不要与成数指标相混淆。
• z检验的p-值:
• 检验统计量为z统计量的p-值计算公式, 表示检验统计量的抽样数据,则p-值的计算方法如下:
• 如果: , p-值=2
• 如果: , p-值=
• 如果: , p-值=
总体均值的检验(z-检验)
. 1.假定条件
n 正态总体或非正态总体大样本(n³30)
2. 使用z检验统计量
n s 2 已知:
n s 2 未知:
总体均值的检验 (检验方法的总结)
假设
双侧检验
左侧检验
右侧检验
假设形式
H0 : m =m0
H1 : m ¹m0
H0 : m ³m0
H1 : m <m0
H0 : m £ m0
H1 : m >m0
统计量
s 已知:
s 未知:
拒绝域
P值决策
拒绝H0
总体均值的检验(t-检验)
1. 假定条件 总体服从正态分布
2. 检验统计量
s 2 未知
总体均值的检验 (检验方法的总结)
假设
双侧检验
左侧检验
右侧检验
假设形式
H0 : m =m0
H1 : m ¹m0
H0 : m ³m0
H1 : m <m0
H0 : m £m0
H1 : m >m0
统计量
s 未知:
拒绝域
P值决策
拒绝H0
1.将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是( b )。
a. 单侧检验 b.双侧检验 c.右侧检验 d.左侧检验
2.检验功效定义为( b )。
a. 原假设为真时将其接受的概率 b. 原假设不真时将其舍弃的概率
c. 原假设为真时将其舍弃的概率 d. 原假设不真时将其接受的概率
3.符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着(c )。
a.存在试验误差(随机误差) b.存在着条件误差
c.不存在什么误差 d.既有抽样误差,也有条件误差
4.得出两总体的样本数据如下:
甲:8,6,10,7,8 乙:5,11,6,9,7,10
秩和检验中,秩和最大可能值是( c )。
a. 15 b. 48 c. 45 d. 66
1.显著性水平与检验拒绝域关系( a b d )
a. 显著性水平提高(α变小),意味着拒绝域缩小
b. 显著性水平降低,意味着拒绝域扩大 c. 显著性水平提高,意味着拒绝域扩大
d. 显著性水平降低,意味着拒绝域扩大化
e. 显著性水平提高或降低,不影响拒绝域的变化
2. β错误( a c d e )
a. 是在原假设不真实的条件下发生
b. 是在原假设真实的条件下发生
c. 决定于原假设与真实值之间的差距
d. 原假设与真实值之间的差距越大,犯β错误的可能性就越小
e. 原假设与真实值之间的差距越小,犯β错误的可能性就越大
1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平a=0.01与a=0.05,分别检验这批产品的平均重量是否是800克。
解:假设检验为 (产品重量应该使用双侧检验)。采用t分布的检验统计量。查出=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。。因为<2.131<2.947,所以在两个水平下都接受原假设。
2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(a=0.01)?
解:假设检验为 (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量。查出=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。
3.回顾本章开头的案例,医院从2008年元旦出生的新生儿中随机抽取了50名,测量他们的平均体重为3300克,而2007年元旦时抽取的50名新生儿的平均体重是3200克。现假设根据以住的调查,新生儿体重的标准差是65克。试问:
(1)以0.05的显著性水平,检验新生儿体重在这两年中是否有显著的变化?
(2)计算检验的p-值,并根据p-值重新检验(1)中的结论。
解:(1)假设检验为。新生儿体重服从正态分布,构造检验统计量。查出=0.05水平下的临界值为1.645。计算统计量值。因为z>1.645,所以拒绝原假设。
(2)对应p值=1/2*(1-F(z)) ,由于z=10.87857»3,可以认为p值几乎等于0,拒绝原假设。(1)、(2)都说明这两年新生儿的体重显著增加了。
4.某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问:
(1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑?
(2)计算(1)的p-值。
(3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?
(4)计算(3)的p-值。
(5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2)。
解:(1)(2)假设检验为。采用正态分布的检验统计量。查出=0.05水平下的临界值为1.96。计算统计量值。因为z=4.6875>1.96,所以拒绝原假设。对应p值=2(1-F(z)) ,查表得到F(z)在0.999 994和0.999 999之间,所以p值在0.000 006和0.000 001之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-F(|z|),直接查表即得F(|z|))。p值<0.05,拒绝原假设。都说明平均加油量并非12加仑。
(3)(4)假设检验为。采用成数检验统计量。查出=0.05水平下的临界值为1.64和1.65之间。计算统计量值,因此z=-2.5<-1.65(<-1.64),所以拒绝原假设。p值为0.00062(因为本题为单侧检验,p值=(1-F(|z|))/2 )。显然p值<0.05,所以拒绝原假设。
(5) 假设检验为。采用正态分布的检验统计量。查出=0.05水平下的临界值为1.96。计算统计量值。因为z=2.344>1.96,所以拒绝原假设。对应p值=2(1-F(z)) ,查表得到F(z)在0.9807和0.9817之间,所以p值在0.0193和0.0183之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-F(|z|),直接查表即得F(|z|))。显然p值<0.05,拒绝原假设。
展开阅读全文