1、第七章假设检验 第七章 假设检验学习目的 假设检验包括参数检验与非参数检验,是一种最能体现统计推断思想和特点的方法。通过本章学习,要求:1.掌握统计检验的基本原理,理解该检验的规则及犯两类错误的性质;2.熟练掌握总体均值、总体成数及总体方差指标的各种检验方法,包括:检验、检验和值检验;3.掌握检验、符号检验、秩和检验及游程检验四种基本的非参数检验方法。课程内容要点第一节 假设检验的基本原理一、假设检验的基本原理“小概率原理”:小概率事件在一次试验中几乎是不会发生的。事先所做的假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总体参数没有发生变化的基础之上的。
2、备选假设是原假设的对立,是在否认原假设之后所要接受的,通常这是我们真正感兴趣的一个判断。二、假设检验的规则与两类错误1、假设检验的规则假设检验的步骤:(1)首先根据实际应用问题确定合适的原假设和备选假设;(2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;(3)给定检验的显著性水平。在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值;(4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正是统计量取
3、值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧检验或双侧检验。双侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于这些双侧、左、右单侧检验,我们要结合备选假设来考虑。在检验规则中,我们经常碰到两种重要的检验方法:检验与检验。值检验的原理:给出原假设后,在假定原假设正确的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算的检验统计量的数值的概率,这便是值;而后将此概率值跟事先给出的显著性水平值进行比较。如果该值小于,否定原假设,取对应的备选假设。如果
4、该值大于,我们不就能否定原假设。2、两类错误当原假设实际为真,但我们却依据样本信息,做出拒绝的错误结论时,称为“弃真”错误;当原假设实际为假,而我们却错误接受时,称为“纳伪”错误。通常记显著性水平为犯“弃真”错误的可能性大小,为犯“纳伪”错误的可能性大小。由于两类错误是一对矛盾,在其他条件不变得情况下,减少犯“弃真”错误的可能性大小(),势必增大犯“纳伪”错误的可能性大小(),也就是说,的大小和显著性水平的大小成相反方向变化。三、检验功效可以用来表明所做假设检验工作好坏的一个指标,我们称之为检验功效。它的数值表明我们做出正确决策的概率为。解决增强检验功效的唯一办法只有增大样本容量,这样既能保证
5、满足取得较小的,又能取得较小的值。第二节 总体参数假设检验一、总体均值的假设检验1、总体方差已知对于双侧检验,建立的假设为:对于左(右)单侧检验来说,建立的假设为: 检验统计量 原假设的拒绝域为:样本统计量的值满足:(双侧检验);(左单侧检验);(右单侧检验)。当z值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。2、总体方差未知对于双侧检验,建立的假设为:对于左(右)单侧检验来说,建立的假设为:检验统计量,其中为样本标准差。原假设的拒绝域为:样本统计量的值满足(双侧检验);(左单侧检验);(右单侧检验)。当值落入拒绝域,就拒绝原假设,否则不能拒绝原假设。二、两个总体均值之差的检验1、
6、两总体方差已知 双侧检验原假设为:,备选假设为 检验统计量:。 该检验的否定域:。反之不能拒绝原假设。 左单侧检验原假设与双侧一样,备选假设为检验的否定域为:计算的样本统计量满足:(3) 右单侧检验原假设与双侧一样,备选假设为检验的否定域为:计算的样本统计量满足:2、两总体方差未知但相等双、单侧检验的原假设都相同,均为。只是在双侧检验时,备选假设;在左单侧检验时,备选假设为;在右单侧检验时,备选假设为。检验统计量:。对于双侧检验,原假设的拒绝域为:。反之就不能拒绝原假设。对于左、右单侧检验,左单侧检验拒绝原假设的范围是:。右单侧检验拒绝原假设的范围为:。三、总体成数的假设检验1、单样本成数检验
7、建立假设:检验统计量。将样本统计量与临界值进行比较,若,则否定原假设;反之则不能拒绝原假设。当然,如果对应的原假设是单边的,即为。对应的临界值应该是,其余的计算和判断规则如上面所述。2、两个样本总体成数差的检验检验统计量。若建立的原假设为:,相应的临界值为;而如果建立的原假设为:,相应的临界值为。能否拒绝原假设的判断规则如前面所述。四、正态总体方差的假设检验原假设为,备选假设:检验统计量 五、两个正态总体方差比的检验1、两总体均值已知检验统计量,其中 ;。原假设为:。对于双侧检验,备选假设为:,若则拒绝原假设,反之,则不能拒绝原假设。对于左单侧检验: 备选假设:,拒绝域为样本统计量。对于右单侧
8、检验:备选假设:,拒绝域为样本统计量。2、两样本均值未知建立的原假设为:,检验统计量,其中和。对于双侧检验:备选假设:,当样本统计量或时,我们就拒绝原假设,反之不能拒绝原假设。对于左单侧检验:建立的备选假设:,供判断的临界值为,拒绝域为样本统计量。对于右单侧检验:建立的备选假设:,供判断的临界值为,拒绝域为样本统计量。第三节 非参数检验一、非参数检验概述实际问题中,可能无法获知或者是不一定很了解总体的分布类型,而只是通过样本来检验关于总体分布的假设。这种检验方法称为非参数检验。非参数检验与传统的参数检验比较有一些优缺点;对检验的限制更少,更加避免先见偏差,具有较好的稳健性;可以在更少样本资料要
9、求的情况下进行,在一定程度上弥补有些实际中样本资料不足等的缺陷;可以弥补上述参数检验中碰到的无法运用的属性资料问题,然而,同时也就可能损失了其中所包含的另外信息。二、检验检验是利用分布的原理,通过对样本数据进行分析来对样本所属的总体情况进行判断的一种检验方法。1分布拟合检验原假设为:。其中为总体的分布函数,是某个事先假定的总体分布函数。检验统计量:。其中为各个样本区间内的实际频数,为落在各个区间的理论概率值,为待估计的参数个数。拒绝原假设的值域:,如果样本统计量大于,那么就可以拒绝原假设,否则不能拒绝原假设。2独立性检验该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变
10、量之间是相互独立的。我们这里的变量主要是定类、定序的资料。为了分析变量之间的关联性,我们需要将资料整理成列联表的形式。列联表是多行多列纵横交错所形成的一个表体。三、符号检验1单样本的符合检验在单样本的情况下,符号检验适用于检验总体中位数是否在某一指定的位置。中位数检验的基本原理是,假设总体中位数的真值,然后在实际抽取的容量为的样本中,将每个观测值均减去,并只记录其差值的符合,即为。若,就略去不计。接着分别计算“”的个数(用表示)和“”的个数(用表示)。理论上,当中位数为真时,得到的正负号个数应该接近相等,即。若从样本中得到的和相差较远,那么就有理由拒绝。该检验中所用的判别标准是由二项分布临界值
11、提供的,在大样本下,可由正态分布来逼近。2配对样本的符号检验原假设为:,备选假设:。设配对样本、序列中,的个数为,的个数为,如果,我们就忽略,不予考虑。所以有。取,在显著水平下,有:。临界值是根据二项分布的原理来求得的,也可以从编好的临界值表查得。如果,我们就拒绝原假设,否则就不能拒绝原假设。3非配对样本的符号检验假定两样本,的容量分别为,。原假设仍为:。可以将资料转化成列联表的形式,利用检验来进行分析。具体的方法为:将所抽取的两组样本资料混和在一起,将此个观测值按照递增或递减的顺序进行排序,求得中位数。将两样本中大于或小于中位数的个数(频数)分别以列联表的形式列出。这样我们就可利用检验。四、
12、秩和检验秩和检验是一种用样本秩代替样本值的检验方法,用该法可以检验两个总体的分布函数是否相等的问题。所谓秩,就是样本观测值在序列中的排序号。建立假设:。分别从这两个总体、抽取、个样本,。不失一般性,我们假定。将两组样本混合,并按小到大排序,每个样本对应的序号称为该样本的秩。计算取自总体所对应的样本的秩和,为秩和检验的统计量。当的值超过临界值时,就可以拒绝两总体的分布没有显著性差异的原假设。对于小样本(、都未超过10),临界值的数值可以通过查找秩和检验值表,求得上下限。对于大样本(、都超过10),此时变量近似服从正态分布,该分布的均值、标准差分别为:,此时,可以将标准化为统计量,通过查找正态分布
13、表来确定临界值,。五、游程检验游程检验用来检验样本是否为随机地取自于总体。所谓游程,就是在一个序列中出现某一类字符片断,对应的每一同类游程出现的次数,则称为游程数。不同游程数的总和,称为总游程数记为。当序列字符个数均较小时(一般小于20),我们可以直接从游程表得出临界值。在大样本场合中(单个字符数大于20),总游程数近似服从正态分布,因而可以用正态分布统计量来确定临界值。的均值以及方差为:,统计量:,服从标准正态分布。六、等级相关对于要考察属于定序尺度描述的类型数据的两配对序列之间的相关关系,我们可以应用斯皮尔曼提出的公式来计量它们之间的相关关系,此关系系数称为斯皮尔曼秩相关系数(),即:,其
14、中,为样本容量,为第个配对观测值之间各自秩序差。秩序就是该观测值在所在序列中,按小到大的顺序排列时对应的序号。原假设为:。当样本容量较小时,一般情况为,我们可以直接从斯皮尔曼相关关系检验的临界值表中查得临界值,再将其与计算的样本相关关系比较,来判断拒绝或接受。当,就拒绝原假设,反之不能拒绝原假设。当样本容量较大时,我们可以应用下列的统计量来进行检验。或者 ,此时的检验方法转化为参数检验思路。. 考核知识点与考核要求一、假设检验的基本原理(一)识记:1假设检验的含义:原假设和备选假设;2双侧检验和单侧检验的概念;3“弃真”错误和“纳伪”错误的概念;4假设检验的两类错误。(二)领会:1小概率原理;
15、2两类错误之间的关系;3检验功效。二、总体参数假设检验(一)识记:1检验步骤;2检验统计量;3检验统计量。(二)领会:双侧检验与单侧检验的确定。(三)应用:1总体均值的假设检验;2总体成数的假设检验;3总体方差的假设检验。三、非参数检验(一)识记:1检验概念;2符号检验概念;3秩和检验概念;4游程检验概念;5等级相关概念。(二)领会:1检验的优点;2符号检验与秩和检验的区别。(三)应用:1分布拟合检验及其应用和独立性检验及其应用;2单样本的符号检验及其应用、配对样本的符号检验及其应用和非配对样本的符号检验及其应用;3秩和检验的应用;4游程检验的应用;5斯皮尔曼等级相关系数及其检验。.习题详解
16、一、选择题1.B 2.A 3.D 4.A 5.C 6.D 7.D 8.C 9.AB 10.BCDE 11.ABE 12.ACE二、计算题1解:此题为双侧检验问题。(1)建立假设:(2)确定检验统计量及其分布:检验统计量为:。(3)确定临界值:双侧检验的临界值为,由于给定的显著性水平,则。查正态分布表得到,即为临界值。(4)计算样本统计量并判断:根据样本资料计算样本统计量:,由于,故不能拒绝原假设,说明所估的高度是正确的。2解:此题为双侧检验问题。(1)建立假设:(2)确定临界值:由于是双侧检验,所以应该有两个临界值:上临界值、下临界值。又因为总体的标准差未知,需要用样本标准差来代替,因此,统计
17、量服从的是自由度的分布而非正态分布,此题中,则自由度。查分布表得到,上临界值,由于对称性,下临界值。(3)计算样本统计量:在计算统计量之前需要计算样本均值和样本标准差。样本均值:,样本标准差:千克,检验的样本统计量:。(4)判断:根据样本计算的统计量,所以不能拒绝原假设,即在显著性水平下认为该乡早稻田产平均为120千克。3解:此题属于在两总体方差未知(但是假定两方差相等)下,检验两组均值是否有差异的问题。依题意有:。(1)建立假设:(2)构造检验统计量为:其中由于相等的标准差未知,我们用来估计标准差(3)确定临界值:从t分布表中查得临界值。(4)计算样本统计量及判断:将样本资料代入检验统计量得
18、到:,因而有,拒绝原假设,该昆虫两世代卵块卵粒数差异显著。4解:此题属于在两总体方差未知(但是假定两方差相等)下,检验两组均值是否有差异的问题。依题意有:(1)建立假设:(2)构造检验统计量为:(3)确定临界值:从t分布表中查得临界值。(4)计算样本统计量及判断:将样本资料代入检验统计量得:,因而有,拒绝原假设,两台机床的性能不一样。5解:样本的不合格率。(1)经分析该小题属于双侧检验。建立假设:检验统计量:。确定临界值:在0.05的显著性水平下,从标准正态分布表中可以查得临界值为。计算样本统计量及判断:样本统计量。,因而,我们不能拒绝原假设,即新产品的质量与前几批一样好。(2)该小题属于左单
19、侧检验。 建立假设: 检验统计量:与上小题一样,此处略。 确定临界值:在0.05的显著性水平下,从标准正态分布表中可以查得左侧临界值为 计算样本统计量及判断:样本统计量同上小题一样,。由于,不能拒绝原假设,即新产品的质量不比前几批差。6解:根据题设,已知。(1)建立假设:根据样本计算出的检验统计量值:,在0.05,从标准正态分布表查得临界值,则不能拒绝原假设,即两个区对该候选人的支持率无差异。 (2)建立假设: 检验统计量值与上小题一样:。 在,右侧临界值,则拒绝原假设,即该候选人在A区没有更受拥护。7解:可以得到样本标准差,该假设检验过程如下:(1)建立假设:(2)检验统计量:。(3)临界值
20、:从分布表可得到临界值。(4)计算样本统计量并判断:。所以,我们拒绝原假设,该批零件不能满足改装置的要求。8解:依题意有:。(1)建立假设:(2)检验统计量:。(3)临界值:从F分布表中查得临界值为:在,;在 ,。(4)样本统计量的计算及判断:。;。所以无论在或,我们都不能拒绝原假设,两种溶液浓度的方差相同。9解:(1)可以得到施肥后产量的样本标准差,施肥前产量的样本标准差,且。 建立假设:。 检验统计量:。 临界值:从F分布表中查得临界值为:。 样本统计量的计算及判断:,所以我们不能拒绝原假设,施肥前后农作物产量方差无显著变化。(2)可以得到施肥后产量的样本均值,施肥前产量的样本均值。 建立
21、假设:检验统计量: 临界值:从分布表中查得临界值。 样本统计量的计算及判断:,所以,我们拒绝原假设,施肥前后农作物产量有显著变化。10解:记数的小数中各数字出现的次数为,其分布未知,依题意,我们可以对其分布建立假设,即:服从均匀分布,也即的分布满足; :不服从均匀分布。在原假设下,我们可以得知,各个数字出现的期望频数均为: (次)。则查表得到临界值为,。因而,我们不能拒绝原假设,故认为数的小数中各数字以等概率分布出现。11解:依题意,我们可以将数据整理成列联表,如下表:病情与用药情况的列联表病情用药情况好转没好转合计比重有用药15(14)105(106)1200.444没用药16(17)134
22、(133)1500.556合计31239270比重0.1150.885_1应用检验:从分布表可得到临界值为,所以我们不能否定原假设,也就是说病情与用药情况不显著,即该药物无效果。12解:(1)建立假设:(2)将各个数据均减去原假设所设定的中位数55,并把各个正负号记录下来,如果数据与中位数一致,则略去,得到:,因此。(3)计算临界值:检验水平为,由于是双侧检验,每侧为。查二项分布临界值表,当时,临界值为7。(4)这样进行判断:由于,我们不能拒绝原假设,认为该批产品是合格的。13解:首先提出假设,即:广告对商品的促销没有作用;:广告对商品的促销有作用。广告前后商品销售之间的差值的符号如下表:商店
23、123456789101112131415差值的符号000从而有:。在时,从二项分布表可以查得临界值为10,由于,所以不能拒绝原假设,即认为广告对商品的促销没有作用。14解:(1)此小题属于在两总体方差未知(但是假定两方差相等)下,检验两组均值是否有差异的问题。可以求得第一组的样本均值,样本标准差;第二组的样本均值,样本标准差。且。 建立假设:检验统计量:。 临界值:从分布表中查得临界值。 样本统计量的计算及判断:。所以我们可以拒绝原假设,即两种鸡冠重量分布有差异。(2)建立假设:两种鸡冠重量分布无差异,:两种鸡冠重量分布有差异。将两组样本混和并按照由小到大的顺序排序,得到各组对应每个数值的排
24、序号分别为(9.5,27,22,28,26,24.5,21,14.5,6.5,19,24.5,1,20,23)和(16,8,9.5,3,2,11,5,17,12.5,4,18,12.5,6.5,14.5),两组的样本单位数相等,可以任取第一或第二组作为取自总体1的样本,该题以第一组取自总体1,计算秩和9.52722282624.52114.56.51924.512023266.5临界值:给定显著性水平,由于是大样本检验,且是双侧检验,查正态分布表,临界值。检验统计量计算及判断:,所以拒绝原假设,即两鸡冠重量分布有差异。15解:给出的股价涨跌情况有两种:“涨”、“跌”。我们可以得到对应的游程数为
25、:“涨”的游程数为7,“跌”的游程数为6,所以总游程。由于所给的样本容量,总游程数近似服从正态分布。可查正态分布表,临界值为。,统计量:。因而我们可以认为该公司当月的股价是随机的。16解:(1)设立假设:(2)给定显著性水平,自由度,查分布表得左临界值。(3)根据样本信息,计算统计量的实际值。(4)检验判断。由于统计量,即18.37510.856,所以我们没有理由拒绝原假设,即认为钢管长度的方差没有显著的缩小。17解:(1)设立假设。原假设,表示两种灯泡使用寿命没有差异。备选假设,用意相反。(2)将样本混合按顺序排列并计算秩和。秩号: 1 2 3.5 3.5 5.5 5.5 7 8 9 10
26、11数据:1 410 1 415 1 420 1 420 1 425 1 425 1 445 1 450 1 465 1 470 1 480 数据下加一横线的为乙种灯泡。其中数据1 420,1 425均有两个,所以1 420的秩数为(34)/23.5,1 425的秩数为(5+6)/2=5.5。由于乙种灯泡样本容量少于甲种灯泡样本容量,所以指定乙种灯泡来自总体1,(),甲种灯泡来自总体2,()。乙种灯泡的秩和。 (3)给定下查秩和检验临界值表,由于属于双侧检验,且,查表得临界值,。 (4)检验判断。由于,即1920,落入拒绝区域,所以拒绝原假设,而认为两种规格灯丝的灯泡寿命的分布是不同的。108 / 34108
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100