1、第五章 假设检验 参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证,从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 本章的目的与要求 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概念;明确在假设检验中可能犯的两种错误,以及这两种错误之间
2、的联系;熟练掌握总体均值和总体成数的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。本章主要内容(计划学时2 ) 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验 3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验学习重点 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验;学习难点 一、假设检验的基本思路与有关概念;二、两类错误的理解及其关系; 第一节 统计检验的基本概念 一、假设检验概述 假
3、设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其为“实际不可能事件”。 二、假设检验的基本概念 (一)原假设与对立假设 1、原假设:用“ H0:”表示(也称“零假设”、“虚无假设” ) 这是研究者对总体参数事先
4、提出的假设。通常以总体没有发生显著变化为原假设。 2、对立假设:用“H1:”表示 对立假设也称“备择假设” 这是与原假设完全对立的、矛盾的假设,假设总体发生了显著的变化。 (二)显著性水平与显著性差异 1、显著性水平: 在统计检验中,判断假设是否合理,是根据一定的标准来确定的,这个标准是在检验之前由研究者事先主观选定的一个小概率值,用表示.这个就是显著性水平。 常用的有 0.1、0.05或 0.01等 2、显著性差异: 如果统计量和假设的参数值存在差距,有两种可能: (1)差距不是很大(即不在小概率范围内出现),即可认为总体没发生显著变化。可接受原假设。 (2)差距很大(即出现在小概率范围内)
5、,即可认为总体发生了显著变化。说明存在着显著性差异,故拒绝原假设。 (三)双侧检验与单侧检验 1、双侧检验(双尾检验): 双侧检验要求同时注意估计值偏高和偏低的倾向,这时,差距不分正负, 给出的显著水平平分在两侧。 接受域 拒绝域 拒绝域 临界点 临界点 2、单侧检验(单尾检验):(有左单侧和右单侧两种) 单侧检验只注意估计值是否偏高(或偏低),它是单方向的,给出的显著性水平集中在同一侧。偏高时,差距为正,为右单侧检验;偏低时,差距为负,为左单侧检验。 (四)两种类型的错误 1、第一类错误 以真为假 此类错误是将原属正确的 H0:错当成不正确的而给予否定了。统计学中称这种错误为错误,属第一类错
6、误,也叫做“弃真错误”。 2、第二类错误 以假为真 此类错误是将原属不正确的 H0:错当成正确的而给予肯定了。统计学中称这种错误为错误,属第二类错误,也叫做“存伪错误”。 在统计检验中,必须做出否定H0:或肯定H0:的抉择,因此,不可避免地可能犯错误或错误。如果减小错误,势必增加犯错误的可能性;而若为了减小错误,错误必然增大。所以,要同时减小犯两类错误的概率,就应增大样本容量。此外,取多大的值,也应取决于所要研究的问题的性质。 (五)拒绝域、接受域和临界值 1、拒绝域:计算结果表明总体发生了显著变化,而没有理由不拒绝原假设的区域。 2、接受域:计算结果表明总体没发生显著变化,从而接受原假设的区
7、域。 3、临界值(临界点):拒绝域与接受域的界限。表示在给定一个显著水平的前提下,假定总体发生显著变化的数值界限。 三、检验中决定使用的概率分布(以平均数的检验为例) 假设检验中使用正态(Z)分布或t 分布的条件条 件总 体 2 已 知总 体 2 未 知大 样 本( n 大于 30 )正态分布( Z 值表)正态分布( Z 值表)小 样 本(总体为正态或近似正态)正态分布( Z 值表)t 分布( t 值表) 四、假设检验的程序 1、提出假设 原假设 H0:(以总体未发生显著变化为原假设) 备择假设 H1:(总体发生显著变化) 2、选择一个显著水平 等于对犯第一类错误的概率给出具体数值,通常显著水
8、平用 0.1、0.05或 0.01等。 3、构造一个检验值(选择 Z或 t 分布) 或 4、作出判断 根据统计量 Z(或 t )的计算结果,看其是落在接受区域或者落在拒绝区域而作出接受或拒绝原假设的决定。第二节 总体参数检验 一、总体平均数的检验 (一)总体标准差已知 1、双侧检验 例52.1 一个生产车轴的工厂,其生产的车轴必须能承受5 600千克/cm2的压力;而如果过分坚硬则务必要增加成本。多年来的经验表明,该厂的车轴硬度标准差是 250 千克/ cm2 。工厂从最近的生产线上抽出100根车轴进行检验,得样本的平均承受压力为5 570千克/cm2。试用 0.05的显著水平,检验这条生产线
9、上的车轴是否符合要求? (总体标准差已知,样本容量为100根车轴,故选择正态分布) 已知: n100根 250千克/cm2 = 0.05 5600千克/cm2 5570千克/cm2 解:(过硬过软均会带来不利影响,故选择双侧检验)(图见下页) 建立假设: H0:5600千克/cm2 H1:5600千克/cm2 构建统计量: 1.2 根据 = 0.05,查Z值表得临界值:Z/21.96 计算结果:| Z | | t/2 | ,样本平均数落在拒绝区域,所以拒绝原假设,说明该日生产不正常。产品显著过厚。 1.8830.0050.0092 接受域 1.833 0 1.833 2.8 或 0.1408
10、0.15 0.1592 2、单侧检验 例52.4 某地水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取这种元素过少,脑功能可能受影响。为此心理学家采用某种智力测验方法,对该地区随机抽取的26名儿童进行智力测验,测得平均分是94分(正常一般为100分),标准差为15分。问该地区儿童的智力水平是否明显低于一般水平?(显著水平为5) (总体标准差未知,用样本的代替;样本容量为26,属小样本,故选择 t分布) 已知: n25 Sx15分 = 0.05 100分 94分 (检验智力是否明显偏低,故用左单侧检验) 建立假设: H0:100分 H1:100分 构建统计量: 2 根据 = 0.05,
11、自由度为26125,查 t 值表得临界值:t1.708 计算结果:| t | | t | ,样本平均数落在拒绝区域,所以拒绝原假设,显然,该地区儿童的智力明显低于一般水平。 1.70835.124 接受域 0.05 2 1.708 或 94.876 100 二、总体成数的检验 1、双侧检验 例52.5 某企业生产某产品的一级品率总是稳定在80左右。经选用新材料后,企业在其生产的该产品中随机抽取了 400件进行检查,有332件一级品。试用5的显著水平,检验该产品的一级品率是否发生显著的变化? (每件产品要么一级品或要么非一级品,所以是属性总体的成数问题;样本容量为200件,大样本,故选择成数的正
12、态分布) 已知: n200件 p20.80.2 = 0.05 P80% p332/400 = 83% (采用新材料,可能使一级品增加也可能使一级品减少,所以采用双侧检验) 建立假设: 1.960.020.0392 H0: P0.8 H1: P 0.8 接受域 1.5 1.96 0 1.96 或 0.7608 0.80 0.8392 构建统计量: 1.5 根据 = 0.05,查Z值表得临界值:Z/21.96 计算结果:| Z | | Z/2 | ,样本成数落在接受区域,所以接受原假设。说明采用新材料后,一级品并未发生显著变化。 2、单侧检验 例52.6 某小学六年级学生的近视率达40%,经坚持做
13、了一段时期的眼保健操后,从中抽取了60名学生进行检查,仍有21名学生存在着不同程度的近视状况,请以5%的显著性水平检验眼保健操的锻炼效果。 (每位学生要么近视要么不近视,所以是属性总体的成数问题;样本容量为60人,大样本,故选择成数的正态分布) 已知: n60人 p20.40.6 = 0.05 P40% p21/60 = 35% (做眼保健操就是要降低近视率,所以采用左单侧检验) 建立假设: H0: P 0.4 H1: P 0.4 构建统计量: 0.791 根据 = 0.05,查Z值表得临界值:Z1.645 计算结果:| Z | | Z | ,样本成数落在接受区域,所以接受原假设。说明做眼保健
14、操后,近视率并没有明显降低。 1.6450.06320.104 接受域 0.05 0.791 1.645 0 或 0.296 0.40 三、总体方差的检验 主要是检验事物的变异程度是否发生显著变化。 总体方差检验的统计量( Z与 t 已不适合): 则 x2 服从自由度 df n1 的 x2分布。 1、单侧检验 (1)右单侧检验 例52.7 机械厂生产某型号螺栓,正常生产的螺栓其口径服从均值为、方差236 的正态分布。现在从新设备生产的批量螺栓中随机抽取10只,实测得样本方差为42 ,试以5的显著水平检验总体方差是否显著提高。 (检验总体方差,用x2检验量,且是否显著提高,故选择右单侧) 已知:
15、 n10 S242 236 = 0.05 建立假设: H0:2 36 H1:2 36 构建统计量: 10.5 根据 = 0.05,自由度 df 9,查 x2值表得临界值:x20.0516.919 作出结论:由于x210.5 x20.05 16.919,所以不能拒绝原假设,不能认为新设备生产的螺栓,其方差有显著增大。 右单侧检验 接受域 10.5 16.919 x2 (2)左单侧检验 例52.8 某机器加工某型号钢管的长度服从标准差2.4公分的正态分布。经技术调整后,抽取出新生产的25根钢管,测得样本标准差 S2.1公分,试以1的显著水平检验该机器生产的钢管长度的变异性是否已显著减小。 (检验总
16、体方差,用x2检验量,是否显著减小,故选择左单侧) 已知:n25 S2.1公分 2.4公分 = 0.01 建立假设: H0:2 2.4 2 5.76 H1:2 5.76 构建统计量: 18.375 根据=0.01, 自由度 df 24,查 x2值表得临界值:x20.9910.856 作出结论:由于x218.375 x20.99 10.856,所以不能拒绝原假设,即经技术调整后生产的钢管,其长度方差没有显著缩小。 左单侧检验 接受域 10.856 18.375 x2 2、双侧检验 例52.9 炮弹火药装配车间,规定炮弹的火药重量服从标准差20克的正态分布。现在从生产线中随机抽取16枚炮弹,测得样
17、本标准差S24克,试以2的显著水平检查炮弹的火药重量是否有显著的变异。 (检验总体方差,用x2检验量,是否有显著变异,选择双侧检验) 已知:n16 S24克 20克 = 0.02 建立假设: H0:2 202400 H1:2 400 构建统计量: 21.6 根据 = 0.02(双侧),将值平均分成两部分,右单侧利用查x2表,左单侧则利用1查 x2表。所以,自由度df15,查 x2值表得临界值:x20.995.229 与x20.0130.578 作出结论:由于x20.0130.578 x221.6x20.995.229,所以接受原假设,说明炮弹火药方差没有发生异常的变动。 双侧检验 接受域 0.01 0.01 5.229 21.6 30.578 x2 应完成的作业(书后P168) 一、P168P171的选择、判断与填空题要求全做(可直接做在习题上) 二、做好复习工作的同时,可通过P172的第1、2、3、5、8等简答题加以思考本章的主要内容。 三、计算题选做第1、2、3、4、5、6题(要求书面完成)