1、 安全生产管理知识精讲班第48讲讲义2假设检验2假设检验假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。(1)假设检验的基本思想。假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P001或P30)时,样本均数符合正态分布,故可用U检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。(1)样本均数与总体均数比较的t检验。样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数与已知的某一总体均数0(常为理论值或标准值)有无差别。如根据大量调查,已知健康成
2、年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为742次分,标准差为60次分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下:1)建立假设h0:=o=72次/分,H1:卢0,检验水准为单侧005。2)计算统计量。进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。3)确定概率,作出判断。以自由度v(样本含量n减1)查t界值表,0025P0或d0,即差值的总体均数
3、不为“0”,检验水准为005。 2)计算统计量。进行配对设计t检验时,值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标准误为差值标准差除以样本含量算术平方根的商。 3)确定概率,作出判断。以自由度v(对子数减1)查f界值表,若P=005,则还不能拒绝Ho。 (3)成组设计两样本均数比较的,检验。成组设计两样本均数比较的t检验又称成组比较或完全随机设计的t检验,其目的是推断两个样本分别代表的总体均数是否相等。其检验过程与上述两种;检验也没有大的差别,只是假设的表达和t值的计算公式不同。 两样本均数比较的,检验,其假设一般为:Ho:1=2,即两样本来自的总体均数相等,H1:12或12,即
4、两样本来自的总体均数不相等,检验水准为005。 计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误。 应注意的是当样本含量n较大时(如大于100时)可用“检验代替,检验,此时“值的汁算公式较,值的计算公式要简单的多,(4)t检验的应用条件和注意事项,两个小样本均数比较的,检验有以下应用条件: 1)两样本来白的总体均符合正态分布。 2)两样本来白的总体方差齐。 故在进行两小样本均数比较的f检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“1”。若接近“1”,则可认为两样本代表的总体方差齐。
5、判断两样本来白的总体是否符合正态分布,可用正态性检验的方法。 若两样本来白的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行,检验,对其他资料可用f,检验或秩和检验进行分析。(二)计数资料的统计分析 计数资料可采用的分析方法有相对数计算、二项分布、x2检验,下面以x2检验为例进行介绍, 1x2检验 卡方检验是用途很广的一种假设检验方法,这里主要介绍它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 (1)卡方检验基本思想。在分类资料统计分析中常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下
6、的发癌率如表10-3 问两组发癌率有无差别?表10-3 两组大白鼠在不同致癌作用下的发痛率 处理组 发癌数 未发癌数 合计 发癌率 甲组 52 19 71 7324 乙组 39 3 42 9286 合计 91 22 113 8033 52,19;39,3是表10-3中最基本的数据,因此表10-3资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数了差值平方与理论频数之比的累计和。每个格子中的理论频数了是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71x91113=5718,故卡方值越大,说明实际频数与理论频数的差
7、别越明显,两组发癌率不同的可能性越大。 (2)四格表资料的卡方检验。四格表资料的卡方检验用于进行两个率或两个构成比的比较。 1)专用公式。若四格表资料四个格子的频数分别为o,b,c,d,则四格表资料卡方检验的卡方值=(adbc)2xn(a+b)(c+d)(a+c)(b+d),自由度v=(行数1)(列数1)。 2)应用条件。要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率, (3)行x列表资料的卡方检验 行x列表资料的卡方检验用于多个率或多个构成比的比较。 1)专用公式。r行c列表资料
8、卡方检验的卡方阵n(A11nlnl+A12nih2+.+Arcnrnc)-l 2)应用条件。要求每个格子中的理论频数了均大于5或1T5的格子数不超过总格子数的15。当有了1或1T5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行x列表资料卡方检验的应用条件。而多个率的两两比较可采用行x列表分割的办法。 (4)列联表资料的卡方检验。同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。 只xC列联表的卡方检验。只xC列联表的卡方检验用于RxC列联表的相关分析卡方值的计算和检验过程与行x列表资料的卡方检验相同。 2X2列联表的卡方检验: 2x2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值:(ad-bc)2n(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值:(1b-cl-1)2(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。 列联表卡方检验应用中的注意事项同及XC表的卡方检验相同。小结:本讲讲述了“统计基础”和“职业卫生统计”的有关内容。要求重点学习:统计的原理和方法;常用统计图表的编制;职业危害统计指标等内容。