1、 安全生产管理知识精讲班第48讲讲义 2.假设检验 2.假设检验 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。 (1)假设检验的基本思想。假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设Ho),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。 (2)假设检验的基本步
2、骤。第一步:提出检验假设(又称无效假设)和备择假设。 Ho-样本与总体或样本与样本间的差异是由抽样误差引起的。 H1:样本与总体或样本与样本间存在本质差异。 预先设定的检验水准为O.05。 第二步:选定统计方法,计算出统计量的大小。根据资料的类型和特点,可分别选用t检验,U检验,秩和检验和卡方检验等。 第三步:根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P值小于预先设定的检验水准,则H0成立的可能性小,即拒绝H0,若P值不小于预先设定的检验水准,则H0成立的可能性还不小,还不能拒绝Ho。P值的大小一般可通过查阅相应的界值表得到。 (3)进行假设检验应注意的
3、问题来源:建设工程教育网 1)做假设检验之前,应注意资料本身是否有可比性。 2)当差别有统计学意义时应注意这样的差别在实际应用中有无意义。 3)根据资料类型和特点选用正确的假设检验方法。 4)根据专业及经验确定是选用单侧检验还是双侧检验。 5)当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的Ho,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生Ⅱ类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。来源:建设工程教育网 6)判断
4、结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。 7)报告结论时应注意说明所用的统计量,检验的单双侧及P值的确切范围。 第二节 职业卫生统计基础 第二节 职业卫生统计基础 一、职业卫生常用统计指标 1.发病(中毒)率 表示在观察期内,可能发生某种疾病(或中毒)的一定人群中新发生该病(中毒)的频率。 计算公式:某病发病率(中毒率)=同期内新发期内新发生例数/观察期内可能发生某病(中毒)的平均人数×100﹪ 在通常情况下,发病率的分母泛指一般平均人口数。 发病率(中毒率)是反映某病(中毒)在人群中发生频率大小的指标,常
5、用于衡量疾病的发生,研究疾病发生的因果关系和评价预防措施的效果。 2.患病率 表示在某时点检查时可能发生某病的一定人群中患有某病的病人总数。 计算公式:某病患病率=检查时发现的患某病病例总数/该时点受检人口数×100﹪ 其中某病病例总数包括新病例和旧病例,凡患该病的一律统计在内。同一人不应同时成为I司一疾病的两个病例。 这一指标最适用于病程较长的疾病的统计研究,用于衡量疾病的存在,反映某病在一定人群中的流行规模或水平。 3.病死率来源:建设工程教育网 在规定的观察时间内,某病患者中因该病而死亡的频率。 计算公式:某病病死率=同期因该病死亡人数/观察期间内某病患者数×100﹪
6、上式分母中患病情况不同,指标的概念也不同。如住院病人的病死率,分母为出院人数。某一地区某病病死率的分母则包括该地区所有患该病的病人。故医院的病死率不能代表地区的病死率。 4.粗死亡率 也称普通死亡率,是指某年平均每千名人口中的死亡数。 计算公式:粗死亡率=同年死亡总数/某年平均人口数×100﹪ 粗死亡率和粗出生率一样,具有资料易获得、计算简单的优点,但其高低受人口年龄构成的影响,故只能粗略地反映人口的死亡水平,不能用来衡量和评价—个国家的卫生文化水平。 二、职业卫生调查设计 (一)调查研究的特点 研究过程中没有人为的施加干预措施,而是客观地观察记录某些现象的现状及其相关特征;在调
7、查中,欲研究的现象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响,这是调查研究区别于实验研究的重要特征;混杂因素的控制常借助于标准化法、分层分析、多因素统计分析等方法;调查研究多采用问卷调查,容易产生误差和偏倚,应特别注意设计技巧和质量控制。来源:建设工程教育网 (二)调查设计的主要用途 调查设计又称为横断面研究或横断面调查或现况研究,用于了解某一特定时间横断面上特定作业场所中职业危害因素或人群职业病的分布情况。 (三)调查设计的基本原则与内容 1.明确调查目的并将其具体化到指标 明确调查目的是调查研究各个环节中最核
8、心的问题。确定调查目的时应注意是要了解总体参数还是研究相关联系。指标要精选,尽量用客观、灵敏、精确的定量指标。 2.确定调查对象和观察单位 根据调查目的确定调查对象,即要确定调查总体及其同质范围,观察单位可为人、物、群体、地区等。 3.确定并选择调查方法来源:建设工程教育网来源:建设工程教育网 根据调查目的和要求确定并选择调查方法,有以下几种: (1)普查(overall stirvey)。对总体中所有的观察单位进行调查,一般用于了解总体在某一特定“时点”上的情况,如年中人口数、时点患病率。在医学领域的适用范围是: ①发病率较高的疾病;②具有灵敏度和特异度较高的检查或诊断方法;③普
9、查方法便于操作、易于接受;④具有实施条件。 (2)抽样调查(sampling SUlwey)。是医学研究中最常用的方法,是通过随机抽样方法从总体中随机抽取一定数量具代表性的观察单位组成的样本进行调查,然后根据样本信息来推断总体特征。 (3)典型调查。亦称案例调查。即对事物进行全面了解的基础上,有目的选择典型的人和单位进行调查。如调查几个卫生先进或后进单位,用于总结经验教训。 4.确定样本含量 参考有关的统计学书籍。 5.确定资料的搜集方式 (1)直接观察法:直接观察、检查、测量。 (2)采访法:调查者直接或间接与被调查者交谈,又分访谈、信访和开调查会三种。 6.确定观察指标
10、结合调查的实际问题,将调查目的转化为具体的调查指标。 (四)常用的抽样方法 1.单纯随机抽样 将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。 优点:操作简单,均数、率及相应的标准误计算简单。 缺点:总体较大时,难以一一编号。 2.系统抽样 又称机械抽样、等距抽样,即先将总体的观察单位按某一顺序号分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等间距,从每一部分各抽取一个观察单位组成样本。 优点:易于理解、简便易行。 缺点:总体有周期或增减趋势时,易产生偏性。 3.整群抽样 总体分群,再随机抽取几个群组成样本,群内全部调查。 优
11、点:便于组织、节省经费。 缺点:抽样误差大于单纯随机抽样。 4.分层抽样 先按对观察指标影响较大的某种特征,将总体分为若干个类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。有按比例分配和最优分配两种方案。 优点:样本代表性好,抽样误差减少。 以上4种基本抽样方法都属单阶段抽样,实际应用中常根据实际情况将整个抽样过程分为若干阶段来进行,称为多阶段抽样。 各种抽样方法的抽样误差一般是:整群抽样≥单 随机抽样≥系统抽样≥分层抽样。 三、职业卫生常用的统计分析方法 三、职业卫生常用的统计分析方法 职业危害资料的统计分析与其他资料一样,应按照资料类型和统
12、计分析方法条件的要求进行。 (一)计量资料的统计分析 计量资料可采用集中趋势和离散趋势指标计算,t检验、u检验、方差分析、秩和检验、相关与回归,下面以常用的t检验和u检验为例进行介绍。 1.t检验和u检验 t检验和u检验就是统计量为t.u的假设检验,两者均是常见的计量资料假设检验方法。当样本含量n较大(如,z>30)时,样本均数符合正态分布,故可用U检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。 (1)样本均数与总体均数比较的t检验。样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数μ与已知
13、的某一总体均数μ0(常为理论值或标准值)有无差别。如根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。 上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下: 1)建立假设 h0:μ=μo=72次/分,H1:μ>卢μ0,检验水准为单侧0.05。 2)计算统计量。进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术
14、平方根的商。 3)确定概率,作出判断。以自由度v(样本含量n减1)查t界值表,0.025
0
15、或μd<0,即差值的总体均数不为“0”,检验水准为0.05。
2)计算统计量。进行配对设计t检验时,值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标准误为差值标准差除以样本含量算术平方根的商。
3)确定概率,作出判断。以自由度v(对子数减1)查f界值表,若P
16、 两样本均数比较的,检验,其假设一般为:Ho:μ1=μ2,即两样本来自的总体均数相等,H1:μ1>μ2或μ1<μ2,即两样本来自的总体均数不相等,检验水准为0.05。 计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误。 应注意的是当样本含量n较大时(如大于100时)可用“检验代替,检验,此时“值的汁算公式较,值的计算公式要简单的多, (4)t检验的应用条件和注意事项,两个小样本均数比较的,检验有以下应用条件: 1)两样本来白的总体均符合正态分布。 2)两样本来白的总体方差齐。 故在进行两小样本均数比较的f检验之前,要用方差齐
17、性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“1”。若接近“1”,则可认为两样本代表的总体方差齐。判断两样本来白的总体是否符合正态分布,可用正态性检验的方法。 若两样本来白的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行,检验,对其他资料可用f,检验或秩和检验进行分析。 (二)计数资料的统计分析 计数资料可采用的分析方法有相对数计算、二项分布、x2检验,下面以x2检验为例进行介绍, 1.x2检验 卡方检验是用途很广的一种假设检验方法,这里主要介绍它在分类资料统
18、计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验 以及分类资料的相关分析等。 (1)卡方检验基本思想。在分类资料统计分析中常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如表10-3 问两组发癌率有无差别? 表10--3 两组大白鼠在不同致癌作用下的发痛率 处理组 发癌数 未发癌数 合计 发癌率% 甲组 52 19 71 73.24 乙组 39 3 42 92.86
19、合计 91 22 113 80.33 52,19;39,3是表10--3中最基本的数据,因此表10--3资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数了差值平方与理论频数之比的累计和。每个格子中的理论频数了是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71x91/113=57.18,故 卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。 (2)四格表资料的卡方检验。四格表资料的卡方检验用于进行两个率或两个构成比的比较。
20、 1)专用公式。若四格表资料四个格子的频数分别为o,b,c,d,则四格表资料卡方检验的卡方值=(ad—bc)2xn/(a+b)(c+d)(a+c)(b+d),自由度v=(行数—1)(列数—1)。 2)应用条件。要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率, (3)行x列表资料的卡方检验 行x列表资料的卡方检验用于多个率或多个构成比的比较。 1)专用公式。r行c列表资料卡方检验的卡方阵n((A11/nlnl+A12/nih2+...+Arc/nr
21、nc)-l
2)应用条件。要求每个格子中的理论频数了均大于5或1 22、的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值:(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值:(1b-cl-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
列联表卡方检验应用中的注意事项同及XC表的卡方检验相同。
小结:本讲讲述了“统计基础”和“职业卫生统计”的有关内容。要求重点学习:统计的原理和方法;常用统计图表的编制;职业危害统计指标等内容。






