1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本
2、样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,根据总体理论分布,从样本的统计数对总体参数作出的推断。,统计推断包括,参数估计和假设检验,假设检验和参数估计,表现结果不同,本质相同,统计推断的含义,内容,在总体理论分布和小概率原理的基础上,通过提出假设、确定显著水平、计算统计数、作出推断等步骤来完成的在一定概率意义上的推断。,类型,两均数间的检验(样本与总体,两样本),两频率间的检验(样本与总体,两样本),多个均数间的检验,多个频率间的检验,方法,u,检验,,t,检验,,F,检验,,x,2,检验等,假设检
3、验,总体参数估计,区间估计和点估计,区间估计:在一定的概率范围内;,点估计:样本统计量估计总体参数,参数估计,例 某地成年男子中抽得,144,人的样本,求得红细胞数均数为,5.378(10,9,/L),标准差为,0.439(10,9,/L),试估计该地成年男子红细胞数的,95%,可信区间。,解:,5.378,1.979,0.439/12,,,即(,5.306,,,5.450,),(2),已知,(,3,),未知,但,n,足够大,四假设检验,(hypothesis test),假设检验(,hypothesis testing,)也称显著性检验,(significance test),。二十世纪二、
4、三十年代,Neyman,和,Pearson,建立了统计假设检验问题的数学模型。,例,根据大量调查,已知健康成年男子脉搏的均数为,72,次,/,分,某医生在一山区随机调查了,25,名健康成年男子,求得脉搏均数为,74.2,次,/,分,标准差为,6.0,次,/,分,能否据此认为该山区成年男子的脉搏均数高于一般人,?,解释,我们当然不能强求脉搏均数恰为,72,次,/,分时,才认为山区成年男子的脉搏均数和一般人一样,因为即使一样由于抽样误差的存在,样本均数未必等于,72,,造成山区健康成年男子的脉搏样本均数与一般人不同的原因有,:,抽样误差,环境因素,的影响,要回答这一问题就是假设检验问题,2,假设,
5、任一个关于总体分布的假设称统计假设,简称假设。,假设有两种:,检验假设,(,无效假设、原假设,),记,H,0,备择假设,记,H,1,如上例,,H,0,:,=72 H,1,:,72,例,为比较,2,种安眠药的疗效,检验假设可为:,H,0,:,2,种安眠药的平均睡眠时间相同,即,1,=,2,H,1,:,2,种安眠药的平均睡眠时间不同,即,1,2,单、双侧检验,3.,假设检验的步骤,(1),确定假设和检验水平,(2),计算检验统计量,(3),查表确定,p,值,作出统计推断,4,形式,样本均数与总体均数比较的,t,检验,比较的目的是样本所代表的未知总体均数,与已知的总体均数,0,有无差别。,例,(,1
6、确定假设和检验水平,H,0,:,=72 H,1,:,72,=0.05,单侧检验,(,2,)计算检验统计量,=24,(,3,)查表确定,p,值,作出统计推断,查表得,0.05p0.025,拒绝,H,0,认为有显著性差异,统计思想,:,假定,H,0,成立,查表得到,p=0.05(,小概率,),的界值为,1.711,根据小概率事件原理,t1.711,都是不可能发生的,而现在发生了,所以拒绝,H,0,配对设计的差值均数与总体均数,0,比较的,t,检验,检验统计量,=n-1,适用于:(,A,)自身配对,同一受试对象处理前后的比较,推断该处理有无作用,如,例 用克矽平雾化吸入治疗矽肺患者,7,人,得到
7、治疗前后的血清粘蛋白(,mg/L,),能否认为治疗会引起患者血清粘蛋白的变化?,H,0,:,d,=0 H,1,:,d,0 =0.05,双侧检验,患者号,1,2,3,4,5,6,7,治疗前,65,73,73,30,73,56,73,治疗后,34,36,37,26,43,37,50,差值,31,37,36,4,30,19,23,(,B,)同源配对,同一受试对象分别给予两种处理,推断两种处理的效果有无差别,例 尿铅测定长期以来用湿式热消化法,-,双硫腙法,后改用硝酸,-,高锰酸钾冷消化法,说明两法测得结果有无差别?,患者号,1,2,3,4,5,6,冷消化法,2.41,12.07,2.90,1.64,
8、2.75,1.06,热消化法,2.80,11.24,3.04,1.83,1.88,1.45,差值,d,-0.39,0.83,-0.14,-0.19,0.87,-0.39,检验统计量,=n-1,(C),按性质相近配对,对同对的两个受试对象分别给予两种处理。,例 某单位研究饮食中缺乏维生素,E,与肝中维生素,A,含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共,8,对,并将每对中的两头动物随机分到正常饲料组和维生素,E,缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素,A,的含量,问不同饲料的大白鼠肝中维生素含量有无差别?,大白鼠对号,1,2,3,4,5,6,7,8,正常饲料组
9、3500,2000,3000,3950,3800,3750,3450,3050,维生素,E,缺乏组,2450,2400,1800,3200,3250,2700,2500,1750,检验统计量,=n-1,成组设计的两均数比较的,t,检验,有些研究的设计不能自身配对,也不便配对,只能将独立的两组均数作比较,如手术组与非手术组、新药治疗组与原用药治疗组。有的试验要把动物杀死后才能获得所需数据,除非事先作好了配对设计,一般只能作两组间的比较,两组例数可以不等,这是配对设计所不能做到的。,从两总体中分别抽取容量为,n,1,、,n,2,的样本,比较两总体均数,1,和,2,有无差别。,检验统计量,=n,1
10、n,2,-2,例 某克山病区测得,11,例克山病患者与,13,名健康人的血磷值(,mmol/L,),问该地急性克山病患者与健康人的血磷值是否不同?,患者,X,1,:,0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11,健康人,X,2,:,0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87,H,0,:,1,=,2,H,1,:,1,2,=0.05,双侧检验,成组设计的两大样本均数比较的,u,检验,=n,1,+n,2,-2,例 测得,30,名以上的冠心病患者,1
11、42,人的血清胆固醇,另以,506,名年龄相仿的非患者作比较,结果如下,试分析冠心病患者的血清胆固醇是否较高?,n,s,冠心病患者,142,223.6,45.8,非患者,506,180.6,34.2,=n,1,+n,2,-2,5,t,检验和,u,检验的条件,t,检验:要求样本来自正态分布,且两均数比较时还要求两总体方差相等。,u,检验:,n,较大,。,五方差齐性检验,t,检验的条件是样本观察值来自于正态分布,且要求两组比较时两组总体方差相等,由于抽样误差的存在,即使总体方差相等,求出的样本方差也未必相等,但是否一定是由抽样误差引起的呢?,用,F,检验统计量,F=s,1,2,是较大的一个方差,1
12、n,1,-1 ,2,=n,2,-1,附表,3,中的单侧的界值,实对应双侧的界值,例 由,X,光片上测得两组病人的肺门横径右侧距,R,1,值(,cm,)。结果如下:,矽肺,0,期病人:,n,1,=50 =4.34 s,1,=0.56,肺癌病人:,n,2,=10 =6.21 s,2,=1.79,H,0,:,1,2,=,2,2,H,1,:,1,2,2,2,=0.10,F=10.217,1,=n,1,-1=9 ,2,=n,2,-1=49,查附表,3,得,F=10.217F,0.10,9,49,=2.07,p0.10,故按,=0.10,水平拒绝,H,0,,认为两组病人的总体方差不等。,六,t,检验,
13、t,检验的应用条件要求两个总体方差相等,如不等时,可以:,1,变量变换,2,非参数检验,3,近似,t,检验(即,t,检验),有,3,种不同的算法:,Cochran&Cox,法,(1950),Satterthwaite,法,(1946),Welch,法,(1947),七假设检验应注意的问题,1.,要有严密的抽样研究计划,要保证样本是从同质总体中随机抽取。,除了对比的因素外,其它影响结果的因素应一致。,2,选用的假设检验方法应符合其应用条件,要了解变量的类型是计量的还是计数的,设计类型是配对设计还是成组设计,是大样本还是小样本。,3.,结论不能绝对化,4.,正确理解差别有无显著性的统计意义,差别有
14、显著性,或有统计意义,指我们有很大的把握认为原假设不正确,并非是说它们有较大的差别。,差别无显著性,或无统计意义,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。,5.,统计显著性与其它专业上的显著性的意义不同,八可信区间与假设检验的联系与区别,1.,可信区间也可以回答假设检验的问题,2.,可信区间比假设检验可提供更多的信息,九两类错误,由于样本的随机性,假设检验中作出的结论可能会犯两类不同类型的错误:,(,1,),H,0,成立,但由于样本的随机性,拒绝了,H,0,所犯的错误称第一类错误或,型错误或拒真错误。犯第一类错误的概率记作,(,2,),H,0,不成立,但由于
15、样本的随机性,不拒绝,H,0,所犯的错误称第二类错误或,型错误或受伪错误。犯第二类错误的概率记作,当样本例数,n,一定时,,减小则,会增大。,检验效能(,power of a test,):亦称把握度,,1-,,它的意义是当两总体确有差别,按规定检验水准,所能发现该差异的能力。,3,几点注意,(,1,)统计意义:从总体中作大数次随机抽样,有,95%,求得的可信区间包含总体均数。并不是做一次抽样求得可信区间包括,的概率是,0.95,,对一次抽样而言只有两种可能,要么可信区间包含,,要么不包含,。,(,2,)两个要素:准确度,即,1-,,精度,即区间的长度。,(,3,)与正常值范围不同,2,区间估计,(,1,),未知,X,N,(,,,2,),则 ,t,,,有,p,(,-t,t t,,,),=1-(,可信度,),即,p,(,-t,t,),=1-,
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818