资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 均数差异显著性检验,t,检验,河南农业职业学院,孙攀峰,1,目 的 要 求,显著性检验的目的、方法以及步骤,Excel,进行,t,检验的步骤、方法,2,第一节 概率及分布概述,3,一、,事件,定义:在一定条件下,某种事物出现与否就称为是事件。,自然界和社会生活上发生的现象是各种各样的,常见的有两类。,4,在一定条件下必然出现某种结果或必然不出现某种结果。,确定性事件,必然事件(,U),(certain event),不可能事件(,V),(impossible event),一、概率基本概念,5,在一定条件下可能发生也可能不发生。,随机事件,(random event),不确定事件,(indefinite event),为了研究随机现象,需要进行大量重复的调查、实验、测试等,这些统称为试验。,6,二、频率(,frequency,),若在相同的条件下,进行了,n,次试验,在这,n,次试验中,事件,A,出现的次数,m,称为事件,A,出现的频数,比值,m/n,称为事件,A,出现的频率,(frequency),,记为,W(A)=m/n,。,0W(A)1,7,抛掷一枚硬币发生正面朝上的试验记录,从表中可以看出,试验随着,n,值的不同,正面朝上出现的频率也不相同,当,n,越大时,频率越接近,0.50,。,实验者,投掷次数(,n,),发生正面朝上次数(,m,),频率(,m/n,),蒲峰,4040,2048,0.5069,皮尔逊,12000,6019,0.5016,皮尔逊,24000,12012,0.5005,8,一、概率基本概念,频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。,概 率,9,定义:设在相同的条件下,进行大量重复试验,若事件,A,的频率稳定地在某一确定值,p,的附近摆动,则称,p,为事件,A,出现的概率。,P(A)=p,10,统计概率,抛掷一枚硬币发生正面朝上的试验记录,实验者 投掷次数 发生正面朝上的次数 频率,(m/n),蒲丰,4040 2048 0.5069,K,皮尔逊,12000 6019 0.5016,K,皮尔逊,24000 12012 0.5005,随着实验次数的增多,正面朝上这个事件发生的频率稳定接近,0.5,,我们称,0.5,作为这个事件的概率。,11,三、概率(,probability,P),P(A)=p=lim,在一般情况下,随机事件的概率,P,是不可能准确得到的。通常以试验次数,n,充分大,随机事件,A,的频率作为该随机事件概率的近似值。,m,n,m,n,12,1,2,3,4,5,6,7,8,9,10,随机抽取一个球,求下列事件的概率,;,(,1),事件,A,抽得一个编号,4,(,2),事件,B=,抽得一个编号是,2,的倍数,该试验样本空间由,10,个等可能的基本事件构成,即,n=10,,而事件,A,所包含的基本事件有,3,个,即抽得编号为,1,、,2,、,3,中的任何一个,事件,A,便发生。,P(A)=3/10=0.3,P(B)=5/10=0.5,13,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,A,“一次取一个球,取得红球的概率”,10,个球中取一个球,其可能结果有,10,个基本事件(即每个球被取到的可能性是相等的),即,n=10,事件,A,:取得红球,则,A,事件包含,3,个基本事件,即,m=3,P(A)=3/10=0.3,14,四、小概率事件原理,概念:,如果某事件发生的概率,很小,,在大量,重复试验中事件发生的频率也很小,,在,1,次试验中该事件被看做是不会发,生的。,应用:,是假设检验时进行统计推断的理论依据。,通常将,5%,,,1%,认为是,小概率,的标准,又称,显著水平。,15,第二节均数差异显著性检验,16,一、复习回顾,生物统计的本质:,研究如何从样本推断总体,样本抽取的原则:,随机抽样,试验误差的概念:,由样本推断总体时,由各种无法控制的随机因素引起的误差。,17,现在,我们假设有这样一个情况:,从一批同质(相同品种、相同日龄、相同饲料、相同饲养管理等)的,20000,只肉鸡中随机抽取各含,100,只肉鸡的两个样本,分别称量其,42,天出栏重,结果发现:,样本,1,平均出栏重为:,2.24kg/,只,样本,2,平均出栏重为:,2.31kg/,只,?,两样本来自同一总体,但二者,的样本平均数却存在一定差异,18,这种差异来源于随机抽样,造成的,随机误差!,19,现在,我们再来看另一种情况:,在相同日龄、相同饲料、相同饲养管理等条件下,随机从两个品种(,AA,肉鸡、艾维因肉鸡)的各,10000,只肉鸡中分别抽取,100,只肉鸡做为样本,称量其,42,天出栏重,结果发现:,AA,肉鸡平均出栏重为:,2.31kg/,只,艾维因肉鸡平均出栏重为:,2.24kg/,只,差异,品种本质差异,随机误差,?,20,在试验进行过程中,尽管尽量排除随机误差的影响,以突出试验的处理效应,但由于生物个体间无法避免的差异,以及诸多无法控制的随机因素,使得试验结果最后表现的观察值除了处理效应以外,还包括试验误差的效应。,处理,效应,误差,效应,表,面,效,应,21,二、显著性检验的目的,对两个样本进行比较时,必须判断样本间差异主要是随机误差造成的,还是本质不,同或处理效应引起的?,处理,效应,误差,效应,表,面,效,应,处理,效应,误差,效应,显著性检验,显著性检验,22,分析误差产生的原因,确定差异的性质,排除误差干扰,对总体特征做出正确判断,三、显著性检验的任务,23,四、显著性检验的原理,小概率原理:,统计假设:,对总体的某些未知或不完全知道的性质提出待考查的命题,通常包括无效假设和备择假设。根据样本资料对假设的成立与否进行推断就是假设检验,也称显著性检验。,24,五、显著性检验的分类,t,检验,主要用于检验两个处理平均数差异是否显著;,方差分析,主要用于检验多个处理平均数间差异是否显著;,检验,主要用于由质量性状得来的次数资料的显著性检验等。,25,六、显著性检验的步骤,1,、,提出假设,2,、确定显著水平,3,、选定检验方法,计算检验统计量,,确定概率值,作出推断,4,、结论:是否接受假设,26,例,1,:,随机抽测,9,头内江猪和,9,头荣昌猪经产母猪的产仔数,得到如下数据资料:,试比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。,产仔数,内江猪,14,15,12,11,13,17,14,14,13,荣昌猪,12,14,13,13,12,14,10,10,10,下面以两均数差异显著性检验为例具体说明操作步骤。,27,1,、提出假设,对,立,无效假设,/,零假设,/,检验假设,备择假设,/,对应假设,1,2,1,2,误差,效应,处理,效应,H,0,H,A,28,提出假设,:,(,1,)无效假设,H,0,:,1,2,即假设两品种经产母猪产仔数的总体平均数相等,试验的处理效应(品种间差异)为,0,。,(,2,)备择假设,H,A,:,1,2,即假设两品种经产母猪产仔数的总体平均数,1,和,2,不相等,亦即存在处理效应,其意义是指两品种经产母猪产仔数存在本质上的差异。,例:比较内江猪与荣昌猪两品种经产母猪产仔数 是否存在显著差异。,29,2,、确定显著水平,0.05,显著水平*,极显著水平*,能否定,H,0,的,人为,规定的,概率,标准称为,显著水平,,记作,。,统计学中,一般认为概率小于,0.05,或,0.01,的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取,=0.05,和,=0.01,两个显著水平,。,P,P0.05,所以接受,H,0,,从而得出结论:内江猪与荣昌猪经产母猪产仔数未发现有显著差异,其表面差异应有大于,5%,的概率归于随机误差所致。,39,分,析,题,意,提,出,假,设,确,定,显,著,水,平,计,算,检,验,统,计,量,作,出,推,断,假设检验的步骤,:,40,显著性检验的两类错误,H,0,正确,H,0,错误,否定,H,0,错误,(),推断正确,(1-),接受,H,0,推断正确,(1-),错误,(),第一类错误(,type,I,error,),又称弃真错误或,错误,;,第二类错误(,type,I,I,error,),,又称纳伪错误或,错误,七、显著性检验两种类型错误,41,、两类错误既有联系又有区别,错误只在否定,H,0,时,发生,错误只在接受,H,0,时,发生,错误增加,错误减小,错误增加,错误减小,42,2,、,还,依赖于,-,0,的距离,3,、,n,2,可使两类错误的概率都减小,.,43,八、样本均数与总体均数差异显著性检验,44,无效假设为,Ho,:,o,备择假设为,H,A,:,o,计算公式如下:,根据以上公式可导出以下结论:,由此可知,当总体平均数落在已知的样本均数置信概率为(,1-,)的置信区间以外时,就表明在,显著水平时差异显著。,样本均数与总体均数差异显著性检验,t,检验,45,例,5.2,:母猪的怀孕期为,114d,,现抽测,12,头大白猪母猪的怀孕期分别为,115,,,113,,,114,,,112,,,116,,,115,,,114,,,118,,,113,、,115,、,114,、,113,,试检验所得样本的平均数与总体平均数,114d,有无显著差异?,第一步,输入数据,46,第二步,工具,-,数据分析,-,描述统计,47,第三步,输入参数,48,第四步,计算结果,95%,置信区间,下限:,114.3333-1.025696=113.3,上限:,114.3333+1.025696=115.4,总体平均数:,114d,分析:总体平均数落在样本均数置信概率为,95%,的置信区间内(,113.3,115.4,),说明样本均数与总体均数差异不显著。,49,九、两个样本平均数的差异显著性检验,成组数据平均数的比较,成对数据平均数的比较,试,验,设,计,非配对试验设计,配对试验设计,50,非配对试验,成组数据平均数的比较,试验单位完全随机地分两组,各实施一试验处理,两个样本之间的变量没有任何关联,不论两样本的容量是否相同,所得数据皆为,成组数据,。,两组数据,以组平均数作为相互比较的标准,,,来检验其差异的显著性。,如:随机抽测,9,头内江猪和,9,头荣昌猪经产母猪的产仔数:,内江猪:,14,,,15,,,12,,,11,,,13,,,17,,,14,,,14,,,13,荣昌猪:,12,,,14,,,13,,,13,,,12,,,14,,,10,,,10,,,20,分析:这里两品种猪的产仔数无任何关联,每种猪的产仔数分别组成一组数据,相互比较时以组平均数做为比较标准,在,Excel,里进行,t,检验时应采用,“,t,检验,-,双样本等方差假设,”,或,“,t,检验,-,双样本异方差假设,”,进行分析。,51,配对试验,成对数据平均数的比较,试验单位两两配对,随机分配到两个处理,配对的试验单位要求存在相似性,而每个处理内的各试验单位不一定相似,可以变异较大,但配对内试验单位要求相似,因此,两样本容量相同,所得数据为成对数据,两组数据,以相配对的试验单位之间的差异作为相互比较的标准,,,来检验其差异的显著性。,在,Excel,里进行,t,检验时应采用,“,t,检验,-,平均值的成对二样本分析,”,模块进行分析。,52,配对试验,成对数据平均数的比较,如:从,8,窝仔猪中每窝选出性别相同、体重相近的两头随机分配到两个饲料组中进行对比试验:,1,2,3,4,5,6,7,8,甲,x,1,10.0,11.2,14.0,12.1,7.5,9.8,16.5,10.8,乙,x,2,9.8,10.6,13.3,11.5,6.6,9.0,15.8,9.8,x,1,-,x,2,0.2,0.6,0.7,0.6,0.9,0.8,0.7,1.0,窝号,饲料,分析:每窝中选出的性别相同,体重相近的两头仔猪做为一个配对被随机分到甲、乙两组饲喂两种饲料,但甲组中来自,8,窝的仔猪之间可以性别不同,体重不相近,因此最后的数据是原来属于同一窝的两仔猪的成对数据,比较的是,配对仔猪之间的差异,,而非两组平均数的差异。,53,实例:,某研究所对三黄肉鸡进行饲养对比试验,试验时间为,60d,,增重结果如下表,问甲乙两种饲料对三黄鸡的增重效果有无显著影响?,非配对试验,成组数据平均数的比较,54,()假设,(,2,)水平,(,3,)检验,H,0,:,1,2,,即认为两种饲料增重效果相同。,H,A,:,1,2,,即认为两种饲料增重效果不同。,选取显著水平,0.05,第一步,在,Excel,中输入数据,55,第二步,工具,数据分析,t,检验,-,双样本等方差假设,56,(,4,)推断,P=0.21,0.05,,故接受,H,0,,否定,H,A,;,认为两种饲料饲喂三黄鸡的增重效果差异不显著。,第三步,得出检验结果,57,配对试验,成对数据平均数的比较,实例,1,:,现从,8,窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间为,30d,,结果见下表,问两种品牌饲料饲喂仔猪增重有无显著差异?,1,2,3,4,5,6,7,8,甲,x,1,10.0,11.2,11.0,12.1,10.5,9.8,11.5,10.8,乙,x,2,9.8,10.6,9.0,10.5,9.6,9.0,10.8,9.8,x,1,-,x,2,0.2,0.6,2.0,1.6,0.9,0.8,0.7,1.0,窝号,饲料,58,()假设,(,2,)水平,(,3,)检验,H,0,:,1,2,,即认为两种饲料增重效果相同。,H,A,:,1,2,,即认为两种饲料增重效果不同。,选取显著水平,0.05,第一步,在,Excel,中输入数据,59,第二步,工具,数据分析,t,检验,-,平均值的成对二样本分析,60,(,4,)推断,P,=0.0019,0.05,,故否定,H,0,,接受,H,A,;,认为两种饲料饲喂仔猪的增重效果差异显著。,第三步,得出检验结果,61,实例,2,:,现用国产与进口的背膘厚测定仪,对,14,头肥猪进行了测定(单位:,mm,),数据如下:,试检验两种仪器测定的结果有无显著差异?,分析:这里是用国产和进口两种仪器测得同一头猪的背膘厚数据分到两组,是同一样本前后两次试验的结果,属配对试验设计。,62,()假设,(,2,)水平,(,3,)检验,H,0,:,1,2,,即认为两种仪器结果相同。,H,A,:,1,2,,即认为两种仪器结果不同。,选取显著水平,0.05,第一步,在,Excel,中输入数据,63,第二步,工具,数据分析,t,检验,-,平均值的成对二样本分析,64,(,4,)推断,P,=0.92,0.05,,故接受,H,0,,否定,H,A,;,认为两种仪器测定背膘厚的结果差异不显著。,第三步,得出检验结果,65,十、百分数资料的差异显著性检验,样本百分数与总体百分数差异显著性检验,两个样本百分数差异显著性检验,66,基本步骤:,1.,提出无效假设与备择假设,无效假设,H,0,:,p,=,p,0,备择假设,H,A,:,p,p,0,2.,计算,t,值,3.,将计算所得的,t,的绝对值与,1.96,,,2.58,比较,作出统计推断,若 ,1.96,,则,p,0.05,,表明,p,与,p,0,差异不显著;,若,1.96,2.58,,则,0.01,p,0.05,,表明,p,与,p,0,差异显著;,若 ,2.58,,则,p,0.01,,表明,p,与,p,0,差异极显著;,(一)样本百分数与总体百分数差异显著性检验,67,实例:据往年调查,某地区的雏鸡白痢病的发病率一般为,30%,,现对某鸡场,500,只雏鸡进行检测,结果有,175,只,凝集反应呈阳性,问该鸡场的白痢病是否比往年严重?,分析:此例总体百分数,p,0,=30%,样本百分数,p,=175/500=35%,1.,提出无效假设与备择假设,无效假设,H,0,:,p,=,p,0,备择假设,H,A,:,p,p,0,2.,计算,t,值,=0.0205,于是,=,(,0.35-0.30,),/0.0205=2.439,3.,将计算所得的,t,的绝对值与,1.96,,,2.58,比较,作出统计推断,因为,1.962.44,2.58,,则,0.01,p,0.05,,表明,p,=35%,与,p,0,=30%,差异显著,故该鸡场的雏鸡白痢病比往年严重。,68,(二)两个样本百分数差异显著性检验,基本步骤:,1.,提出无效假设与备择假设,无效假设,H,0,:,p,1,=,p,2,备择假设,H,A,:,p,1,p,2,2.,计算,t,值,3.,将计算所得的,t,的绝对值与,1.96,,,2.58,比较,作出统计推断,若 ,1.96,,则,p,0.05,,表明,p,1,与,p,2,差异不显著;,若,1.96,2.58,,则,0.01,p,0.05,,表明,p,1,与,p,2,差异显著;,若 ,2.58,,则,p,0.01,,表明,p,1,与,p,2,差异极显著;,69,实例:某猪场第一年饲养,PIC,品种商品仔猪,10000,头,死亡,980,头;第二年饲养该品种仔猪,10000,头,死亡,950,头,试检验第一年与第二年仔猪死亡率是否有显著差异?,分析:此例第一年死亡率,p,1,=980/10000=9.8%,第一年死亡率,p,2,=950/10000=9.5%,1.,提出无效假设与备择假设,无效假设,H,0,:,p,1,=,p,2,备择假设,H,A,:,p,1,p,2,2.,计算,t,值,=(980+950)/(10000+10000)=9.65%,=,=0.00418,70,=(9.8%-9.5%)/0.00418=0.7177,3.,将计算所得的,t,的绝对值与,1.96,,,2.58,比较,作出统计推断,因为,0.7177,1.96,,则,p,0.05,,,p1,与,p2,差异不显著,表明第一年仔猪死亡率与第二年仔猪死亡率差异不显著。,71,
展开阅读全文