统计假设测验.ppt_咨信网zixin.com.cn

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章统计假设测验,第一节统计假设测验的基本原理,第二节平均数的假设测验,第三节二项资料的百分数假设测验,第四节参数的区间估计,第一节统计假设测验的基本原理,一、统计假设的基本概念,二、统计假设测验的基本方法,三、两尾测验与一尾测验。,四、假设测验的两类错误,一、统计假设的基本概念,所谓,统计假设,(statistical hypothesis),是指有关某一总体参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样，或者比旧地方品种更好。,单个平均数的假设,适于统计测验的假设,两个平均数相比较的假设,(,一,),单个平均数的假设,一个样本是从一个具有平均数,0,的总体中随机抽出的，记作：,H,0,:,=,0,。例如：,(1),某一小麦品种的产量具有原地方品种的产量，其平均产量,等于某一指定值,0,，记为,H,0,:,=,0,。,(2),某一棉花品种的纤维长度,(,),具有工业上某一指定的标准,(,C,),，这可记为,H,0,:,=,C,。,(,二,),两个平均数相比较的假设,两个样本乃从两个具有相等参数的总体中随机抽出的，记为,H,0,:,1,=,2,或,H,0,:,1,-,2,=0,。例如：,(1),两个小麦品种的产量是相同的。,(2),两种杀虫药剂对于某种害虫的药效是相等的。,上述两种假设称为,无效假设,(null hypothesis),。因为假设总体参数,(,平均数,),与某一指定值相等或假设两个总体参数相等，即假设其没有效应差异，或者说实得差异是由误差造成的。,和无效假设相对应的应有一个统计假设，叫,对应假设,或,备择假设,(alternative hypothesis),，记作,H,A,:,0,或,H,A,:,1,2,。,如果否定了无效假设，则必接受备择假设；同理，如果接受了无效假设，当然也就否定了备择假设。,二、统计假设测验的基本方法,统计假设测验：通过对样本数据进行分析而对样本所来自的总体作出统计判断的方法。,(,一,),对所研究的总体首先提出一个统计假设,(,二,),在承认上述无效假设的前提下，获得平均数的抽样分布，计算该假设正确的概率,(,三,),预先设定一个概率水平，该水平称为显著性水准,(,记为,),。常用的为,5%,或,1%,。,当此概率小于,，就根据“小概率事件实际上不可能发生”原理拒绝,H,0,，,接受,H,A,;,当此概率大于,，就接受,H,0,。,下面以一个例子说明假设测验方法的具体内容。,某地区的当地小麦品种一般,667m,2,产,300kg,，即当地品种这个总体的平均数,0,=300(kg),，并从多年种植结果获得其标准差,=75(kg),，而现有某新品种通过,25,个小区的试验，计得其样本平均产量为每,667m,2,330kg,即,=330,，那么新品种样本所属总体与,0,=300,的当地品种这个总体是否有显著差异呢？以下将说明对此假设进行统计测验的方法。,(,一,),对所研究的总体首先提出一个无效假设,通常所做的无效假设常为所比较的两个总体间无差异。,测验单个平均数，则假设该样本是从一已知总体,(,总体平均数为指定值,0,抽出的，即,H,0,:,=,0,。,如上例，即假定新品种的总体平均数,=,0,=300kg,，而样本平均数和,0,之间的差数：,330,300=30(kg),属随机误差；备择假设则为,H,A,:,0,。,如果测验两个平均数，则假设两个样本的总体平均数相等，即,H,0,:,1,=,2,，也就是假设两个样本平均数的差数,属随机误差，而非真实差异；其对应假设则为,H,A,:,1,2,。,(,二,),在承认上述无效假设的前提下，获得平均数的抽样分布，计算假设正确的概率,先承认无效假设，从已知总体中抽取样本容量为,n,=25,的样本，该样本平均数的抽样分布具正态分布形状，平均数,=300(kg),，标准误,=15(kg),。,通过试验，如果新品种的平均产量很接近,300 kg,，例如,301kg,或,299kg,等，则试验结果当然与假设相符，于是应接受,H,0,。如果新品种的平均产量为,500kg,，与总体假设相差很大，那当然应否定,H,0,。,但如果试验结果与总体假设并不相差悬殊,就要借助于概率原理，具体做法有以下两种：,1.,计算概率,在假设,为正确的条件下，根据抽样分布算出获得,=330kg,的概率，或者说算得出现随机误差,=30(kg),的概率：在此，根据,u,测验公式可算得：,因为假设是新品种产量有大于或小于当地品种产量的可能性，所以需用两尾测验。,查附表,2,，,u,=2,时，,P,(,概率,)=20.02275=0.0455,0.05,，即这一试验结果：,=30(kg),，属于抽样误差的概率小于,5%,。,样本平均数,(330kg),与,0,=300kg,存在显著差异。,P,-2 0 2,2.,计算接受区和否定区,在假设,H,0,为正确的条件下，根据的抽样分布划出一个区间，如在这一区间内则接受,H,0,，如在这一区间外则否定,H,0,。如何确定这一区间呢？,根据上章所述和的分布，可知：,因此，在的抽样分布中，落在,(),区间内的有,95%,，落在这一区间外的只有,5%,。,如果以,5%,概率作为接受或否定,H,0,的界限，则上述区间,(),为接受假设的区域，简称,接受区,(acceptance region),；和为否定假设的区域，简称,否定区,(rejection region),。,同理，若以,1%,作为接受或否定,H,0,的界限，则,(),为接受区域，和,为否定区域。,所以在测验时需先计算,1.96,或,2.58,，然后从加上和减去,1.96,或,2.58,，即得两个否定区域的临界值。,如上述小麦新品种例，,0,=300,，,1.96 =29.4(kg),。因之，它的两个,2.5%,概率,的否定区域为,300,29.4,和,300+29.4,，即,大于,329.4(kg),和小于,270.6(kg),的概率只有,5,%(,见图,5.1,),。,图,5.1 5%,显著水平假设测验图示,（表示接受区域和否定区域）,接受区域,否定区域,否定,区域,(,三,),根据“小概率事件实际上不可能发生”原理接受或否定假设,当由随机误差造成的概率小于,5,%,或,1,%,时，就可认为它不可能属于抽样误差，从而否定假设。,如果实验中得到某个差数的概率,P,0.05,，则称这个差数是,显著的,。如果实验中得到某个差数的概率,P,0,。,这个备择假设仅有一种可能性，而统计假设仅有一个否定区域，即曲线的右边一尾。这类测验称,一尾测验,(one-tailed test),。否定区域位于右边的称为右尾测验。,u,=2,，,P,=1-NORMSDIST(2)=0.02275,0.05,已知当地小麦品种,667m,2,0,=300(kg),=75(kg),，而样本容量,n,=,25,，样本平均数为,=330kg,问新品种比原品种是否显著增产？,-,0 2,P,-,0 1.64 4,95%,接受区域,否定区域,否定区域,两尾测验与一尾测验比较,对同一问题，两尾测验的,P,值刚好等于一尾测验的一半。,对于同一显著,性,水平,，,两尾测验,的判别值,u,/2,大于,一尾测验,的判别值,u,，因此一尾测验比两尾测验更容易达差异显著。,如果计算出的,|,u,|,值介于,1.641.96,之间，用两尾测验是不显著的，而用一尾测验却是显著的。,一个问题是两尾测验还是一尾测验完全是由研究者根据,研究目的,来确定的。,假设,H,0,:,0,H,A,:,0,。,这个假设测验的否定区域位于曲线的左边一尾，这类测验称左尾测验。,u,=-2,，,P,=NORMSDIST(-2)=0.02275,0.05,已知当地小麦品种,667m,2,0,=300(kg),=75(kg),，而样本容量,n,=,25,，样本平均数为,=,270kg,问新品种比原品种是否显著减产？,95%,-,-,2 0,P,95%,-,-,1.64 0,否定区域,95%,接受区域,四、假设测验的两类错误,表,5.1,假设测验的两类错误,测验结果,如果,H,0,是正确的,如果,H,0,是错误的,H,0,被否定,第一类错误（,弃真,）,没有错误,H,0,被接受,没有错误,第二类错误（,纳伪,）,第一类错误的概率为显著水平,值。,第二类错误的概率为,值。,值的计算方法就是计算抽样平均数落在已知总体的接受区的概率,(,这里的已知总体是假定的,),。,例：已知总体的均值,0,=300,，其平均数抽样标准误为,15,，被抽样总体的平均数,=,315kg,、标准误也为,15,，由此可以画出这两个总体的分布曲线如图,5.2,，图中标出了已知总体的接受区域在,c,1,和,c,2,之间。由于两个总体的平均数不同，这种可能性正是第二类错误的概率值，其一般计算方法为：,查附表,2,，,P,(,u,1,2.96)=0.0015,，,P,(,u,2,0.96)=0.8315,，,故有,=,P,(,u,2,0.96),P,(,u,1,2.96)=0.8315,0.0015=0.83,或,83%,图,5.2,H,0,:,=300,是错误时的,值,=270.6,=329.4,关于两类错误的讨论可总结如下：,(1),在样本容量,n,固定的条件下，提高显著水平,(,取较小的,值,),，如从,5,%,变为,1,%,则将增大第二类错误的概率,值。,(2),在,n,和显著水平,相同的条件下，真总体平均数,和假设平均数,0,的相差,(,以标准误为单位,),愈大，则犯第二类错误的概率,值愈小。,(3),为了降低犯两类错误的概率，需采用一个较低的显著水平，如,=0.05,；同时适当增加样本容量，或适当减小总体方差,2,，或两者兼有之。,(4),如果显著水平,已固定下来，则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。,第二节平均数的假设测验,一、,t,分布,二、单个样本平均数的假设测验,三、两个样本平均数相比较的假设测验,一、,t,分布,从一个平均数为,、方差为,2,的正态总体中抽样,(,n,),，,(3),若,2,未知，且,n,30,，用样本均方,s,2,估计,2,，则其标准化离差的分布不呈正态，而作,t,分布，具有自由度,DF,或,v,=,n,-1,。,(1),样本平均数的分布必趋向正态分布，,并且遵循正态分布,N,(0,，,1),。,(51),为样本平均数的标准误，,s,为样本标准差，,n,为样本容量。,(2),若,2,未知，但当样本容量足够大,(,n,30,),时，可以样本均方,s,2,估计,2,，其标准化离差,u,仍遵循,N,(0,，,1),t,分布,(t-distribution),是,1908,年,W.S.Gosset,首先提出的，又叫学生氏分布,(students t distribution),。,t,分布也是连续型随机变量的一种分布，其概率密度函数为,:,t,分布的平均数和标准差为：,(54),(53),它具有一个单独参数,v,，,v,是自由度,(,df,),。,图,5.5,标准化正态分布与自由度为,4,的,t,分布曲线,学生氏,t,分布曲线的特征为：,单峰，,左右对称，,围绕平均数,t,=0,向两侧递降；,在其概率密度函数中只有自由度（,v,n,1,）,一个参数；,不同的,v,有不同的曲线，当,v,小时，曲线肥矮，,当,v,大时，曲线高瘦；,随着自由度,v,的增,大,，,t,分布越来越接近于,N,（,0,，,1,）,。,t,分布的概率累积函数为：,(55),t,分布的概率累积函数也分一尾表和两尾表。,P.360,附表,4,列出了不同自由度的,t,分布表值,(,两尾表,),。,在,t,表中，若,v,相同，则,P,越大，,|,t,|,越小；,P,越小，,|,t,|,越大。因此在假设测验中，若算得的,|,t,|,t,，则接受无效假设。,例：随机变量,t,服从,df,=3,的,t,分布，它在区间,(-,t,0.025,t,0.025,),的概率为,95%,，即在此区间以外的概率为,5%,，查表求,t,0.025,的值,。,二、单个样本平均数的假设测验,测验某一样本所属总体平均数是否和某一指定的总体平均数相同。,当总体标准差,为已知,时,，用,u,测验,；,当总体标准差,为未知但,n,足够大,时,，用,u,测验,；,当总体标准差,为未知但,n,不够大,(,n,30),时,，用,t,测验,；,例,5.1,某春小麦良种的千粒重,0,=,34g,，现自外地引入一高产品种，在,8,个小区种植，得其千粒重,(g),为：,35.6,、,37.6,、,33.4,、,35.1,、,32.7,、,36.8,、,35.9,、,34.6,，问新引入品种的千粒重与当地良种有无显著差异？,这里总体,2,为未知，又是小样本，故需用,t,测验；又新引入品种千粒重可能高于也可能低于当地良种，故需作两尾测验。测验步骤为：,H,0,：,=,34g,；对,H,A,：,34g,。,显著水平,=0.05,。,测验计算：,查附表,4,，,v,=7,时，,t,0.05/2,=2.365,。现实得,|,t,|0.05,。,推断：接受,H,0,:,=34g,，即新引入品种千粒重与当地良种千粒重指定值没有显著差异。,三、两个样本平均数相比较的假设测验,由两个样本平均数的相差，以测验这两个样本所属的总体平均数有无显著差异。,测验方法,成组数据的平均数比较,成对数据的比较,(,一,),成组数据的平均数比较,如果两个处理为完全随机设计的两个处理，各供试单位彼此独立，不论两个处理的样本容量是否相同，所得数据皆称为成组数据，以组,(,处理,),平均数作为相互比较的标准。,成组数据的平均数比较分三种情况讨论：,(1),在两个样本的总体方差,1,2,和,2,2,为已知时，用,u,测验,(2),在两个样本的总体方差,1,2,和,2,2,为未知，但可假定,1,2,=,2,2,，而两个样本又为小样本时，用,t,测验。,(3),两个样本的总体方差,1,2,和,2,2,为未知，且,1,2,2,2,时，用近似,t,测验（,t,测验）,(1),在两个样本的总体方差,1,2,和,2,2,为已知时，用,u,测验,由抽样分布的公式知，两样本平均数和的差数标准误，在,1,2,和,2,2,是已知时为：,并有,:,在假设,H,0,:,1,2,=,0,下，正态离差,u,值为，故可对两样本平均数的差异作出假设测验。,例,5.2,据以往资料，已知某小麦品种每平方米产量的,=,0.4 kg,。今在该品种的一块地上用,A,、,B,两法取样，法取,12,个样点，得每平方米产量,=1.2(kg),；,B,法取,8,个样点，得,=1.4(kg),。试比较,A,、,B,两法的每平方米产量是否有显著差异？,假设,H,0,:,A,、,B,两法的每平方米产量相同，即,H,0,:,1,2,=,0,系随机误差；对,H,A,:,1,2,显著水平,=0.05,u,0.05/2,=1.96,=,1,2,=,2,2,=0.4,n,1,=12,n,2,=8,因为实得,|,u,|0.05,推断,:,接受,H,0,:,1,=,2,即,A,、,B,两种取样方法所得的每平方米产量没有显著差异。,(2),在两个样本的总体方差,1,2,和,2,2,为未知，但可假定,1,2,=,2,2,=,2,，而两个样本又为小样本时，用,t,测验。,从样本变异算出平均数差数的均方,s,e,2,，,(56),其两样本平均数的差数标准误为：,当,n,1,=,n,2,=,n,时，,于是有：,由于假设,H,0,:,1,=,2,故,自由度,v,=(,n,1,-1)+(,n,2,-1),(57),(58),(59A),(59B),例,5.3,调查某农场每亩,30,万苗和,35,万苗的稻田各,5,块，得亩产量,(,单位：,kg,),于表,5.2,，试测验两种密度亩产量的差异显著性。,表,5.2,两种密度的稻田亩产,(kg),y,1,(30,万苗,),y,2,(35,万苗,),400,450,420,440,435,445,460,445,425,420,假设,H,0,:,两种密度的总体产量没有差异，即,H,0,:,1,=,2,对,H,A,:,1,2,显著水平,=0.05,测验计算：,=428kg =440kg,SS,1,=1930,SS,2,=550,故,查附表,4,，,v,=4+4=8,时,t,0.05,=2.306,。,现实得,|,t,|=1.080.05,。,推断：接受假设,H,0,:,1,=,2,，两种密度的亩产量没有显著差异。,例,5.4,研究矮壮素使玉米矮化的效果，在抽穗期测定喷矮壮素小区,8,株、对照区玉米,9,株，其株高结果如表,5.3,。试作假设测验。,表,5.3,喷矮壮素与否的,玉米株高,(cm),y,1,(,喷矮壮素,),y,2,(,对照,),160,170,160,270,200,180,160,250,200,270,170,290,150,270,210,230,170,矮壮素只可能矮化无效而不可能促进植侏长高，因此假设,H,0,：喷矮壮素的株高与未喷的相同或更高，即,H,0,:,1,2,对,H,A,:,1,2,，,作一尾测验。,显著水平,=0.05,。,测验计算：,=176.3cm =233.3cm,SS,1,=3787.5,SS,2,=18400,故有,按,v,=7+8=15,，查,t,表得一尾,t,0.05,=1.753,(,一尾测验,t,0.05,等于两尾测验的,t,0.10,),，现实得,t,=,3.05,t,0.05,=,1.753,，,P,3.106,，故,P,t,0.01,，故,P,0.01,。,推断：否定,H,0,:,d,=,0,，接受,H,A,:,d,0,，即,A,、,B,两法对饨化病毒的效应有极显著差异。,例,5.7,研究某种新肥料能否比原肥料每亩增产,5kg,以上皮棉，选土壤和其他条件最近似的相邻小区组成一对，其中一区施新肥料，另一区施原肥料作对照，重复,9,次。产量结果见表,5.5,。试测验新肥料能否比原肥料每亩增产,5kg,以上皮棉？,表,5.5,两种肥料的皮棉产量,(,kg,),重复区,y,1,(,新肥料,),y,(,对照,),d,67.4,60.6,6.8,72.8,66.6,6.2,68.4,64.9,3.5,66.0,61.8,4.2,70.8,61.7,9.1,69.6,67.2,2.4,67.2,62.4,4.8,68.9,61.3,7.6,62.6,56.7,5.9,因为要测验新肥料能否比对照增产,5kg,，故采用一尾测验。,假设,H,0,:,d,5,；对,H,A,:,d,5,。,显著水平,=0.05,。,测验计算：,按,v,=9,1=8,，查,t,表得，,t,0.05,=1.860,(,一尾概率,),。现实得,|,t|,0.05,。,推断：接受,H,0,:,d,5,，即认为新肥料较原肥料每亩增收皮棉不超过,5kg,。,成对数据和成组数据平均数比较的不同,:,(1),成对数据和成组数据平均数比较所依据的条件是不相同的。,前者是假定各个配对的差数来自差数的分布为正态的总体,具有,N,(0,，,),；而每一配对的两个供试单位是彼此相关的。,后者则是假定两个样本皆来自具有共同,(,或不同,),方差的正态总体，而两个样本的各个供试单位都是彼此独立的。,(2),在实践上，如将成对数据按成组数据的方法比较，容易使统计推断发生第二类错误，即不能鉴别应属显著的差异。故在应用时需严格区别。,作业,P97,单个平均数的假设检验,第,4,、,9,题,(,u,测验,),第,5,题,(,t,测验,),两个平均数相比较的假设检验,第,7,题,(,u,测验,),第,6,、,8,、,10,题,(,t,测验,),第三节二项资料的百分数假设测验,许多生物试验的结果是用百分数或成数表示的，如结实率、发芽率等，这些百分数系由计数某一属性的个体数目求得，属间断性的计数资料,.,在理论上，这类百分数的假设测验应按二项分布进行，即从二项式,(,p+q,),n,的展开式中求出某项属性个体百分数的概率。,但是，如样本容量,n,较大，,p,较小，而,np,和,nq,又均不小于,5,时,(,p+q,),n,的分布趋近于正态。因而可以将百分数资料作正态分布处理，从而作出近似的测验。,适于用,u,测验所需的二项样本容量,n,见表,5.6,。,(,样本百分数,),(,较小组次数,),n,(,样本容量,),0.50,15,30,0.40,20,50,0.30,24,80,0.20,40,200,0.10,60,600,0.05,70,1400,表,5.6,适于用正态离差测验的二项样本的和,n,值表,一、单个样本百分数,(,成数,),的假设测验,测验某一样本百分数所属总体百分数与某一理论值或期望值,p,0,的差异显著性。,由于样本百分数的标准误为：,故由,即可测验,H,0,:,p=p,0,。,(516),(517),例,5.8,以紫花和白花的大豆品种杂交，在,F,2,代共得,289,株，其中紫花,208,株，白花,81,株。如果花色受一对等位基因控制，则根据遗传学原理，,F,2,代紫花株与白花株的分离比率应为,31,，即紫花理论百分数,p,=0.75,，白花理论百分数,q,=1,p,=0.25,。问该试验结果是否符合一对等位基因的遗传规律？,假设大豆花色遗传符合一对等位基因的分离规律，紫花植株的百分数是,75%,，即,H,0,:p,=0.75,；对,H,A,:p,0.75,。,显著水平,0.05,，作两尾测验,u,0.05,=1.96,。,测验计算：,因为实得,|,u,|0.05,。,推断：接受,H,0,:,p,=0.75,，即大豆花色遗传是符合一对等位基因的遗传规律的，紫花植株百分数,=0.72,和,p,=0.75,的相差系随机误差。如果测验,H,0,:,p,=0.25,，结果完全一样。,以上资料亦可直接用次数进行假设测验。当二项资料以次数表示时，,故测验计算：,于是,结果同上,二、两个样本百分数相比较的假设测验,测验两个样本百分数和所属总体百分数,p,1,和,p,2,的差异显著性,.,一般假定两个样本的总体方差是相等的，即，设两个样本某种属性个体的观察百分数分别为和,，而两样本总体该种属性的个体百分数分别为,p,1,和,p,2,，则两样本百分数的差数标准误为：,(518),上式中的,q,1,=,(1,p,1,),，,q,2,=(1,p,2,),。这是两总体百分数为已知时的差数标准误公式。,如果假定两总体的百分数相同，即,p,1,=,p,2,=,p,q,1,=,q,2,=,q,，则：,p,1,和,p,2,未知时，则在的假定下，可用两样本百分数的加权平均值作为,p,1,和,p,2,的估计。,(520),(519),因而两样本百分数的差数标准误为：,(521),故由,即可对,H,0,:,p,1,=,p,2,作出假设测验。,(522),例,5.9,调查低洼地小麦,378,株,(,n,1,),，其中有锈病株,355,株,(,y,1,),，锈病率,93.92%(),；调查高坡地小麦,396,株,(,n,2,),，其中有锈病,346,株,(,y,2,),，锈病率,87.31%(),。试测验两块麦田的锈病率有无显著差异？,假设,H,0,：两块麦田的总体锈病率无差别，即,H,0,:,p,1,=,p,2,；对,H,A,:,p,1,p,2,。,显著水平取,，作两尾测验，,u,0.05,=1.96,。,测验计算：,实得,|,u,|,u,0.05,，故,P,0.05,，,推断：否定,H,0,:,p,1,=,p,2,接受,H,A,:,p,1,p,2,，即两块麦田的锈病率有显著差异。,例,5.10,原杀虫剂,A,在,1000,头虫子中杀死,657,头，新杀虫剂,B,在,1000,头虫子中杀死,728,头，问新杀虫剂,B,的杀虫率是否高于原杀虫剂,A,？,假设新杀虫剂,B,的杀虫率并不高于原杀虫剂,A,，即,H,0,:,P,2,P,1,；对,H,A,:,P,2,P,1,。,显著水平,，作一尾测验,u,0.01,=2.326,(,一尾概率,),。,测验计算：,实得,u,u,0.01,=,2.326,，故,P,0.01,，,推断：否定,H,0,:,P,2,P,1,，接受,H,A,:,P,2,P,1,，即新杀虫剂的杀虫率极显著地高于原杀虫剂,A,。,三、二项样本假设测验时的连续性矫正,二项总体的百分数的分布是间断性的二项分布。把它当作连续性的正态分布或,t,分布处理，结果会有些出入，一般容易发生第一类错误。,因此,在假设测验时需进行连续性矫正。,(1),在,n,30,，而,5,时这种矫正是必须的；经过连续性矫正的正态离差,u,值或,t,值，分别以,u,C,或,t,C,表示。,(2),如果样本大，试验结果符合表,5.6,条件，则可以不作矫正，用,u,测验。,(,一,),单个样本百分数假设测验的连续性矫正,单个样本百分数的连续性矫正公式为：,它具有,v,=,n,1,。式中,是的估计值,(523),(524),例,5.11,用基因型纯合的糯玉米和非糯玉米杂交，按遗传学原理，预期,F,1,植株上糯性花粉粒的,p,0,=0.5,，现在一视野中检视,20,粒花粉，得糯性花粉,8,粒，试问此结果和理论百分数,p,0,=0.5,是否相符？,假设系,p=p,0,=,0.5,的一个随机样本，即,H,0,:,p,=0.5,对,H,A,:,p,0.5,显著水平取,用两尾测验。,测验计算：,np,=,nq,=200.5=10,推断认为实得百分数,0.4,与理论百分数,0.5,没有显著差异。,查附表,4,，,v,=,20,1=19,，,t,0.05,=2.093,，现实得,|,t,|0.05,=200.4=8,粒,(,糯,),，,=20-8=12,粒,(,非糯,),(,二,),两个样本百分数相比较的假设测验的连续性矫正,设两个样本百分数中，取较大值的具有,y,1,和,n,1,，取较小值的具有,y,2,和,n,2,，则经矫正的,t,C,公式为：,(525),它具有,v,=,n,1,+,n,2,2,。,其中为中的估计值。,例,5.12,用新配方农药处理,25,头棉铃虫，结果死亡,15,头，存活,10,头；用乐果处理,24,头，结果死亡,9,头，存活,15,头。问两种处理的杀虫效果是否有显著差异？,本例不符合表,5.6,条件，故需要进行连续性矫正。,假设两种处理的杀虫效果没有差异，即,H,0,:,p,1,=,p,2,；对,H,A,:,p,1,p,2,。,显著水平,，作两尾测验。,测验计算：,查附表，,v,=24+25,2=4745,时，,t,0.05,=2.014,。现实得,|,t,C,|0.05,。,推断：接受,H,0,:,p,1,=,p,2,，否定,H,A,:,p,1,p,2,，即承认两种杀虫剂的杀虫效果没有显著差异。,本例如不作连续性矫正，,t,=(0.60,0.375)/0.143,，大于,1.29,，增加了否定,H,0,发生第一类错误的可能性。,第四节参数的区间估计,所谓,参数的区间估计,是指在一定的概率保证之下,估计出一个范围或区间以能够覆盖参数。,这个区间称,置信区间,(confidence interval),，区间的上、下限称为,置信限,(confidence limit),，区间的长度称为,置信距,。,一般以,L,1,和,L,2,分别表示置信下限和上限。,保证该区间能覆盖参数的概率以,P,=(1,),表示，称为,置信系数或置信度,。,一、总体平均数的置信限,(,一,),在总体方差为已知时,的置信区间为：,并有,以上式中的为正态分布下置信度,1,时的,u,临界值。,(,二,),在总体方差为未知时,需由样本均方,s,2,估计，于是置信区间为：,并有,上式中的为置信度,P,=(1,),时,t,分布的,t,临界值。,(526A),(526B),(527A),(527B),例,5.13,某棉花株行圃,36,个单行的皮棉平均产量为,kg,，已知,=0.3kg,，求,99%,置信度下该株行圃单行皮棉产量的置信区间。,在置信度,P,=(1,)=99%,下，由附表,3,查得,u,0.01,=2.58,；并算得,；故,99%,置信区间为,即,推断：估计该株行圃单行皮棉平均产量在,4.04.2kg,之间，此估计值的可靠度有,99%,。,例,5.14,例,5.1,已算得某春小麦良种在,8,个小区的千粒重平均数，。试估计在置信度为,95%,时该品种的千粒重范围。,由附表,4,查得,v,=7,时,t,0.05,=2.365,，故代入,(527A),有,，,即,推断：该品种总体千粒重在,33.836.6g,之间的置信度为,95%,。在表达时亦可写作,形式，即该品种总体千粒重,95%,置信度的区间是,35.2(2.3650.58)=35.21.4(g),，即,33.836.6g,。,二、两总体平均数差数,(),的置信限,在一定的置信度下，估计两总体平均数至少能差多少。,估计方法依两总体方差是否已知或是否相等而有不同。,(,一,),在两总体方差为已知或两总体方差虽未知但为大样本时,对的,1,置信区间应为：,并且,上式中的为平均数差数标准误，为正态分布下置信度为,1,时的,u,临界值。,例,5.15,测得高农选,1,号甘薯,332,株的单株平均产量，,1550(g),，,5.350(g),，白皮白心甘薯,282,株，,1250(g),，,3.750(g),。试估计两品种单株平均产量的相差在,95%,置信度下的置信区间。,由附表,3,查得置信度为,0.95,时，,u,0.05,=1.96,；并可算得：,因而，,95%,的置信限为：,L,1,=(750-600),1.9618=114.7(g),L,2,=(750-600)+1.9618=185.3(g),故高农选,1,号甘薯的单株平均产量比白皮白心甘薯多,114.7185.7(g),，这个估计有,95%,的把握。,(,二,),在两总体方差为未知时,有两种情况：,1.,假设两总体方差相等，即：的,1-,置信区间为：,并有,以上的为平均数差数标准误，是置信度为,1,，自由度为,v,=n,1,+n,2,2,时,t,分布的临界值。,例,5.16,试估计,表,5.2,资料两种密度,667,m,2,产量差数在置信度为,99%,时的置信区间。,在前面已算得：,由附表,查得,v,=8,时，,t,0.01,=3.355,故有,L,1,=(428,440),(3.35511.136)=,49.4,，,L,2,=(428,440)+(3.35511.136)=25.4(kg),。,结果说明，,667,m,2,栽,30,万亩苗的产量可以比,667,m,2,栽,35,万苗的每亩少收,49.4kg,至每亩多收,25.4kg,，波动很大。所以这个例子是接受的,.,的。,当被接受时，意味着两总体平均数相等，即,。因此，可用两样本平均数的加权平均数作为对的估计：,或,因而对的置信区间为：,2.,两总体方差不相等，即,这时由两样本的和,作为和估计而算得的,t,，已不是,v,=,v,1,+,v,2,的,t,分布，而是近似于自由度为的,t,分布。,可得对的,1,的置信区间为：,故根据,并有,为置信度,1,时自由度的,t,分布临界值,其中,例,5.17,试求,例,5.5,资料东方红,3,号小麦的蛋白质含量与农大,139,号小麦蛋白质含量的相差的,95%,置信限。,在例,5.5,已得：,由附表,查得,故有,L,1,=(14.3,11.7),(2.2010.435)=1.6(%),，,L,2,=(14.3,11.7)+(2.2010.435)=3.6(%),因此东方红,3,号小麦的蛋白质含量可比农大,139,号高,1.63.6,%,，这种估计的可靠度为,95%,。,(,三,),成对数据总体差数的置信限,由,可得的,1-,置信区间,:,并有,为置信度为,1,，,v,=,n,1,时,t,分布的临界,t,值。,其中,例,5.18,试求,表,5.4,资料的,99%,置信限。,在例,5.6,已算得：,并由附表查得,v,=6,时,t,0.01,=3.707,于是有,：,L,1,=,8.3,(3.707,1.997)=,15.7,(,个,),，,L,2,=,8.3+(3.707,1.997)=,0.9,(,个,),。,或写作,以上,L,1,和,L,2,皆为负值，表明,A,法处理病毒在番茄上产生的病痕数要比,B,法减小,0.915.7,个，此估计的置信度为,99%,。,三、二项总体百分数,p,的置信限,二项总体百分数,p,的置信区间，可按二项分布或正态分布来估计。,(1),二项分布所得结果较为精确，可以根据样本容量,n,和某一属性的个体数,f,，在已经制好的统计表,(,附表,9,),上直接查得对总体的上、下限，甚为方便。,(2),但附表,9,只包括小部分,n,，在不敷应用时，可由正态分布来估计。由正态分布所得的结果只是一近似值，可在资料符合,表,5.6,条件时应用；在置信度,P,=1,下，对总体,p,置信区间的近似估计为：,并有,以上式中,例,5.19,调查,100,株玉米，得到受玉米螟危害的为,20,株，即,=20/100=0.2,或,=20,。试计算,95%,置信度的玉米螟危害率置信区间。,由附表,9,在样本容量,n,=100,的列和左边观察次数,f,=20,株的交叉处查得的数为,13,和,29,，即真实次数在,1329,范围内。,如以表示，则,的置信度为,95%,。,如按正态近似法计算，则,故,L,1,=0.2,(1.96,0.04)=0.1216,，,L,2,=0.2+(1.96,0.04)=0.2784,四、两个二项总体百分数差数,(,p,1,p,2,),的置信限,这是要确定某一属性个体的百分数在两个二项总体间的相差范围。,这一估计只有在已经明确两个百分数间有显著差异时才有意义。,若资料符合表,5.6,条件，该区间可按正态分布估计。,在,1,的置信度下，,p,1,p,2,的置信区间为：,并有,其中,例,5.20,例,5.9,已测知低洼地小麦的锈病率,=93.92%,(,n,1,=378),，高坡地小麦的锈病率,=87.31%(,n,2,=396),，它们有显著差异。试按,95%,置信度估计两地锈病率相差的置信区间。,由附表查得,u,0.05,=1.96,，而,故有,L,1,=(0.9392,0.8731),(1.96,0.02075)=0.0256,，,L,2,=(0.9392,0.8731)+(1.96,0.02075)=0.1070,，,即低洼地的锈病率比高坡地高,2.5610.70%,，此估计的置信度为,95%,。,五、区间估计与假设测验,区间估计亦可用于假设测验。,对参数所作假设若恰落在该范围内，则这个假设与参数就没有真实的不同，因而接受,H,0,；,反之，如果对参数所作的假设落在置信区间之外，则说明假设与参数不同，所以应否定,H,0,，接受,H,A,。,例,5.21,例,5.1,已算得新引入春小麦品种的千粒重，故其,95%,置信区间的两个置信限为：,L,1,=35.2,(2.365,0.58)=33.8(g),L,2,=35.2+(2.365,0.58)=36.6(g),曾经假设，此值落在上述置信区间内，所以不能认为新引入品种与当地原有良种的千粒重有显著差异，即接受。这和例,5.1,的结论完全相同。,例,5.22,在例,5.18,已求得两种不同处理的病毒，接种在番茄上产生的病痕数的相差，在,1,置信度下的区间为,(,个,),。,如果假设，则该区间内并不包括,0,值，所以，两种处理方法是有显著差异的，显著水平是,0.05,。其结论与例,5.6,同。,例,5.23,在例,5.20,

展开阅读全文