收藏 分销(赏)

检验与非参数检验.pptx

上传人:人****来 文档编号:4225317 上传时间:2024-08-26 格式:PPTX 页数:96 大小:3.93MB
下载 相关 举报
检验与非参数检验.pptx_第1页
第1页 / 共96页
检验与非参数检验.pptx_第2页
第2页 / 共96页
检验与非参数检验.pptx_第3页
第3页 / 共96页
检验与非参数检验.pptx_第4页
第4页 / 共96页
检验与非参数检验.pptx_第5页
第5页 / 共96页
点击查看更多>>
资源描述

1、4.T检验与非参数检验检验与非参数检验4.1常用统计概念简介常用统计概念简介4.1.1常用统计概念常用统计概念4.1.2概率、概率分布概率、概率分布4.1.3二项分布二项分布4.1.4泊松分布泊松分布4.1.5正态分布正态分布正态概率分布有以下重要特征:(见图正态概率分布有以下重要特征:(见图4-2)(1)正态分布是对称分布,对称轴是)正态分布是对称分布,对称轴是x=。(2)当)当x=时,正态概率密度最大。时,正态概率密度最大。(3)正态分布的图形由)正态分布的图形由和和决定。决定。(4)当)当为定值时,为定值时,的变化引起正态概率密的变化引起正态概率密度曲线在横轴上平行移动。度曲线在横轴上平

2、行移动。(5)当)当为定值时,为定值时,的变化将引起正态概率的变化将引起正态概率密度曲线的形状变得尖峭或偏平。密度曲线的形状变得尖峭或偏平。注:正态曲线注:正态曲线1的的=2.4,=0.8;正态曲线正态曲线2的的=3.4,=0.8;正态曲线正态曲线3的的=3.4,=1.2。正态分布与二项分布的主要区别:正态分布与二项分布的主要区别:正态分布是连续的,而二项分布是离散的。象所有正态分布是连续的,而二项分布是离散的。象所有连续随机变量一样,正态随机变量任意一个确定连续随机变量一样,正态随机变量任意一个确定值的概率为值的概率为0,非,非0概率只有在确定区间内才能得概率只有在确定区间内才能得到。到。二

3、项分布与正态分布存在渐近关系。二项分布的参二项分布与正态分布存在渐近关系。二项分布的参数是数是n和和p。则概率。则概率P(aXb)可以被正态分布可以被正态分布N(np,npq)曲线下从曲线下从(a-1/2)到到(b+1/2)的面积所近似。的面积所近似。这一规则隐含有:当这一规则隐含有:当a=b时,二项概率时,二项概率P(X=a)可可以用正态曲线下的从以用正态曲线下的从(a-1/2)到到(b+1/2)间的面积近间的面积近似。唯一例外的是似。唯一例外的是P(X=0)及)及P(X=n)分别被)分别被正态曲线下正态曲线下1/2左边的面积及左边的面积及n-1/2右边的面积所近右边的面积所近似。似。二项分

4、布对正态分布的近似有一个很重要的统计定二项分布对正态分布的近似有一个很重要的统计定理的特例,称为中心极限定理。理的特例,称为中心极限定理。4.1.6极限定理极限定理4.1.7样本平均数的分布样本平均数的分布4.1.8t分布分布4.1.9分布分布图图4-4不同自由度的不同自由度的2分布曲线分布曲线4.1.10F分布分布4.2统计检验的基本原理与方法统计检验的基本原理与方法4.2.1假设检验的基本概念假设检验的基本概念1问题的提出问题的提出2假设检验的步骤假设检验的步骤一个完整的假设检验过程,通常包括以下四个步骤:一个完整的假设检验过程,通常包括以下四个步骤:1)提出原假设()提出原假设(Null

5、Hypothesis)和备择假设)和备择假设(AlternativeHypothesis););2)确定适当的检验统计量并计算检验统计量的值;)确定适当的检验统计量并计算检验统计量的值;3)规定显著性水平)规定显著性水平;4)做出统计决策。)做出统计决策。3统计学上的四类错误统计学上的四类错误4p值的进一步说明值的进一步说明5实际显著性实际显著性显著性和常识进行综合考虑,作出最后的显著性和常识进行综合考虑,作出最后的判断。判断。6关于实际显著性和统计显著性的重要一点关于实际显著性和统计显著性的重要一点7.参数方法与非参数方法参数方法与非参数方法4.2.2样本平均数的检验样本平均数的检验u检验与

6、检验与t检验检验4.3TTEST过程过程t检验检验4.3.1TEST过程简介过程简介1TEST过程简介过程简介TTEST过程在一些假设条件下计算过程在一些假设条件下计算t统计量,统计量,用以检验用以检验“两组观测值均值相等两组观测值均值相等”这个原这个原假设。假设条件有以下两点:假设。假设条件有以下两点:1)两组观测方差相等。)两组观测方差相等。2)在每个组内,各个观测独立,且服从相同)在每个组内,各个观测独立,且服从相同的正态分布。的正态分布。如如果果两两组组观观测测方方差差不不等等,则则计计算算近近似似的的t统统计计量量,同同时时用用Satterthwaite方方法法计计算算其其近近似似自

7、自由由度度,又又可可以以要要求求用用Cochran和和Cox方方法法近近 似似 计计 算算t检检 验验 的的 概概 率率 水水 平平。计计 算算F(Folded)统统计计量量用用于于检检验验两两个个方方差差是是否否相相等等。TTEST过过程程不不是是为为成成对对数数据据比比较较设设计计的的,对对成成对对数数据据,可可用用MEANS过过 程程 或或UNIVERATE过过程程检检验验成成对对数数据据的的差差值值是是否否为为 零零,以以 判判 断断 成成 对对 数数 据据 均均 值值 是是 否否 相相 等等。proc ttest ;class variable;Paired variables;by

8、 variables;var variables;freq variable;weight variable;Nostatementcanbeusedmorethanonce.ThereisnorestrictionontheorderofthestatementsafterthePROCstatement.ALPHA=p specifiesthatconfidenceintervalsaretobe100(1-p)%confidence intervals,where 0p|t|time192.300.0329 One-Mean Comparison Using FREQ Statement

9、 5 15:07 Monday,April 26,2008 The TTEST Procedure Statistics Lower CL Upper CL Lower CL Upper CL Variable N Mean Mean Mean Std Dev Std Dev Std Dev Std Err Weight 19 89.05 100.03 111 17.208 22.774 33.679 5.2247 T-Tests Variable DF t Value Pr|t|Weight 18 0.01 0.9960title One-Mean Comparison Using FREQ

10、 Statement;data read;input score count;datalines;40 2 47 2 52 2 26 1 19 2 25 2 35 4 39 1 26 1 48 1 14 2 22 1 42 1 34 2 33 2 18 1 15 1 29 1 41 2 44 1 51 1 43 1 27 2 46 2 28 1 49 1 31 1 28 1 54 1 45 1 ;run;proc ttest data=read h0=30;var score;freq count;run;One-Mean Comparison Using FREQ Statement 4 1

11、5:07 Monday,April 26,2008 The TTEST ProcedureFrequency:count Statistics Lower CL Upper CL Lower CL Upper CL Variable N Mean Mean Mean Std Dev Std Dev Std Dev Std Err score 44 31.449 34.864 38.278 9.2788 11.23 14.229 1.693 T-Tests Variable DF t Value Pr|t|score 43 2.87 0.0063ComparingGroupMeanstitle

12、Comparing Group Means;data scores;input Gender$Score;datalines;f 75 f 76 f 80 f 77 f 80 f 77 f 73 m 82 m 80 m 85 m 85 m 78 m 87 m 82;run;proc ttest cochran ci=equal umpu;class Gender;var Score;run;data ttest4_1;infile i:ttst4_1;input sex body carcass;run;proc ttest data=ttest4_1;class sex;var body c

13、arcass;title sas ttest for test;run;proc ttest data=sashelp.ttest4_1;class sex;var body carcass;title sas ttest for test;run;SAS程序程序Ttest4_1.sast检验时检验时SAS系统输出是按照系统输出是按照顺序,进行顺序,进行结论分析应按照结论分析应按照倒序查看。先看倒序查看。先看,判断数,判断数据是否来自同一方差总体,如果据是否来自同一方差总体,如果PrF的值于的值于.05,说明来自同一方差总体,可以使用说明来自同一方差总体,可以使用t检验方法进行分检验方法进行分

14、析,否则应采用非参数检验。然后看析,否则应采用非参数检验。然后看中的中的Equal一行,判断两组均值是否相等,如果不等且一行,判断两组均值是否相等,如果不等且PrF值值小于小于0.05,说明两组均值有显著差异,否则无差异。,说明两组均值有显著差异,否则无差异。然后查看然后查看中中Mean列,根据专业知识及两组均值的列,根据专业知识及两组均值的大小,判断是大的好还是小的好。大小,判断是大的好还是小的好。查看查看t检验输出结果和方法检验输出结果和方法:例例4.2将将20个样本随机分为两组,分别用两种个样本随机分为两组,分别用两种培养基进行培养试验,测得有效成份如下,问两组培养基进行培养试验,测得有

15、效成份如下,问两组的平均值有无差别。的平均值有无差别。treat1:a培养基(培养基(11)10,20,40,40,40,80,80,160,160,160,320treat2:b培养基(培养基(9人)人)10,10,10,20,20,20,20,40,40Ho:两组均值相等两组均值相等1=2,Ha:两组均值不等两组均值不等12,显著水平,显著水平=0.05。由于数据有倍数关系,所以先将两组数据分别由于数据有倍数关系,所以先将两组数据分别取对数,以对数作为新变量进行比较。取对数,以对数作为新变量进行比较。用变换后的数据再代入以上公式计算用变换后的数据再代入以上公式计算t值。值。SAS程序程序T

16、test4_2.sasdata s41;input treat1 treat2;lg10tr=log10(treat2);cards;1 10 1 20 1 40 1 40 1 40 1 80 1 80 1 160 1 160 1 1601 320 2 10 2 10 2 10 2 20 2 20 2 20 2 20 2 40 2 40;proc ttest;class treat1;var lg10tr treat2;run;data npar1way4_7(drop=i n);input siliao$n;do i=1 to n;input addw;output;end;cards;a

17、66.65 6.35 7.05 7.90 8.04 4.45b 6 5.34 7.00 7.89 7.05 6.74 7.28;run;proc ttest data=npar1way4_7;class siliao;var addw;run;4.2.3双尾检验与单尾检验双尾检验与单尾检验data l;retain n 40;retain e 0.01;do x=-3.5 to-1.99 by e*2,-2 to 2 by e,2.001 to 3.5 by e*2;y=probt(x,n,0)-probt(x-e,n,0);output;end;run;proc gplot data=l;p

18、lot y*x/href=-1.96 0 1.96;symbol i=join c=red;axis1 label=(probability);axis2 label=(t value)order=(-3.5 to 3.5 by 0.5);title t distribution(df=40,nc=0);title2 two-sided test;run;data kl;retain e 0.01;do x=-3.5 to-1.99 by e*2,-2 to 2 by e,2.001 to 3.5 by e*2;y=probnorm(x)-probnorm(x-e);output;end;ru

19、n;proc gplot data=kl;plot y*x/href=-1.96 0 1.96;symbol i=join c=red;axis1 label=(probability);axis2 label=(t value)order=(-3.5 to 3.5 by 0.5);title normal distribution;title2 two-sided test;run;4.2.4非参数检验非参数检验1检验检验2符号检验符号检验3秩和检验法秩和检验法Satterthwaites ApproximationThe formula for Satterthwaites(1946)ap

20、proximation for the degrees of freedom for the approximate t statistic is:df=(w1+w2)2)/(w12)/(n1-1)+(w22)/(n2-1)where w1=/n1,w2=/n2 Refer to Steel and Torrie(1980)or Freund,Littell,and Spector(1986)for more information.The Cochran and Cox ApproximationTheCochranandCox(1950)approximationoftheprobabil

21、ityleveloftheapproximatetstatisticisthevalueofpsuchthatt=(w1t1+w2t2)/(w1+w2)wheret1andt2arethecriticalvaluesofthetdistributioncorrespondingtoasignificancelevelofpandsamplesizesofn1andn2,respectively.Thenumberofdegreesoffreedomisundefinedwhen.Ingeneral,theCochranandCoxtesttendstobeconservative(Leeand

22、Gurland1975).4.3.2TTEST过程举例说明过程举例说明例例4.3为了解某乡粮田土壤肥力的变化情为了解某乡粮田土壤肥力的变化情况,况,1998年和年和1999年连续两年对年连续两年对9个监测点进个监测点进行取土样化验有机质含量。行取土样化验有机质含量。y1代表代表1998年化年化验结果,该年土壤有机质平均含量为验结果,该年土壤有机质平均含量为.21%,y2代表代表1999年化验结果,分析两年间土壤有年化验结果,分析两年间土壤有机质变化情况。机质变化情况。SAS程序程序test4_3.sasdata ttest4_3;input orgenic$x;cards;y1 1.64 y1

23、 1.04 y1 1.46 y1 0.88 y1 1.30 y1 0.84 y1 1.39 y1 0.99 y1 1.43y2 1.60 y2 0.62 y2 1.49 y2 0.74 y2 1.24 y2 0.65 y2 1.51 y2 0.84 y2 1.50;proc ttest;class orgenic;var x;run;输出结果简介输出结果简介:ForH0:Variancesareequal,F=2.08DF=(8,8)ProbF=0.3203从输出的最下方可知,两组变量来自同一方差总体。从输出的最下方可知,两组变量来自同一方差总体。T-TestsVariableMethodVa

24、riancesDFtValuePr|t|xPooledEqual160.520.6127xSatterthwaiteUnequal14.20.520.6136在方差相等的前提下,两组均值相等的概率为在方差相等的前提下,两组均值相等的概率为0.6127,所,所以以1998年和年和1999年间该乡土壤有机质含量没有大的变化,即年间该乡土壤有机质含量没有大的变化,即土壤肥力差异不明显。土壤肥力差异不明显。例例4.4此试验的目的是看看与单纯繁殖相比,杂交此试验的目的是看看与单纯繁殖相比,杂交能否显著提高肉鸡的生长速度。实验数据是在能否显著提高肉鸡的生长速度。实验数据是在8周龄测得的体重(单位:克)。周

25、龄测得的体重(单位:克)。SAS程序程序Ttest4_4.sasdata Ttest4_4;input gender$recorder;cards;ac 1309 ac 1275 ac 1089 ac 982ac 1084 ac 1463 ac 1086 ac 1026ac 1658 ac 842 ac 1452 ac 917ac 1003 ac 1070 ac 1062 ac 1031ac 1459 ac 1167 ac 901 ac 1197ac 1204 ac 1260 ac 1046 ac 1223ac 1510 ac 868 ac 1032 ac 1100ac 1297 ac 115

26、6 ac 1158 ac 1261ac 1446 ac 1264 ac 1170 ac 942ac 1017 ac 1668 ac 1308 ac 934ac 1284 ac 1577 ac 1307 ac 1493ac 939 ac 1365 ac 990 ac 953aa 1545 aa 1124 aa 630 aa 867aa 839 aa 880 aa 815 aa 811aa 954 aa 1184 aa 1090 aa 1231aa 1195 aa 995 aa 862 aa 1369aa 1312 aa 1172 aa 1210 aa 1049aa 1341 aa 1254 aa

27、 1608 aa 962aa 1077 aa 895 aa 1134 aa 1226aa 1132 aa 1219 aa 1117 aa 1092aa 1004 aa 941 aa 1026 aa 1012aa 928 aa 1176 aa 796 aa 985aa 1087 aa 903 aa 950 aa 1058aa 914 aa 901 aa 1488 aa 1296aa 976 aa 1111 aa 1548 aa 1260aa 1316 aa 1310 aa 1012 aa 1023;proc ttest;class gender;var recorder;run;例例4.5研究皱

28、纹盘鲍卵受精时间对受精率及孵研究皱纹盘鲍卵受精时间对受精率及孵化率的影响,其中化率的影响,其中a、b代表不同的受精时代表不同的受精时间,间,a:受精时间:受精时间0.5小时;小时;b:受精时间:受精时间1.0小时;每组有小时;每组有8个试验组,则数据集有个试验组,则数据集有16个个观测,观测值均为百分数,请分析在不同观测,观测值均为百分数,请分析在不同的受精时间下,对海产单壳经济水产品皱的受精时间下,对海产单壳经济水产品皱纹盘鲍卵的孵化率是否有显著差异,以确纹盘鲍卵的孵化率是否有显著差异,以确定人工繁殖时的受精时间,提高孵化率。定人工繁殖时的受精时间,提高孵化率。SAS程序程序Ttest4_5

29、.sasdata Ttest4_5;input time$fuhualv ;cards;a 73 a 65 a 72 a 65 a 64 a 77 a 71 a 66b 59 b 64 b 61 b 63 b 64 b 61 b 62 b 58;proc ttest;class time;var fuhualv;title fuhualv ;run;例例4.5结果说明结果说明:从从t检验输出结果可以看出:方差相等的假设是不合理的,方检验输出结果可以看出:方差相等的假设是不合理的,方差相等假设成立的概率仅为差相等假设成立的概率仅为0.0594。双边检验。双边检验F值(大方值(大方差除以小方差)为

30、差除以小方差)为4.67,所以应该使用方差不相等的检验。,所以应该使用方差不相等的检验。从而采用从而采用Unequel一行的一行的t值、值、DF和概率。和概率。通过通过t检验结果得出,受精时间为检验结果得出,受精时间为0.5h和受精时间为和受精时间为1.0h的两的两个试验组在孵化率上有显著的差异,概率水平为个试验组在孵化率上有显著的差异,概率水平为0.0022。受精时间为受精时间为0.5h的皱纹盘鲍卵的孵化率显著高于受精时间的皱纹盘鲍卵的孵化率显著高于受精时间为为1.0h的皱纹盘鲍卵的孵化率。的皱纹盘鲍卵的孵化率。但对于两组变量,当方差不等,且样本数小于但对于两组变量,当方差不等,且样本数小于

31、30时,应采用时,应采用非参数检验,否则可能得出错误的结论。建议使用后面讲非参数检验,否则可能得出错误的结论。建议使用后面讲到的到的Npar1way过程进行非参数检验。过程进行非参数检验。4.4NPAR1WAY过程(非参数检验过程)过程(非参数检验过程)1NPAR1WAY过程简介过程简介NPAR1WAY过程是基于经验分布函数(过程是基于经验分布函数(EDF)和跨过单向)和跨过单向分类的因变量的秩得分,计算出几个统计量,用以检验变分类的因变量的秩得分,计算出几个统计量,用以检验变量的分布在跨过不同组时有相同的位置参数。秩得分包括量的分布在跨过不同组时有相同的位置参数。秩得分包括Wilcoxon得

32、分,中位数得分,得分,中位数得分,Savage得分和得分和VanderWaerden得分。关于这些得分的说明请参考有关非参数检得分。关于这些得分的说明请参考有关非参数检验的统计书。验的统计书。NPAR1WAY过程语句过程语句PROCNPAR1WAY选择项选择项;CLASS变量列表变量列表;BY变量列表变量列表;VAR变量列表变量列表;RUN;4.4.2NPAR1WAY过程举例说明过程举例说明例例4.6将例将例4.5用用NPAR1WAY过程进行非参数检验。过程进行非参数检验。SAS程序程序Npar1way4_6.sasdatanpar1way4_6;inputtime$fuhualv;cards

33、;a73a65a72a65a64a77a71a66b59b64b61b63b64b61b62b58;procnpar1way;classtime;varfuhualv;titlefuhualv;run;结果说明:通过多种方法的比较与检验,两组数据结果说明:通过多种方法的比较与检验,两组数据都存在显著差异,即受精时间为都存在显著差异,即受精时间为0.5h和受精时间和受精时间为为1.0h的两个试验组在孵化率上有显著的差异。的两个试验组在孵化率上有显著的差异。受精时间为受精时间为0.5h的皱纹盘鲍卵的孵化率显著高于的皱纹盘鲍卵的孵化率显著高于受精时间为受精时间为1.0h的皱纹盘鲍卵的孵化率。的皱纹盘

34、鲍卵的孵化率。虽然与虽然与t检验在方差不等的前提下得到的结论相同,检验在方差不等的前提下得到的结论相同,但通过进行多种非参数检验,结论更有说服力,但通过进行多种非参数检验,结论更有说服力,且显著水平也明显高于且显著水平也明显高于t检验的结果。检验的结果。KruskalWallis卡方检验的显著水平为卡方检验的显著水平为0.0011,VanderWaerden法的显著水平为法的显著水平为0.0017。均高于。均高于0.0022,说明对于这种数据,采用非参数检验,统计结果说明对于这种数据,采用非参数检验,统计结果更精确。因此根据数据特点选择合适的方法进行更精确。因此根据数据特点选择合适的方法进行统

35、计分析,有助于我们得到科学而准确的结论。统计分析,有助于我们得到科学而准确的结论。例例4.7数据来源:中国农大昌平试验站用数据来源:中国农大昌平试验站用a、b两种饲两种饲料对香猪进行饲养试验。每组料对香猪进行饲养试验。每组6头香猪,两组共有头香猪,两组共有12个观测值。数据是个观测值。数据是6周时每头香猪的增重结果,周时每头香猪的增重结果,单位:单位:Kg。分析这两种饲料对香猪的增重有无差。分析这两种饲料对香猪的增重有无差异。增重数据如下:异。增重数据如下:a种饲料:种饲料:6.656.357.057.908.044.45b种饲料:种饲料:5.347.007.897.056.747.28由于试

36、验样本小,应采用非参数检验方法进行检验。由于试验样本小,应采用非参数检验方法进行检验。SAS程序程序Npar1way4_7.sasdata npar1way4_7(drop=i n);input siliao$n;do i=1 to n;input addw;output;end;cards;a 6 6.65 6.35 7.05 7.90 8.04 4.45b 6 5.34 7.00 7.89 7.05 6.74 7.28;run;proc npar1way data=npar1way4_7;class siliao;var addw;run;结果说明:结果说明:其中其中Chi-Square是

37、卡方是卡方 2统计量,统计量,Kruskal-Wallis检验的检验的Chi-Square=0.0064,ProbChi-Square=0.9361,大于,大于0.05,卡方检验不显,卡方检验不显著,即用著,即用a、b两种饲料饲喟香猪对香猪的增重两种饲料饲喟香猪对香猪的增重效果没有差异,两种饲料的增重效果一样。效果没有差异,两种饲料的增重效果一样。这个试验数据计算出的概率值为这个试验数据计算出的概率值为1.0,有些特殊,有些特殊,通常我们处理的数据不会这样。通常我们处理的数据不会这样。如果使用如果使用TTEST过程对这组数据进行检验,也过程对这组数据进行检验,也得到两种饲料对香猪的增重效果无差

38、异的结论。得到两种饲料对香猪的增重效果无差异的结论。但是对于小样本的试验数据应选择非参数检验但是对于小样本的试验数据应选择非参数检验方法进行统计分析,否则得到的结论的可信度方法进行统计分析,否则得到的结论的可信度会受到质疑。会受到质疑。4.5综合应用综合应用4.5.1配对数据的统计分析配对数据的统计分析配对试验设计配对试验设计进行单因素进行单因素2水平试验设计时,对同一个指标观测水平试验设计时,对同一个指标观测2个数据,个数据,这这2个数据来自同个数据来自同1个受试对象或来自非常相同个受试对象或来自非常相同(对重要的对重要的非处理因素而言非处理因素而言)的的2个受试对象,故把这个受试对象,故把

39、这2个数据看作一个数据看作一对。这种设计称为配对设计。对。这种设计称为配对设计。根据每对数据所对应的具体条件,可将配对设计分为以下根据每对数据所对应的具体条件,可将配对设计分为以下3种:种:自身配对设计:每对数据测量来自同一个受试对象。自身配对设计:每对数据测量来自同一个受试对象。同源配对设计:每对数据测量来自同一窝同源配对设计:每对数据测量来自同一窝(或胎或胎)的的2个受试对个受试对象。象。条件相近者配对设计:每对数据测量来自条件条件相近者配对设计:每对数据测量来自条件(指最重要的非指最重要的非处理因素处理因素)相近的相近的2个受试对象。个受试对象。data ttest4_8;input b

40、aci1 baci2;diff=baci1-baci2;cards;33.0 23.3 35.8 21.7 28.8 19.4 31.4 26.8 42.6 32.0 25.8 23.1 31.6 25.3 29.0 23.7 22.4 21.8 30.2 17.6;proc univariate normal plot;var diff;run;结果说明:结果说明:第第1部分是对差量算出的各种简单样本统计量的值。部分是对差量算出的各种简单样本统计量的值。如均数如均数=7.59,标准差,标准差=4.38。第。第2部分是有关统计部分是有关统计检验的结果。先看差量是否服从正态分布,零假检验的结果。

41、先看差量是否服从正态分布,零假设是差量服从正态分布,备择假设是差量不服从设是差量服从正态分布,备择假设是差量不服从正态分布。正态分布。W=0.970391,P=0.8944,大于,大于0.05,接受零假设。应该用关于差量的总体均数为零的接受零假设。应该用关于差量的总体均数为零的t检验的结果:检验的结果:t=5.47,P=0.0004,拒绝,拒绝Ho:差量:差量均数为零的假设。结论为:服这种亲朋药前后对均数为零的假设。结论为:服这种亲朋药前后对病人体内的病人体内的Baci含量有显著影响,这种药对治疗含量有显著影响,这种药对治疗腹泻有较好的效果。腹泻有较好的效果。(提示:如果差量不服从正态分布,则

42、应该用符号(提示:如果差量不服从正态分布,则应该用符号秩秩(SgnRank)检验的结果,即参照检验的结果,即参照SignMPr=|M|一行的结论。)一行的结论。)编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 初产 1.03 0.97 0.96 1.06 1.27 1.17 1.04 1.07 1.08 1.43 1.37 1.30 0.95 1.04 经产 1.32 1.34 1.33 1.48 1.38 1.32 1.53 1.44 1.65 1.16 1.48 1.01 1.46 1.45例4.9 某养猪场14头大白猪的初产与经产仔猪平均 初生重资料如下(单位:k

43、g),分析大白猪的初 产与经产仔猪平均初生重是否有显著差异.data data_prg.ttest4_9;input w1 w2;diff=w2-w1;cards;1.03 1.32 0.97 1.34 0.96 1.33 1.06 1.48 1.27 1.38 1.17 1.32 1.04 1.531.07 1.44 1.08 1.65 1.43 1.16 1.37 1.48 1.30 1.01 0.95 1.46 1.04 1.45proc univariate normal plot data=data_prg.ttest4_9;var diff;run;data data_prg.np

44、ar1way4_9;input group$n;do i=1 to n;input weight;output;end;cards;a1 141.03 0.97 0.96 1.06 1.27 1.17 1.04 1.07 1.08 1.43 1.37 1.30 0.95 1.04 a2 141.32 1.34 1.33 1.48 1.38 1.32 1.53 1.44 1.65 1.16 1.48 1.01 1.46 1.45;proc npar1way data=data_prg.npar1way4_9;class group;var weight;run;4.5.2成组试验数据的统计分析成

45、组试验数据的统计分析1.单因素双水平随机试验设计单因素双水平随机试验设计2.检验方法的前提条件检验方法的前提条件对成组设计的试验数据进行检验分析之对成组设计的试验数据进行检验分析之前,要先判断试验数据是否满足以下前,要先判断试验数据是否满足以下2个个前提条件:前提条件:1)正态性:各组数据应独立,且来自同一正)正态性:各组数据应独立,且来自同一正态总体。态总体。2)方差齐性:)方差齐性:2组数据的总体方差应该相等。组数据的总体方差应该相等。例例4.10某植物营养实验室进行肥料对草坪颜某植物营养实验室进行肥料对草坪颜色质量的研究,选择两种肥料进行试验,色质量的研究,选择两种肥料进行试验,数据是两

46、种肥料对草坪颜色的分数。分析数据是两种肥料对草坪颜色的分数。分析两种肥料对草坪颜色质量的影响是否有差两种肥料对草坪颜色质量的影响是否有差异。异。由于样本量小,应采用非参数检验。由于样本量小,应采用非参数检验。SAS程序程序npar1way4_10.sasDATA F;input f$n;do i=1 to n;input x ;output;end;datalines;F1 67.9 7.8 7.8 7.8 7.8 7.9F2 67.7 7.8 7.7 7.8 7.7 7.8;proc sort;by f;proc univariate normal;var x;by f;run;PROC n

47、par1way wilcoxon;CLASS f;RUN;PROC ttest;CLASS f;var x;RUN;以上是以上是NPAR1WAY过程的非参数秩和检验结果。过程的非参数秩和检验结果。Kruskal-Wallis卡方检验得:卡方检验得:Chi-Square=4.6933,p=0.303,两组秩和相等的概率小于,两组秩和相等的概率小于0.05,即,即两组秩和不等,两种肥料对草平颜色质量的影响两组秩和不等,两种肥料对草平颜色质量的影响有显著的差异。由秩和得分知:有显著的差异。由秩和得分知:f1肥料显著好于肥料显著好于f2肥料,在维护草平时建议推广使用肥料,在维护草平时建议推广使用f1肥

48、料。肥料。由于样本量小,且数据不服从正态分布,故不能采由于样本量小,且数据不服从正态分布,故不能采用用t检验,应采用非参数的秩和检验。如果采用近检验,应采用非参数的秩和检验。如果采用近似似t检验,由输出的双尾检验结果得检验,由输出的双尾检验结果得p=0.0621,大,大小小0.05,两种肥料对草平颜色质量的影响无差异。,两种肥料对草平颜色质量的影响无差异。结论错误。结论错误。如果使用如果使用TTEST过程进行分析也会得到错误结论。过程进行分析也会得到错误结论。4.5.4SAS/ASSIST中的中的t检验与非参检验与非参数检验数检验1、SAS/ASSIST中的中的TTEST检验检验选择菜单选择菜单Solutions/ASSIST,启动,启动ASSIST模模块。块。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服