收藏 分销(赏)

4T检验与非参数检验.ppt

上传人:精*** 文档编号:1697583 上传时间:2024-05-07 格式:PPT 页数:61 大小:3.77MB
下载 相关 举报
4T检验与非参数检验.ppt_第1页
第1页 / 共61页
4T检验与非参数检验.ppt_第2页
第2页 / 共61页
4T检验与非参数检验.ppt_第3页
第3页 / 共61页
4T检验与非参数检验.ppt_第4页
第4页 / 共61页
4T检验与非参数检验.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

1、4.T检验与非参数检验检验与非参数检验4.1常用统计概念简介常用统计概念简介4.1.1 常用统计概念常用统计概念4.1.2概率、概率分布概率、概率分布4.1.3 二项分布二项分布4.1.4 泊松分布泊松分布4.1.5 正态分布正态分布正态概率分布有以下重要特征:(见图正态概率分布有以下重要特征:(见图4-2)(1)正态分布是对称分布,对称轴是)正态分布是对称分布,对称轴是x=。(2)当)当x=时,正态概率密度最大。时,正态概率密度最大。(3)正态分布的图形由)正态分布的图形由和和决定。决定。(4)当)当为定值时,为定值时,的变化引起正态概率密的变化引起正态概率密度曲线在横轴上平行移动。度曲线在

2、横轴上平行移动。(5)当)当为定值时,为定值时,的变化将引起正态概率的变化将引起正态概率密度曲线的形状变得尖峭或偏平。密度曲线的形状变得尖峭或偏平。注:正态曲线注:正态曲线1的的=2.4,=0.8;正态曲线正态曲线2的的=3.4,=0.8;正态曲线正态曲线3的的=3.4,=1.2。正态分布与二项分布的主要区别:正态分布与二项分布的主要区别:正态分布是连续的,而二项分布是离散的。象所有正态分布是连续的,而二项分布是离散的。象所有连续随机变量一样,正态随机变量任意一个确定连续随机变量一样,正态随机变量任意一个确定值的概率为值的概率为0,非,非0概率只有在确定区间内才能得概率只有在确定区间内才能得到

3、。到。二项分布与正态分布存在渐近关系。二项分布的参二项分布与正态分布存在渐近关系。二项分布的参数是数是n和和p。则概率。则概率P(aXF的值大于的值大于0.05,说明来自同一方差总体,可以使用,说明来自同一方差总体,可以使用t检验方法进检验方法进行分析,否则应采用非参数检验。然后看行分析,否则应采用非参数检验。然后看中的中的Equal一行,判断两组均值是否相等,如果不等且一行,判断两组均值是否相等,如果不等且PrF值小于值小于0.05,说明两组均值有显著差异,否,说明两组均值有显著差异,否则无差异。然后查看则无差异。然后查看中中Mean列,根据专业知识列,根据专业知识及两组均值的大小,判断是大

4、的好还是小的好。及两组均值的大小,判断是大的好还是小的好。例例4.2 将将20个样本随机分为两组,分别用两种培养基个样本随机分为两组,分别用两种培养基进行培养试验,测得有效成份如下,问两组的平进行培养试验,测得有效成份如下,问两组的平均值有无差别。均值有无差别。treat1:a培养基(培养基(11)10,20,40,40,40,80,80,160,160,160,320treat2:b培养基(培养基(9人)人)10,10,10,20,20,20,20,40,40Ho:两组均值相等两组均值相等1=2,Ha:两组均值不等两组均值不等12 ,显著水平,显著水平=0.05。由于数据面倍数关系,所以先将

5、两组数据分别取对由于数据面倍数关系,所以先将两组数据分别取对数,以对数作为新变量进行比较。数,以对数作为新变量进行比较。用变换后的数据再代入以上公式计算用变换后的数据再代入以上公式计算t值。值。SAS程序程序Ttest4_2.sas4.2.3 双尾检验与单尾检验双尾检验与单尾检验4.2.4 非参数检验非参数检验1 检验检验2符号检验符号检验3秩和检验法秩和检验法4.3 TTEST过程过程比较比较t检验检验4.3.1 TEST过程简介过程简介1TEST过程简介过程简介TTEST过程在一些假设条件下计算过程在一些假设条件下计算t统计量,统计量,用以检验用以检验“两组观测值均值相等两组观测值均值相等

6、”这个原这个原假设。假设条件有以下两点:假设。假设条件有以下两点:1)两组观测方差相等。)两组观测方差相等。2)在每个组内,各个观测独立,且服从相同)在每个组内,各个观测独立,且服从相同的正态分布。的正态分布。4.3 TTEST过程过程比较比较t检验检验如如果果两两组组观观测测方方差差不不等等,则则计计算算近近似似的的t统统计计量量,同同时时用用Satterhwaire方方法法计计算算其其近近似似自自由由度度,又又可可以以要要求求用用Cochran和和Cox方方法法近近似似 计计 算算 t检检 验验 的的 概概 率率 水水 平平。计计 算算F(Folded)统统计计量量用用于于检检验验两两个个

7、方方差差是是否否相相等等。TTEST过过程程不不是是为为成成对对数数据据比比较较设设计计的的,对对成成对对数数据据,可可用用MEANS过过程程或或UNIVERATE过过程程检检验验成成对对数数据据的的差差值值是是否为零,以判断成对数据均值是否相等。否为零,以判断成对数据均值是否相等。4.3.2 TTEST过程举例说明过程举例说明例例4.3 为了解某乡粮田土壤肥力的变化情况,为了解某乡粮田土壤肥力的变化情况,1998年和年和1999年连续两年对年连续两年对9个监测点进行个监测点进行取土样化验有机质含量。取土样化验有机质含量。y1代表代表1998年化年化验结果,该年土壤有机质平均含量为验结果,该年

8、土壤有机质平均含量为1.21%,y2代表代表1999年化验结果,分析两年间土年化验结果,分析两年间土壤有机质变化情况。壤有机质变化情况。SAS程序程序test4_3.sas输出结果简介:输出结果简介:For H0:Variances are equal,F=2.08 DF=(8,8)ProbF=0.3203从输出的最下方可知,两组变量来自同一方差总体。从输出的最下方可知,两组变量来自同一方差总体。T-Tests Variable Method Variances DF t Value Pr|t|x Pooled Equal 16 0.52 0.6127 x Satterthwaite Uneq

9、ual 14.2 0.52 0.6136 在方差相等的前提下,两组均值相等的概率为在方差相等的前提下,两组均值相等的概率为0.6127,所以,所以1998年和年和1999年间该乡土壤有机质含量没有大的变化,即年间该乡土壤有机质含量没有大的变化,即土壤肥力差异不明显。土壤肥力差异不明显。例例4.4 此试验的目的是看看与单纯繁殖相比,此试验的目的是看看与单纯繁殖相比,杂交能否显著提高肉鸡的生长速度。实验杂交能否显著提高肉鸡的生长速度。实验数据是在数据是在8周龄测得的体重(单位:克)。周龄测得的体重(单位:克)。SAS程序程序Ttest4_4.sas例例4.5 研究皱纹盘鲍卵受精时间对受精率及孵研究

10、皱纹盘鲍卵受精时间对受精率及孵化率的影响,其中化率的影响,其中a、b代表不同的受精时代表不同的受精时间,间,a:受精时间:受精时间0.5小时;小时;b:受精时间:受精时间1.0小时;每组有小时;每组有8个试验组,则数据集有个试验组,则数据集有16个个观测,观测值均为百分数,请分析在不同观测,观测值均为百分数,请分析在不同的受精时间下,对海产单壳经济水产品皱的受精时间下,对海产单壳经济水产品皱纹盘鲍卵的孵化率是否有显著差异,以确纹盘鲍卵的孵化率是否有显著差异,以确定人工繁殖时的受精时间,提高孵化率。定人工繁殖时的受精时间,提高孵化率。SAS程序程序Ttest4_5.sas例例4.5结果说明:结果

11、说明:从从t检验输出结果可以看出:方差相等的假设是不合理的,方检验输出结果可以看出:方差相等的假设是不合理的,方差相等假设成立的概率仅为差相等假设成立的概率仅为0.0594。双边检验。双边检验F值(大方值(大方差除以小方差)为差除以小方差)为4.67,所以应该使用方差不相等的检验。,所以应该使用方差不相等的检验。从而采用从而采用Unequel一行的一行的t值、值、DF和概率。和概率。通过通过t检验结果得出,受精时间为检验结果得出,受精时间为0.5h和受精时间为和受精时间为1.0h的两的两个试验组在孵化率上有显著的差异,概率水平为个试验组在孵化率上有显著的差异,概率水平为0.0022。受精时间为

12、受精时间为0.5h的皱纹盘鲍卵的孵化率显著高于受精时间的皱纹盘鲍卵的孵化率显著高于受精时间为为1.0h的皱纹盘鲍卵的孵化率。的皱纹盘鲍卵的孵化率。但对于两组变量,当方差不等,且样本数小于但对于两组变量,当方差不等,且样本数小于30时,应采用时,应采用非参数检验,否则可能得出错误的结论。建议使用后面讲非参数检验,否则可能得出错误的结论。建议使用后面讲到的到的Npar1way过程进行非参数检验。过程进行非参数检验。4.4 NPAR1WAY过程(非参数检验过程)过程(非参数检验过程)1NPAR1WAY过程简介过程简介NPAR1WAY过程是基于经验分布函数(过程是基于经验分布函数(EDF)和跨过单向)

13、和跨过单向分类的因变量的秩得分,计算出几个统计量,用以检验变分类的因变量的秩得分,计算出几个统计量,用以检验变量的分布在跨过不同组时有相同的位置参数。秩得分包括量的分布在跨过不同组时有相同的位置参数。秩得分包括Wilcoxon得分,中位数得分,得分,中位数得分,Savage得分和得分和Van der Waerden得分。关于这些得分的说明请参考有关非参数检得分。关于这些得分的说明请参考有关非参数检验的统计书。验的统计书。NPAR1WAY过程语句过程语句 PROC NPAR1WAY 选择项选择项;CLASS 变量列表变量列表;BY 变量列表变量列表;VAR 变量列表变量列表;RUN;4.4.2

14、NPAR1WAY过程举例说明过程举例说明例例4.6 将例将例4.5用用NPAR1WAY过程进行非参数检验。过程进行非参数检验。SAS程序程序Npar1way4_6.sasdata npar1way4_6;input time$fuhualv ;cards;a 73 a 65 a 72 a 65 a 64 a 77 a 71 a 66b 59 b 64 b 61 b 63 b 64 b 61 b 62 b 58;proc npar1way;class time;var fuhualv;title fuhualv ;run;结果说明:通过多种方法的比较与检验,两组数据结果说明:通过多种方法的比较与

15、检验,两组数据都存在显著差异,即受精时间为都存在显著差异,即受精时间为0.5h和受精时间和受精时间为为1.0h的两个试验组在孵化率上有显著的差异。的两个试验组在孵化率上有显著的差异。受精时间为受精时间为0.5h的皱纹盘鲍卵的孵化率显著高于的皱纹盘鲍卵的孵化率显著高于受精时间为受精时间为1.0h的皱纹盘鲍卵的孵化率。的皱纹盘鲍卵的孵化率。虽然与虽然与t检验在方差不等的前提下得到的结论相同,检验在方差不等的前提下得到的结论相同,但通过进行多种非参数检验,结论更有说服力,但通过进行多种非参数检验,结论更有说服力,且显著水平也明显高于且显著水平也明显高于t检验的结果。检验的结果。Kruskal Wal

16、lis卡方检验的显著水平为卡方检验的显著水平为0.0011,Van der Waerden法的显著水平为法的显著水平为0.0017。均高于。均高于0.0022,说明对于这种数据,采用非参数检验,统计结果说明对于这种数据,采用非参数检验,统计结果更精确。因此根据数据特点选择合适的方法进行更精确。因此根据数据特点选择合适的方法进行统计分析,有助于我们得到科学而准确的结论。统计分析,有助于我们得到科学而准确的结论。例例4.7数据来源:中国农大昌平试验站用数据来源:中国农大昌平试验站用a、b两种饲两种饲料对香猪进行饲养试验。每组料对香猪进行饲养试验。每组6头香猪,两组共有头香猪,两组共有12个观测值。

17、数据是个观测值。数据是6周时每头香猪的增重结果,周时每头香猪的增重结果,单位:单位:Kg。分析这两种饲料对香猪的增重有无差。分析这两种饲料对香猪的增重有无差异。增重数据如下:异。增重数据如下:a种饲料:种饲料:6.65 6.35 7.05 7.90 8.04 4.45b种饲料:种饲料:5.34 7.00 7.89 7.05 6.74 7.28由于试验样本小,应采用非参数检验方法进行检验。由于试验样本小,应采用非参数检验方法进行检验。SAS程序程序Npar1way4_7.sas结果说明:结果说明:其中其中Chi-Square 是卡方是卡方 2统计量,统计量,Kruskal-Wallis 检验的检

18、验的Chi-Square=0.0064,Prob Chi-Square=0.9361,大于,大于0.05,卡方检验不显著,即,卡方检验不显著,即用用a、b两种饲料饲喟香猪对香猪的增重效果没有两种饲料饲喟香猪对香猪的增重效果没有差异,两种饲料的增重效果一样。差异,两种饲料的增重效果一样。这个试验数据计算出的概率值为这个试验数据计算出的概率值为1.0,有些特殊,通,有些特殊,通常我们处理的数据不会这样。常我们处理的数据不会这样。如果使用如果使用TTEST过程对这组数据进行检验,也得到过程对这组数据进行检验,也得到两种饲料对香猪的增重效果无差异的结论。但是两种饲料对香猪的增重效果无差异的结论。但是对

19、于小样本的试验数据应选择非参数检验方法进对于小样本的试验数据应选择非参数检验方法进行统计分析,否则得到的结论的可信度会受到质行统计分析,否则得到的结论的可信度会受到质疑。疑。4.5 综合应用综合应用4.5.1 配对数据配对数据的统计分析的统计分析配对试验设计配对试验设计进行单因素进行单因素2水平试验设计时,对同一个指标观测水平试验设计时,对同一个指标观测2个数据,个数据,这这2个数据来自同个数据来自同1个受试对象或来自非常相同个受试对象或来自非常相同(对重要对重要的非处理因素而言的非处理因素而言)的的2个受试对象,故把这个受试对象,故把这2个数据看个数据看作一对。这种设计称为作一对。这种设计称

20、为配对设计配对设计。根据每对数据所对应的具体条件,可将根据每对数据所对应的具体条件,可将配对设计配对设计分为以下分为以下3种:种:自身自身配对设计配对设计:每对数据测量来自同一个受试对象。:每对数据测量来自同一个受试对象。同源同源配对设计配对设计:每对数据测量来自同一窝:每对数据测量来自同一窝(或胎或胎)的的2个受试个受试对象。对象。条件相近者条件相近者配对设计配对设计:每对数据测量来自条件:每对数据测量来自条件(指最重要的指最重要的非处理因素非处理因素)相近的相近的2个受试对象。个受试对象。结果说明:结果说明:第第1部分是对差量算出的各种简单样本统计量的值。部分是对差量算出的各种简单样本统计

21、量的值。如如均数均数=7.59,标准差标准差=4.38。第。第2部分是有关统计部分是有关统计检验的结果。先看差量是否服从正态分布,零假检验的结果。先看差量是否服从正态分布,零假设是差量服从正态分布,备择假设是差量不服从设是差量服从正态分布,备择假设是差量不服从正态分布。正态分布。W=0.970391,P=0.8944,大于,大于0.05,接受零假设。应该用关于差量的接受零假设。应该用关于差量的总体均数总体均数为零的为零的t检验的结果:检验的结果:t=5.47,P=0.0004,拒绝,拒绝Ho:差量:差量均数为零的假设。结论为:服这种亲朋药前后对均数为零的假设。结论为:服这种亲朋药前后对病人体内

22、的病人体内的Baci含量有显著影响,这种药对治疗含量有显著影响,这种药对治疗腹泻有较好的效果。腹泻有较好的效果。(提示:如果差量不服从正态分布,则应该用符号(提示:如果差量不服从正态分布,则应该用符号秩秩(Sgn Rank)检验的结果,即参照检验的结果,即参照Sign M Pr=|M|一行的结论。)一行的结论。)4.5.2 成组试验数据的成组试验数据的统计分析统计分析1.单因素双水平随机试验设计单因素双水平随机试验设计2.检验方法的前提条件检验方法的前提条件对成组设计的试验数据进行检验分析之对成组设计的试验数据进行检验分析之前,要先判断试验数据是否满足以下前,要先判断试验数据是否满足以下2个个

23、前提条件:前提条件:1)正态性:各组数据应独立,且来自同一正)正态性:各组数据应独立,且来自同一正态态总体总体。2)方差齐性:)方差齐性:2组数据的组数据的总体方差总体方差应该相等。应该相等。例例4.10某植物营养实验室进行肥料对草坪颜某植物营养实验室进行肥料对草坪颜色质量的研究,选择两种肥料进行试验,色质量的研究,选择两种肥料进行试验,数据是两种肥料对草坪颜色的分数。分析数据是两种肥料对草坪颜色的分数。分析两种肥料对草坪颜色质量的影响是否有差两种肥料对草坪颜色质量的影响是否有差异。异。由于样本量小,应采用非参数检验。由于样本量小,应采用非参数检验。SAS程序程序npar1way4_10.sa

24、s以上是以上是NPAR1WAY过程的非参数秩和检验结果。过程的非参数秩和检验结果。Kruskal-Wallis卡方检验得:卡方检验得:Chi-Square=4.6933,p=0.303,两组秩和相等的概率小于,两组秩和相等的概率小于0.05,即,即两组秩和不等,两种肥料对草平颜色质量的影响两组秩和不等,两种肥料对草平颜色质量的影响有显著的差异。由秩和得分知:有显著的差异。由秩和得分知:f1肥料显著好于肥料显著好于f2肥料,在维护草平时建议推广使用肥料,在维护草平时建议推广使用f1肥料。肥料。由于样本量小,且数据不服从正态分布,故不能采由于样本量小,且数据不服从正态分布,故不能采用用t检验,应采用非参数的秩和检验。如果采用近检验,应采用非参数的秩和检验。如果采用近似似t检验,由输出的双尾检验结果得检验,由输出的双尾检验结果得p=0.0621,大,大小小0.05,两种肥料对草平颜色质量的影响无差异。,两种肥料对草平颜色质量的影响无差异。结论错误。结论错误。如果使用如果使用TTEST过程进行分析也会得到错误结论。过程进行分析也会得到错误结论。4.5.4 SAS/ASSIST中的中的t检验与非参检验与非参数检验数检验1、SAS/ASSIST中的中的TTEST检验检验选择菜单选择菜单Solutions/ASSIST,启动,启动ASSIST模模块。块。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服