1、评分大理大学实验报告 课程名称 生物医学统计分析 实验名称 非参数检验(卡方检验) 专业班级 姓 名 学 号 实验日期 实验地点 20152016学年度第 2 学期一、 实验目的对分类资料进行卡方检验。二、实验环境 1、硬件配置:处理器:Intel(R) Core(TM) i5-4210U CPU 1.7GHz 1.7GHz 安装内存(RAM):4.00GB 系统类型:64位操作系统2、软件环境:IBM SPSS Statistics 19.0软件三、实验内容(包括本实验要完成的实验问题及需要的相关知识简单概述)(1) 课本第六章的例6.1-6.5运行一遍,注意理解结果;(2) 然后将实验指导
2、书的例1-4运行一遍,注意理解结果。四、实验结果与分析 (包括实验原理、数据的准备、运行过程分析、源程序(代码)、图形图象界面等)例6.1表1 灭螨A和灭螨B杀灭大蜂螨效果的交叉制表效果合计杀灭未杀灭组别灭螨A321244灭螨B142236合计463480分析:表1是灭螨A和灭螨B杀灭大蜂螨效果的样本分类的频数分析表,即交叉列联表。表2 卡方检验X2值df渐进 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pearson 卡方9.277a1.002连续校正b7.9441.005似然比9.4191.002Fisher 的精确检验.003.002有效案例中的 N80a. 0 单元格
3、(.0%) 的期望计数少于 5。最小期望计数为 15.30。b. 仅对 2x2 表计算分析:表2是卡方检验的结果。因为两组各自的结果互不影响,即相互独立。对于这种频数表格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。 Pearson 卡方:皮尔逊卡方检验计算的卡方值(用于样本数n40且所有理论数E5); 连续校正b:连续性校正卡方值(df=1,只用于2*2列联表); 似然比:对数似然比法计算的卡方值(类似皮尔逊卡方检验); Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E5)。 不同的资料应选用不同的卡方计算方法。 例6.1为2*2列联表
4、,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=7.944,P(Sig)=0.0050.05,差异不显著,可以认为不同的治疗方法与治疗效果无关,即三种治疗方法对治疗效果的影响差异不显著。例6.3表5 灌溉方式* 稻叶情况 交叉制表计数稻叶情况合计123灌溉方式114677160218391320531521416182合计4813036547分析:表5是灌溉方式* 稻叶情况资料分析的列联表。表6 卡方检验X2值df渐进 Sig. (双侧)Pearson 卡方5.622a4.229似然比5.5354.237线性和线性组合4.5101.034有效案例中的 N547a. 0
5、单元格(.0%) 的期望计数少于 5。最小期望计数为 8.78。分析:表6是卡方检验的结果。自由度df=4,样本数n=547。表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为8.78。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)的检验结果,即X2=5.622,P=0.2290.05,差异不显著,即不同灌溉方式对稻叶情况的影响差异不显著。例6.4表7 场地* 奶牛类型 交叉制表计数奶牛类型合计123场地115241251242713320131144合计393930108分析:表5是场地* 奶牛类型资料分析的列联表。表8 卡方检验X2值df渐进
6、 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)点概率Pearson 卡方9.199a4.056.056似然比8.8134.066.079Fisher 的精确检验8.463.072线性和线性组合.719b1.397.404.217.036有效案例中的 N108a. 3 单元格(33.3%) 的期望计数少于 5。最小期望计数为 3.61。b. 标准化统计量是 -.848。分析:表8是卡方检验的结果。自由度df=4,样本数n=108。表格下方的注解表明理论次数小于5的格子数为3,最小的理论次数为3.61。需采用精确概率法计算,即用第三行(Fisher 的精确检验)的检验结果,即X2
7、=8.463,P=0.0720.05,差异不显著,即3种奶牛牛场不同类型奶牛的构成比对差异不显著。例6.5表9 LPA* FA 交叉制表FA合计12LPA11701724711合计21728分析:表9是LPA* FA资料分析的列联表。表10 配对卡方检验值精确 Sig.(双侧)McNemar 检验.125a有效案例中的 N28a. 使用的二项式分布。分析: 表10是LPA和FA两种检测方法的配对卡方检验。由于b+c0.05,差异不显著,即LPA法和FA法对番鸭细小病毒抗原的检出率差异不显著。表11 对称度量值渐进标准误差a近似值 Tb近似值 Sig.一致性度量Kappa.680.1403.79
8、8.000有效案例中的 N28a. 不假定零假设。b. 使用渐进标准误差假定零假设。分析:表11为LPA和FA两种检测结果的的一致性检验。Kappa值是内部一致性系数,除数据P值判断一致性有无统计学意义外,根据经验,Kappa0.75,表明两者一致性较好0.7Kappa0.4,表明一致性一般,Kappa0.4,则表明一致性较差。本例Kappa值为0.680,P=0.000Kappa0.4,表明一致性一般。例1表12 周内日频数表观察数期望数残差11116.0-5.021916.03.031716.01.041516.0-1.051516.0-1.061616.0.071916.03.0总数11
9、2分析:表12结果显示一周内各日死亡的理论数(Expected)为16.0,即一周内各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual)。表13 检验统计量周日卡方2.875adf6渐近显著性.824a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 16.0。分析:Chi-Square过程,调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验,主要用于分析实际频数与某理论频数是否相符。卡方值X2=2.875,自由度数(df)=6,P=0.8240.05,差异不显著,即可认为一周内各日的死亡危险性是相同的。例2表14 二项式检验类别N观察比
10、例检验比例精确显著性(双侧)性别组 1012.30.50.017组 2128.70总数401.00分析:调用Binomial过程可对样本资料进行二项分布分析。表14的二项分布检验表明,女婴12名,男婴28名,观察概率为0.70(即男婴占70%),检验概率为0.50,二项分布检验的结果是双侧概率为0.017,可认为男女比例的差异有高度显著性,即与通常0.5的性比例相比,该地男婴比女婴明显为多。例3表15 两组工人的血铅值及秩groupN秩均值秩和血铅值1105.9559.502713.3693.50总数17分析:Independent Samples过程:调用此过程可对两个独立样本的均数、中位数
11、、离散趋势、偏度等进行差异比较检验。有四种检验方法:Mann-Whitney U:主要用于判别两个独立样本所属的总体是否有相同的分布;Kolmogorov-Smirnov Z:推测两个样本是否来自具有相同分布的总体;Moses extreme reactions:检验两个独立样本之观察值的散布范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体;Wald-Wolfowitz runs:考察两个独立样本是否来自具有相同分布的总体。表16 检验统计量b血铅值Mann-Whitney U4.500Wilcoxon W59.500Z-2.980渐近显著性(双侧).003精确显著性2*(单侧显著
12、性).001aa. 没有对结进行修正。b. 分组变量: group分析:本例选Mann-Whitney U检验方法,表15结果表明,第1组的平均秩次(Mean Rank)为5.95,第2组的平均秩次为13.36,U = 4.5,W = 93.5,精确双侧概率P = 0.001,可认为铅作业组工人的血铅值高于非铅作业组。例4表17 group* effect 交叉制表计数effect合计无效有效group对照组217596实验组599104合计26174200分析:表17是group* effect资料分析的列联表。表18 卡方检验X2值df渐进 Sig. (双侧)精确 Sig.(双侧)精确 S
13、ig.(单侧)Pearson 卡方12.857a1.000连续校正b11.3921.001似然比13.5881.000Fisher 的精确检验.001.000有效案例中的 N200a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 12.48。b. 仅对 2x2 表计算分析:表18卡方检验资料n=20040 , 表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为12.48。,可取Pearson卡方值和似然比(Likelihood ratio)值 ,二者值分别为12.857和13.588,P0.01,试验组和对照组的疗效差别有统计学意义,可认为异梨醇口服液降低颅内压的疗效
14、优于氢氯噻嗪 + 地塞米松。 五、实验小结: (包括主要实验问题的最终结果描述、详细的收获体会,待解决的问题等)在此次实验中,由于实验内容更贴近生活应用,因此比起上学期,我们更容易领悟该程序的表达,只是在细节方面还是很容易出错,甚至不容易拐过弯来。但经过此次实验,我们懂得要学着从复杂的程序中剥茧抽丝,把程序尽可能的简单化。 在实验中应注意的点:1.因为两组各自的结果互不影响,即相互独立。对于这种频数表格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。 2. Pearson 卡方:皮尔逊卡方检验计算的卡方值(用于样本数n40且所有理论数E5); 连续校正b:连续性校正卡方值(df=1,只用于2*2列联表); 似然比:对数似然比法计算的卡方值(类似皮尔逊卡方检验); Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E5)。 不同的资料应选用不同的卡方计算方法。3.有列联表用于描述分析的卡方检验,而其它用于非参数检验是对拟合优度的检验。4.有计数用加权个数,是具体数值,如例3,则不用加权,因为两组数据长度不同,用独立性检验,不知道总体分布情况,所有用非参数检验,要是假设它为正态分布,也可以用卡方检验。 5.描述统计里的交叉表的行、列选择可以互换,互换只是转置,不影响最后的结果。手写签名: