非参数检验(卡方检验)-实验报告.doc

资源描述

1、评分大理大学实验报告课程名称生物医学统计分析实验名称非参数检验（卡方检验）专业班级姓名学号实验日期实验地点 20152016学年度第 2 学期一、实验目的对分类资料进行卡方检验。二、实验环境 1、硬件配置：处理器：Intel（R） Core(TM) i5-4210U CPU 1.7GHz 1.7GHz 安装内存（RAM）：4.00GB 系统类型：64位操作系统2、软件环境：IBM SPSS Statistics 19.0软件三、实验内容(包括本实验要完成的实验问题及需要的相关知识简单概述)（1）课本第六章的例6.1-6.5运行一遍，注意理解结果；（2）然后将实验指导

2、书的例1-4运行一遍，注意理解结果。四、实验结果与分析（包括实验原理、数据的准备、运行过程分析、源程序（代码）、图形图象界面等）例6.1表1 灭螨A和灭螨B杀灭大蜂螨效果的交叉制表效果合计杀灭未杀灭组别灭螨A321244灭螨B142236合计463480分析：表1是灭螨A和灭螨B杀灭大蜂螨效果的样本分类的频数分析表，即交叉列联表。表2 卡方检验X2值df渐进 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pearson 卡方9.277a1.002连续校正b7.9441.005似然比9.4191.002Fisher 的精确检验.003.002有效案例中的 N80a. 0 单元格

3、(.0%) 的期望计数少于 5。最小期望计数为 15.30。b. 仅对 2x2 表计算分析：表2是卡方检验的结果。因为两组各自的结果互不影响，即相互独立。对于这种频数表格式资料，在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量，才能进行卡方检验。 Pearson 卡方：皮尔逊卡方检验计算的卡方值（用于样本数n40且所有理论数E5）；连续校正b：连续性校正卡方值（df=1，只用于2*2列联表）；似然比：对数似然比法计算的卡方值（类似皮尔逊卡方检验）； Fisher 的精确检验:精确概率法计算的卡方值（用于理论数E5）。不同的资料应选用不同的卡方计算方法。例6.1为2*2列联表

4、，df=1，须用连续性校正公式，故采用“连续校正”行的统计结果。 X2=7.944，P（Sig）=0.0050.05,差异不显著，可以认为不同的治疗方法与治疗效果无关，即三种治疗方法对治疗效果的影响差异不显著。例6.3表5 灌溉方式* 稻叶情况交叉制表计数稻叶情况合计123灌溉方式114677160218391320531521416182合计4813036547分析：表5是灌溉方式* 稻叶情况资料分析的列联表。表6 卡方检验X2值df渐进 Sig. (双侧)Pearson 卡方5.622a4.229似然比5.5354.237线性和线性组合4.5101.034有效案例中的 N547a. 0

5、单元格(.0%) 的期望计数少于 5。最小期望计数为 8.78。分析：表6是卡方检验的结果。自由度df=4，样本数n=547。表格下方的注解表明理论次数小于5的格子数为0，最小的理论次数为8.78。各理论次数均大于5，无须进行连续性校正，因此可以采用第一行（Pearson 卡方）的检验结果，即X2=5.622，P=0.2290.05,差异不显著，即不同灌溉方式对稻叶情况的影响差异不显著。例6.4表7 场地* 奶牛类型交叉制表计数奶牛类型合计123场地115241251242713320131144合计393930108分析：表5是场地* 奶牛类型资料分析的列联表。表8 卡方检验X2值df渐进

6、 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)点概率Pearson 卡方9.199a4.056.056似然比8.8134.066.079Fisher 的精确检验8.463.072线性和线性组合.719b1.397.404.217.036有效案例中的 N108a. 3 单元格(33.3%) 的期望计数少于 5。最小期望计数为 3.61。b. 标准化统计量是 -.848。分析：表8是卡方检验的结果。自由度df=4，样本数n=108。表格下方的注解表明理论次数小于5的格子数为3，最小的理论次数为3.61。需采用精确概率法计算，即用第三行（Fisher 的精确检验）的检验结果，即X2

7、=8.463，P=0.0720.05,差异不显著，即3种奶牛牛场不同类型奶牛的构成比对差异不显著。例6.5表9 LPA* FA 交叉制表FA合计12LPA11701724711合计21728分析：表9是LPA* FA资料分析的列联表。表10 配对卡方检验值精确 Sig.(双侧)McNemar 检验.125a有效案例中的 N28a. 使用的二项式分布。分析：表10是LPA和FA两种检测方法的配对卡方检验。由于b+c0.05，差异不显著，即LPA法和FA法对番鸭细小病毒抗原的检出率差异不显著。表11 对称度量值渐进标准误差a近似值 Tb近似值 Sig.一致性度量Kappa.680.1403.79

8、8.000有效案例中的 N28a. 不假定零假设。b. 使用渐进标准误差假定零假设。分析：表11为LPA和FA两种检测结果的的一致性检验。Kappa值是内部一致性系数，除数据P值判断一致性有无统计学意义外，根据经验，Kappa0.75，表明两者一致性较好0.7Kappa0.4，表明一致性一般，Kappa0.4，则表明一致性较差。本例Kappa值为0.680，P=0.000Kappa0.4，表明一致性一般。例1表12 周内日频数表观察数期望数残差11116.0-5.021916.03.031716.01.041516.0-1.051516.0-1.061616.0.071916.03.0总数11

9、2分析：表12结果显示一周内各日死亡的理论数（Expected）为16.0，即一周内各日死亡均数；还算出实际死亡数与理论死亡数的差值（Residual）。表13 检验统计量周日卡方2.875adf6渐近显著性.824a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 16.0。分析：Chi-Square过程，调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验，主要用于分析实际频数与某理论频数是否相符。卡方值X2=2.875，自由度数（df）=6，P=0.8240.05，差异不显著，即可认为一周内各日的死亡危险性是相同的。例2表14 二项式检验类别N观察比

10、例检验比例精确显著性（双侧）性别组 1012.30.50.017组 2128.70总数401.00分析：调用Binomial过程可对样本资料进行二项分布分析。表14的二项分布检验表明，女婴12名，男婴28名，观察概率为0.70（即男婴占70%），检验概率为0.50，二项分布检验的结果是双侧概率为0.017，可认为男女比例的差异有高度显著性，即与通常0.5的性比例相比，该地男婴比女婴明显为多。例3表15 两组工人的血铅值及秩groupN秩均值秩和血铅值1105.9559.502713.3693.50总数17分析：Independent Samples过程：调用此过程可对两个独立样本的均数、中位数

11、、离散趋势、偏度等进行差异比较检验。有四种检验方法：Mann-Whitney U：主要用于判别两个独立样本所属的总体是否有相同的分布；Kolmogorov-Smirnov Z：推测两个样本是否来自具有相同分布的总体；Moses extreme reactions：检验两个独立样本之观察值的散布范围是否有差异存在，以检验两个样本是否来自具有同一分布的总体；Wald-Wolfowitz runs：考察两个独立样本是否来自具有相同分布的总体。表16 检验统计量b血铅值Mann-Whitney U4.500Wilcoxon W59.500Z-2.980渐近显著性(双侧).003精确显著性2*（单侧显著

12、性）.001aa. 没有对结进行修正。b. 分组变量: group分析：本例选Mann-Whitney U检验方法，表15结果表明，第1组的平均秩次（Mean Rank）为5.95，第2组的平均秩次为13.36，U = 4.5，W = 93.5，精确双侧概率P = 0.001，可认为铅作业组工人的血铅值高于非铅作业组。例4表17 group* effect 交叉制表计数effect合计无效有效group对照组217596实验组599104合计26174200分析：表17是group* effect资料分析的列联表。表18 卡方检验X2值df渐进 Sig. (双侧)精确 Sig.(双侧)精确 S

13、ig.(单侧)Pearson 卡方12.857a1.000连续校正b11.3921.001似然比13.5881.000Fisher 的精确检验.001.000有效案例中的 N200a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 12.48。b. 仅对 2x2 表计算分析：表18卡方检验资料n=20040 , 表格下方的注解表明理论次数小于5的格子数为0，最小的理论次数为12.48。,可取Pearson卡方值和似然比(Likelihood ratio)值 ,二者值分别为12.857和13.588,P0.01,试验组和对照组的疗效差别有统计学意义,可认为异梨醇口服液降低颅内压的疗效

14、优于氢氯噻嗪 + 地塞米松。五、实验小结：（包括主要实验问题的最终结果描述、详细的收获体会，待解决的问题等）在此次实验中，由于实验内容更贴近生活应用，因此比起上学期，我们更容易领悟该程序的表达，只是在细节方面还是很容易出错，甚至不容易拐过弯来。但经过此次实验，我们懂得要学着从复杂的程序中剥茧抽丝，把程序尽可能的简单化。在实验中应注意的点：1.因为两组各自的结果互不影响，即相互独立。对于这种频数表格式资料，在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量，才能进行卡方检验。 2. Pearson 卡方：皮尔逊卡方检验计算的卡方值（用于样本数n40且所有理论数E5）；连续校正b：连续性校正卡方值（df=1，只用于2*2列联表）；似然比：对数似然比法计算的卡方值（类似皮尔逊卡方检验）； Fisher 的精确检验:精确概率法计算的卡方值（用于理论数E5）。不同的资料应选用不同的卡方计算方法。3.有列联表用于描述分析的卡方检验，而其它用于非参数检验是对拟合优度的检验。4.有计数用加权个数，是具体数值，如例3，则不用加权，因为两组数据长度不同，用独立性检验，不知道总体分布情况，所有用非参数检验，要是假设它为正态分布，也可以用卡方检验。 5.描述统计里的交叉表的行、列选择可以互换，互换只是转置，不影响最后的结果。手写签名：

展开阅读全文