资源描述
1第八章第八章第八章第八章 计数资料的统计分析计数资料的统计分析计数资料的统计分析计数资料的统计分析上海交通大学医学院生物统计学教研室上海交通大学医学院生物统计学教研室上海交通大学医学院生物统计学教研室上海交通大学医学院生物统计学教研室张莉娜张莉娜张莉娜张莉娜分机分机分机分机医学统计学2资料类型资料类型资料类型资料类型(回顾回顾回顾回顾)?癌症分期癌症分期癌症分期癌症分期有序多分类变量有序多分类变量有序多分类变量有序多分类变量等级资料等级资料等级资料等级资料Ranked dataRanked dataRanked dataRanked data性别性别性别性别职业职业职业职业分类变量分类变量分类变量分类变量(二分类变量二分类变量二分类变量二分类变量、无序多分类变量无序多分类变量无序多分类变量无序多分类变量)计数资料计数资料计数资料计数资料enumeration data身高身高身高身高数值变量数值变量数值变量数值变量计量资料计量资料计量资料计量资料measurement data示例示例示例示例(指标指标指标指标)随机变量分类随机变量分类随机变量分类随机变量分类资料的类型资料的类型资料的类型资料的类型3第一节第一节第一节第一节相对数相对数相对数相对数将观察单位按某种将观察单位按某种将观察单位按某种将观察单位按某种属性和类别属性和类别属性和类别属性和类别分组后分组后分组后分组后,计数得到计数得到计数得到计数得到各组观察单位数的资料称为计数资料各组观察单位数的资料称为计数资料各组观察单位数的资料称为计数资料各组观察单位数的资料称为计数资料。?调查调查调查调查1483148314831483例居民例居民例居民例居民,发现钩虫感染者发现钩虫感染者发现钩虫感染者发现钩虫感染者144144144144例例例例,未感未感未感未感染者染者染者染者1339133913391339例例例例。这些数据称为这些数据称为这些数据称为这些数据称为绝对数绝对数绝对数绝对数。?相对数相对数相对数相对数是两个有联系的是两个有联系的是两个有联系的是两个有联系的指标之比指标之比指标之比指标之比,按用途与性按用途与性按用途与性按用途与性质可分为率质可分为率质可分为率质可分为率、构成比构成比构成比构成比、相对比等相对比等相对比等相对比等。其中其中其中其中率和构成比率和构成比率和构成比率和构成比是计数资料的主要描述性指标是计数资料的主要描述性指标是计数资料的主要描述性指标是计数资料的主要描述性指标。4一一一一、率率率率(rate)(rate)(rate)(rate)是一个具有是一个具有是一个具有是一个具有时期概念时期概念时期概念时期概念的比的比的比的比,用于说明用于说明用于说明用于说明某某某某一时期内一时期内一时期内一时期内某种现象发生的频率或强度某种现象发生的频率或强度某种现象发生的频率或强度某种现象发生的频率或强度,其公式为其公式为其公式为其公式为:某时期内发生某事件的观察单位数某时期内发生某事件的观察单位数某时期内发生某事件的观察单位数某时期内发生某事件的观察单位数该时期开始时暴露的观察单位数该时期开始时暴露的观察单位数该时期开始时暴露的观察单位数该时期开始时暴露的观察单位数?常见常见常见常见:生存率生存率生存率生存率、发病率等发病率等发病率等发病率等。用率的指标时用率的指标时用率的指标时用率的指标时,应说明观察时期的时间单位应说明观察时期的时间单位应说明观察时期的时间单位应说明观察时期的时间单位。二二二二、构成比构成比构成比构成比(proportion)(proportion)(proportion)(proportion)表示事物或现象内部各构成表示事物或现象内部各构成表示事物或现象内部各构成表示事物或现象内部各构成部分的比重部分的比重部分的比重部分的比重。通常以通常以通常以通常以100100100100作为比例基数作为比例基数作为比例基数作为比例基数,故常称为百分故常称为百分故常称为百分故常称为百分比比比比事物内部事物内部事物内部事物内部某一构成部分某一构成部分某一构成部分某一构成部分的观察单位数的观察单位数的观察单位数的观察单位数事物内部事物内部事物内部事物内部各组成部分各组成部分各组成部分各组成部分的观察的观察的观察的观察单位总数单位总数单位总数单位总数?如性别的构成比如性别的构成比如性别的构成比如性别的构成比,病种的构成比病种的构成比病种的构成比病种的构成比,职业的构成比等职业的构成比等职业的构成比等职业的构成比等率与构成比率与构成比率与构成比率与构成比率率率率构成比构成比构成比构成比5某地某年居民钩虫感染人数某地某年居民钩虫感染人数某地某年居民钩虫感染人数某地某年居民钩虫感染人数100%144/1483=9.71%1441483合计合计合计合计18/144=12.50%18/206=8.47%18206=5078/144=54.17%78/824=9.47%78824154948/144=33.33%48/453=10.60%48453014钩虫感染钩虫感染钩虫感染钩虫感染者的年龄者的年龄者的年龄者的年龄构成比构成比构成比构成比各年龄段各年龄段各年龄段各年龄段的钩虫感的钩虫感的钩虫感的钩虫感染率染率染率染率感染人数感染人数感染人数感染人数检查人数检查人数检查人数检查人数年龄组年龄组年龄组年龄组(岁岁岁岁)6三三三三、相对比相对比相对比相对比(relative ratio)简称比简称比简称比简称比,可以是两个有关的同类指标之比可以是两个有关的同类指标之比可以是两个有关的同类指标之比可以是两个有关的同类指标之比,也可也可也可也可以是不同性质的指标之比以是不同性质的指标之比以是不同性质的指标之比以是不同性质的指标之比,常以倍数或百分数表示常以倍数或百分数表示常以倍数或百分数表示常以倍数或百分数表示。相对比相对比相对比相对比甲指标甲指标甲指标甲指标/乙指标乙指标乙指标乙指标(甲乙指标值可以是绝对值甲乙指标值可以是绝对值甲乙指标值可以是绝对值甲乙指标值可以是绝对值,相对数或平均数相对数或平均数相对数或平均数相对数或平均数)使用相对数时必须注意使用相对数时必须注意使用相对数时必须注意使用相对数时必须注意:(1 1 1 1)计算率时计算率时计算率时计算率时,分母不能太小分母不能太小分母不能太小分母不能太小。一般地说数量越多一般地说数量越多一般地说数量越多一般地说数量越多,算得的率越稳定算得的率越稳定算得的率越稳定算得的率越稳定,其意义也较大其意义也较大其意义也较大其意义也较大,例数较少时例数较少时例数较少时例数较少时,最好以绝最好以绝最好以绝最好以绝对数字表示对数字表示对数字表示对数字表示,例如例如例如例如“2 2 2 2个人中治愈个人中治愈个人中治愈个人中治愈1 1 1 1人人人人”,不宜写成治愈率为不宜写成治愈率为不宜写成治愈率为不宜写成治愈率为50%50%50%50%。(2 2 2 2)构成比和率是两个不同的相对数构成比和率是两个不同的相对数构成比和率是两个不同的相对数构成比和率是两个不同的相对数,用途不一样用途不一样用途不一样用途不一样,不不不不能混淆能混淆能混淆能混淆。最容易犯的错误是把构成比当作率来用最容易犯的错误是把构成比当作率来用最容易犯的错误是把构成比当作率来用最容易犯的错误是把构成比当作率来用。27(3 3 3 3)当各组例数不相等时当各组例数不相等时当各组例数不相等时当各组例数不相等时,计算几个率的平均率时计算几个率的平均率时计算几个率的平均率时计算几个率的平均率时,不能将几个率相加再求平均数不能将几个率相加再求平均数不能将几个率相加再求平均数不能将几个率相加再求平均数,而应以总的发生例数除而应以总的发生例数除而应以总的发生例数除而应以总的发生例数除以总的可能发生例数以总的可能发生例数以总的可能发生例数以总的可能发生例数。(4 4 4 4)用率作比较时用率作比较时用率作比较时用率作比较时,应注意其可比性应注意其可比性应注意其可比性应注意其可比性。应审慎思考影应审慎思考影应审慎思考影应审慎思考影响的因素响的因素响的因素响的因素,不能凭表面数值贸然下结论不能凭表面数值贸然下结论不能凭表面数值贸然下结论不能凭表面数值贸然下结论。对于内部构成对于内部构成对于内部构成对于内部构成不同的两个率不同的两个率不同的两个率不同的两个率,应先作标准化处理应先作标准化处理应先作标准化处理应先作标准化处理,才能进行比较才能进行比较才能进行比较才能进行比较,这这这这称为率的标准化称为率的标准化称为率的标准化称为率的标准化,经标准化后的率称为经标准化后的率称为经标准化后的率称为经标准化后的率称为标准化率标准化率标准化率标准化率(standardized rate)(standardized rate)(standardized rate)(standardized rate),有直接法和间接法两种计算方有直接法和间接法两种计算方有直接法和间接法两种计算方有直接法和间接法两种计算方法法法法。8例例例例8.2 8.2 8.2 8.2 甲乙两县的食管癌死亡率如下甲乙两县的食管癌死亡率如下甲乙两县的食管癌死亡率如下甲乙两县的食管癌死亡率如下:8.2 8.2 8.2 8.2 甲甲甲甲、乙两县人口数与食管癌死亡人数及病死率乙两县人口数与食管癌死亡人数及病死率乙两县人口数与食管癌死亡人数及病死率乙两县人口数与食管癌死亡人数及病死率(1/(1/(1/(1/十万十万十万十万)81.481.481.481.435335335335343371743371743371743371778.678.678.678.6452452452452575133575133575133575133合计合计合计合计673.6673.6673.6673.69898989814548145481454814548649.4649.4649.4649.4707070701078010780107801078070707070526.6526.6526.6526.612212212212223167231672316723167650.4650.4650.4650.41631631631632506025060250602506060606060297.2297.2297.2297.29999999933309333093330933309359.8359.8359.8359.8151151151151419704197041970419705050505071.671.671.671.62929292940488404884048840488100.2100.2100.2100.255555555549105491054910549104040404010.110.110.110.14 4 4 43944339443394433944317.317.317.317.31111111163436634366343663436303030300.40.40.40.41 1 1 12827622827622827622827620.50.50.50.52 2 2 23789773789773789773789770 0 0 0病死率病死率病死率病死率死亡数死亡数死亡数死亡数人口数人口数人口数人口数病死率病死率病死率病死率死亡数死亡数死亡数死亡数人口数人口数人口数人口数乙县乙县乙县乙县甲县甲县甲县甲县年龄组年龄组年龄组年龄组(岁岁岁岁)上表中上表中上表中上表中(除除除除70707070年龄组外年龄组外年龄组外年龄组外)在各个年龄组内甲县的病死率都比乙县高在各个年龄组内甲县的病死率都比乙县高在各个年龄组内甲县的病死率都比乙县高在各个年龄组内甲县的病死率都比乙县高,但总的但总的但总的但总的病死率却是乙县高病死率却是乙县高病死率却是乙县高病死率却是乙县高,似乎很矛盾似乎很矛盾似乎很矛盾似乎很矛盾。这是由于两县年龄构成不一致这是由于两县年龄构成不一致这是由于两县年龄构成不一致这是由于两县年龄构成不一致,而且年龄越大而且年龄越大而且年龄越大而且年龄越大食管癌病死率越高食管癌病死率越高食管癌病死率越高食管癌病死率越高,而乙县中而乙县中而乙县中而乙县中70707070岁组构成比较高岁组构成比较高岁组构成比较高岁组构成比较高,造成总的病死率反而高于甲造成总的病死率反而高于甲造成总的病死率反而高于甲造成总的病死率反而高于甲县县县县。因此需将两县内部年龄构成调整成一致后因此需将两县内部年龄构成调整成一致后因此需将两县内部年龄构成调整成一致后因此需将两县内部年龄构成调整成一致后,计算标准化死亡率计算标准化死亡率计算标准化死亡率计算标准化死亡率。9一一一一、直接法直接法直接法直接法:选择甲选择甲选择甲选择甲、乙两县所属地区的数乙两县所属地区的数乙两县所属地区的数乙两县所属地区的数据作为标准组据作为标准组据作为标准组据作为标准组。表表表表8.3 8.3 8.3 8.3 标准组的人口数和食管癌死亡数及病死率标准组的人口数和食管癌死亡数及病死率标准组的人口数和食管癌死亡数及病死率标准组的人口数和食管癌死亡数及病死率(1/(1/(1/(1/十万十万十万十万)71.871.871.871.844184418441844186152992 6152992 6152992 6152992 合计合计合计合计580.2580.2580.2580.2123912391239123921352921352921352921352970707070465.0465.0465.0465.0164816481648164835442135442135442135442160606060210.3210.3210.3210.310431043104310434960114960114960114960115050505075.275.275.275.2413413413413548990548990548990548990404040409.69.69.69.655555555570014570014570014570014303030300.50.50.50.52020202039700273970027397002739700270 0 0 0食管癌病死率食管癌病死率食管癌病死率食管癌病死率(1/101/101/101/10万万万万)食管癌死亡数食管癌死亡数食管癌死亡数食管癌死亡数人口数人口数人口数人口数年龄组年龄组年龄组年龄组(岁岁岁岁)10表表表表8.4 8.4 8.4 8.4 按标准组人口构成用直接法计算标准化率按标准组人口构成用直接法计算标准化率按标准组人口构成用直接法计算标准化率按标准组人口构成用直接法计算标准化率。5244.285244.285244.285244.286145.016145.016145.016145.016152992615299261529926152992合计合计合计合计1438.331438.331438.331438.33673.6673.6673.6673.61386.661386.661386.661386.66649.4649.4649.4649.4213529213529213529213529707070701866.381866.381866.381866.38526.6526.6526.6526.62305.152305.152305.152305.15650.4650.4650.4650.4354421354421354421354421606060601474.141474.141474.141474.14297.2297.2297.2297.21784.651784.651784.651784.65359.8359.8359.8359.849601149601149601149601150505050391.98391.98391.98391.9871.671.671.671.6550.09550.09550.09550.09100.2100.2100.2100.25489905489905489905489904040404057.5757.5757.5757.5710.110.110.110.198.6198.6198.6198.6117.317.317.317.35700145700145700145700143030303015.8815.8815.8815.880.40.40.40.419.8519.8519.8519.850.50.50.50.539700273970027397002739700270 0 0 0期望死亡人期望死亡人期望死亡人期望死亡人数数数数病死率病死率病死率病死率(1/101/101/101/10万万万万)期望死亡人数期望死亡人数期望死亡人数期望死亡人数病死率病死率病死率病死率(1/101/101/101/10万万万万)乙县乙县乙县乙县甲县甲县甲县甲县标准组标准组标准组标准组人口数人口数人口数人口数年龄组年龄组年龄组年龄组(岁岁岁岁)甲县食管癌标准化病死率甲县食管癌标准化病死率甲县食管癌标准化病死率甲县食管癌标准化病死率=6145.01/6152992=99.9(1/10=6145.01/6152992=99.9(1/10=6145.01/6152992=99.9(1/10=6145.01/6152992=99.9(1/10万万万万)乙县食管癌标准化病死率乙县食管癌标准化病死率乙县食管癌标准化病死率乙县食管癌标准化病死率=5244.28/6152992=85.2(1/10=5244.28/6152992=85.2(1/10=5244.28/6152992=85.2(1/10=5244.28/6152992=85.2(1/10万万万万)11二二二二、间接法间接法间接法间接法:用标准组的食管癌病死率用标准组的食管癌病死率用标准组的食管癌病死率用标准组的食管癌病死率作为标准作为标准作为标准作为标准。表表表表8.5 8.5 8.5 8.5 按标准组食管癌的病死率按标准组食管癌的病死率按标准组食管癌的病死率按标准组食管癌的病死率,用间接法计算标准化率用间接法计算标准化率用间接法计算标准化率用间接法计算标准化率297.84297.84297.84297.84316.61316.61316.61316.6171.871.871.871.8合计合计合计合计84.4184.4184.4184.411454814548145481454862.5562.5562.5562.5510780107801078010780580.2580.2580.2580.270707070170.73170.73170.73170.7323167231672316723167116.53116.53116.53116.5325060250602506025060465.0465.0465.0465.06060606070.0570.0570.0570.053330933309333093330988.2688.2688.2688.2641970419704197041970210.3210.3210.3210.35050505030.4530.4530.4530.454048840488404884048841.2941.2941.2941.295491054910549105491075.275.275.275.2404040403.793.793.793.79394433944339443394436.096.096.096.09634366343663436634369.69.69.69.6303030301.411.411.411.412827622827622827622827621.891.891.891.893789773789773789773789770.50.50.50.50 0 0 0期望期望期望期望死亡人数死亡人数死亡人数死亡人数人口数人口数人口数人口数期望期望期望期望死亡人数死亡人数死亡人数死亡人数人口数人口数人口数人口数乙县乙县乙县乙县甲县甲县甲县甲县标准组标准组标准组标准组食管癌食管癌食管癌食管癌病死率病死率病死率病死率(1/(1/(1/(1/十万十万十万十万)年龄组年龄组年龄组年龄组(岁岁岁岁)12实际死亡人数与期望死亡人数之比称为实际死亡人数与期望死亡人数之比称为实际死亡人数与期望死亡人数之比称为实际死亡人数与期望死亡人数之比称为标准化死亡比标准化死亡比标准化死亡比标准化死亡比(standard mortality ratio)(standard mortality ratio)(standard mortality ratio)(standard mortality ratio)简记为简记为简记为简记为SMRSMRSMRSMR。若若若若SMR1SMR1SMR1SMR1表示该县的病死率高于标准组表示该县的病死率高于标准组表示该县的病死率高于标准组表示该县的病死率高于标准组;若若若若SMR1SMR1SMR1SMR5P)5P)5P)5时时时时,P P P P的抽样分布接近正态的抽样分布接近正态的抽样分布接近正态的抽样分布接近正态,可可可可用正态分布计算可信区间的上下限用正态分布计算可信区间的上下限用正态分布计算可信区间的上下限用正态分布计算可信区间的上下限,95%95%95%95%可信区间为可信区间为可信区间为可信区间为:P P P P 1.961.961.961.96 SpSpSpSp其中其中其中其中SpSpSpSp为率的标准误为率的标准误为率的标准误为率的标准误:SpSpSpSp当当当当样本含量样本含量样本含量样本含量n n n n较小较小较小较小,且样本率且样本率且样本率且样本率P P P P很小或或接近于很小或或接近于很小或或接近于很小或或接近于1 1 1 1时时时时,如如如如nPnPnPnP或或或或n(1n(1n(1n(1-P)5P)5P)5P)5时时时时,可先用平方根反正弦变换可先用平方根反正弦变换可先用平方根反正弦变换可先用平方根反正弦变换,然然然然后计算可信区间的上下限后计算可信区间的上下限后计算可信区间的上下限后计算可信区间的上下限,最后变换回来最后变换回来最后变换回来最后变换回来。nPP/)1(15例例例例8.3 8.3 8.3 8.3 抽样检查某地区农民抽样检查某地区农民抽样检查某地区农民抽样检查某地区农民80808080人人人人,查出感染钩虫者查出感染钩虫者查出感染钩虫者查出感染钩虫者20202020人人人人,试估计该地区农民总体钩虫感染率试估计该地区农民总体钩虫感染率试估计该地区农民总体钩虫感染率试估计该地区农民总体钩虫感染率。样本感染率样本感染率样本感染率样本感染率P P P P=20/80=25%=20/80=25%=20/80=25%=20/80=25%标准误标准误标准误标准误:总体率的点估计总体率的点估计总体率的点估计总体率的点估计 25252525总体率的区间估计总体率的区间估计总体率的区间估计总体率的区间估计:(0.25(0.25(0.25(0.251.961.961.961.960.04840.04840.04840.0484,0.250.250.250.251.961.961.961.960.0484)0.0484)0.0484)0.0484)=(0.15510.15510.15510.1551,0.34490.34490.34490.3449)15.51%34.49%15.51%34.49%15.51%34.49%15.51%34.49%84.480/)25.01(25.0=pS16第三节第三节第三节第三节率的假设检验率的假设检验率的假设检验率的假设检验一一一一、样本率和总体率的比较样本率和总体率的比较样本率和总体率的比较样本率和总体率的比较H0:H0:H0:H0:=0 0 0 0H1:H1:H1:H1:0 0 0 0当当当当n n n n较大较大较大较大,且且且且n n n n0 0 0 05 5 5 5时时时时,可用可用可用可用2 2 2 2检验检验检验检验,或或或或U U U U检验检验检验检验。1.U1.U1.U1.U检验检验检验检验:2.2.2.2.2 2 2 2检验检验检验检验:1)1(/)()1(/)1()(/)(/)(002002002022=+=nnxnnxnnnxTTOnPU/)1(/000=n(1n(1n(1n(1-0 0 0 0)n n n n-x x x x非阳性数非阳性数非阳性数非阳性数n n n n0 0 0 0 x x x x阳性数阳性数阳性数阳性数理论频数理论频数理论频数理论频数T T T T观察频数观察频数观察频数观察频数O O O O17 2 2 2 2分布及卡方检验的基本思想分布及卡方检验的基本思想分布及卡方检验的基本思想分布及卡方检验的基本思想?若若若若H H H H0 0 0 0成立成立成立成立,则观察频数则观察频数则观察频数则观察频数O O O O与理论频数与理论频数与理论频数与理论频数T T T T的偏差一般不会很大的偏差一般不会很大的偏差一般不会很大的偏差一般不会很大,出现小的出现小的出现小的出现小的 2 2 2 2值才可以接受值才可以接受值才可以接受值才可以接受,而出现大的而出现大的而出现大的而出现大的 2 2 2 2值的概率值的概率值的概率值的概率P P P P很小很小很小很小 20.05,(1)=3.84 20 0 =0.05=0.05=0.05=0.05=0.05=0.05=0.05=0.05拒绝拒绝拒绝拒绝H0?如果如果如果如果 2 2 2 2 2 2 2 20.05,(1)0.05,(1)0.05,(1)0.05,(1)=3.84 3.84 3.84 3.84,则则则则P P P P0.05 0.05 0.05 0.05,拒绝拒绝拒绝拒绝H H H H0 0 0 0?如果如果如果如果 2 2 2 2 0.05P0.05P0.05P0.05,不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0 =TTO22)(18例例例例8.5 8.5 8.5 8.5 根据以往经验根据以往经验根据以往经验根据以往经验,某药物治疗某病的治愈率为某药物治疗某病的治愈率为某药物治疗某病的治愈率为某药物治疗某病的治愈率为80%80%80%80%,现现现现有一医师采用新药治疗有一医师采用新药治疗有一医师采用新药治疗有一医师采用新药治疗100100100100个病人个病人个病人个病人,治愈治愈治愈治愈87878787人人人人,问新药的治愈问新药的治愈问新药的治愈问新药的治愈率与率与率与率与80%80%80%80%的差别有无统计学意义的差别有无统计学意义的差别有无统计学意义的差别有无统计学意义?解解解解:这里这里这里这里n=100n=100n=100n=100,P P P P=0.87=0.87=0.87=0.87,0 0 0 0=0.80=0.80=0.80=0.80H0:H0:H0:H0:=0.80=0.80=0.80=0.80H1:H1:H1:H1:0.800.800.800.802222275.10625.30625.3)80.01(80.0100/)80.010087(75.1100/)80.01(80.0/|80.087.0|=UU注意:或由于由于由于由于UUUUUUUU0.050.050.050.05=1.960=1.960=1.960=1.960,或或或或2 2 2 2 0.05P0.05P0.05P0.05,不能拒绝不能拒绝不能拒绝不能拒绝H0H0H0H0,认为新药治疗的治愈率与认为新药治疗的治愈率与认为新药治疗的治愈率与认为新药治疗的治愈率与0.800.800.800.80的差异无统计学意义的差异无统计学意义的差异无统计学意义的差异无统计学意义。419二二二二、两总体率的比较两总体率的比较两总体率的比较两总体率的比较:2 2 2 22 2 2 2表表表表H0:H0:H0:H0:1=1=1=1=2 2 2 2H1:H1:H1:H1:1 1 1 12 2 2 2()()()为两样本的合计率其中检验:ncapnnppssppUUpppp/)(111.102100212121+=+=组别组别组别组别有效有效有效有效无效无效无效无效合计合计合计合计有效率有效率有效率有效率1 a b n1=1 a b n1=1 a b n1=1 a b n1=a+ba+ba+ba+bp p p p1 1 1 1=a/(a+b)=a/(a+b)=a/(a+b)=a/(a+b)2 c d n2=2 c d n2=2 c d n2=2 c d n2=c+dc+dc+dc+dp p p p2 2 2 2=c/(c+d)=c/(c+d)=c/(c+d)=c/(c+d)合计合计合计合计a+c b+d n=a+c b+d n=a+c b+d n=a+c b+d n=a+b+c+da+b+c+da+b+c+da+b+c+d2022()(1)(1)OTdfRCT=自由度22()1()()()()adbcnab cd ac bd=+(自由度df四格表专用公式)O O O O为观测频数为观测频数为观测频数为观测频数,T,T,T,T为理论频数为理论频数为理论频数为理论频数某格理论频数某格理论频数某格理论频数某格理论频数T=T=T=T=行合计行合计行合计行合计列合计列合计列合计列合计/总例数总例数总例数总例数2.2.2.2.2 2 2 2检验检验检验检验:21例例例例8.68.68.68.6两种药物治疗慢性肾炎有效率的比较两种药物治疗慢性肾炎有效率的比较两种药物治疗慢性肾炎有效率的比较两种药物治疗慢性肾炎有效率的比较药物药物药物药物有效有效有效有效无效无效无效无效合计合计合计合计有效率有效率有效率有效率(%)(%)(%)(%)西药西药西药西药63 16 63 16 63 16 63 16 7979797979.75 79.75 79.75 79.75 中药中药中药中药47 7 47 7 47 7 47 7 5454545487.0487.0487.0487.04合计合计合计合计1101101101102323232313313313313382.71 82.71 82.71 82.71 两种药物治疗慢性肾炎有效率的差异是否有统计两种药物治疗慢性肾炎有效率的差异是否有统计两种药物治疗慢性肾炎有效率的差异是否有统计两种药物治疗慢性肾炎有效率的差异是否有统计学意义学意义学意义学意义?22H0:1=2 两总体两总体两总体两总体有效有效有效有效率相等率相等率相等率相等H1:1 2 两总体两总体两总体两总体有效有效有效有效率不相等率不相等率不相等率不相等方法一方法一方法一方法一:()192.134.9)34.97(66.44)66.4447(66.13)66.1316(34.65)34.6563(222222=+=TTO34.913323541332354,66.44133110541331105466.1313323791332379,34.65133110791331107922211211=TTTT23方法二方法二方法二方法二:2 2 2 2=(adadadad-bc)bc)bc)bc)2 2 2 2 n/(a+b)(c+d)(a+c)(b+d)n/(a+b)(c+d)(a+c)(b+d)n/(a+b)(c+d)(a+c)(b+d)n/(a+b)(c+d)(a+c)(b+d)=(63636363 7 7 7 7-16 16 16 16 47474747)2 2 2 2 133/(79 133/(79 133/(79 133/(79 54 54 54 54 110 110 110 110 23)23)23)23)=1.192=1.192=1.192=1.192自由度自由度自由度自由度dfdfdfdf=1=1=1=1,查表得查表得查表得查表得P0.05,P0.05,P0.05,P0.05,不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0结论为结论为结论为结论为:两组有效率的差异无统计学意义两组有效率的差异无统计学意义两组有效率的差异无统计学意义两组有效率的差异无统计学意义。240.00.10.20.30.40.50369121518卡方值纵 高自由度1自由度2自由度3自由度62/)12/(2222)2/(21)(=ef3.847.8112.59=0.05=0.05=0.05=0.05的临界值的临界值的临界值的临界值2分布分布分布分布(chi-square distribution)20.05,1=u2(如如如如:1.962=3.84)(n40,所有理论频数所有理论频数所有理论频数所有理论频数5时时时时)525方法三方法三方法三方法三:U:U:U:U检验检验检验检验对于未校正的对于未校正的对于未校正的对于未校正的2 2 2 2来说来说来说来说,2 2 2 2=1.192=u=1.192=u=1.192=u=1.192=u2 2 2 2=1.092=1.092=1.092=1.0922 2 2 2092.1)54/179/1()8271.01(8271.08704.07975.0=+=u262 2 2 2分布是一个连续型的分布分布是一个连续型的分布分布是一个连续型的分布分布是一个连续型的分布,而计数资而计数资而计数资而计数资料中的频数是间断性的料中的频数是间断性的料中的频数是间断性的料中的频数是间断性的,使用的使用的使用的使用的2 2 2 2检验与真检验与真检验与真检验与真正的正的正的正的2 2 2 2分布有一定的误差分布有一定的误差分布有一定的误差分布有一定的误差,自由度等于自由度等于自由度等于自由度等于1 1 1 1时时时时,特别当理论频数特别当理论频数特别当理论频数特别当理论频数T5T5T5T5时时时时,误差较大误差较大误差较大误差较大,使得所得使得所得使得所得使得所得概率值偏小概率值偏小概率值偏小概率值偏小,必须进行校正必须进行校正必须进行校正必须进行校正,称为称为称为称为YatesYatesYatesYates校校校校正法或连续性正法或连续性正法或连续性正法或连续性YatesYatesYatesYates校正校正校正校正。校正校正校正校正 2=(|ad-bc|-n/2)2 n/(a+b)(c+d)(a+c)(b+d)27两种药物治疗某病有效率的比较两种药物治疗某病有效率的比较两种药物治疗某病有效率的比较两种药物治疗某病有效率的比较药物药物药物药物有效有效有效有效无效无效无效无效合计合计合计合计有效率有效率有效率有效率西药西药西药西药4 24 28 14.29 4 24 28 14.29 4 24 28 14.29 4 24 28 14.29 中药中药中药中药6 23 29 20.696 23 29 20.696 23 29 20.696 23 29 20.69合计合计合计合计10 47 57 17.54 10 47 57 17.54 10 47 57 17.54 10 47 57 17.54 两组有效率的差异是否有统计学意义两组有效率的差异是否有统计学意义两组有效率的差异是否有统计学意义两组有效率的差异是否有统计学意义?最小理论频数最小理论频数最小理论频数最小理论频数1010101028/5728/5728/5728/574.914.914.914.9128如不校正如不校正如不校正如不校正:2(423624)257/(28291047)4.1156 P0.05 (P=0.093)确切概率确切概率确切概率确切概率:P 0.079 291.1.1.1.当总例数大于等于当总例数大于等于当总例数大于等于当总例数大于等于40404040,各理论频数大各理论频数大各理论频数大各理论频数大于等于于等于于等于于等于5 5 5 5,不须校正不须校正不须校正不须校正。2.2.2.2.当总例数大于等于当总例数大于等于当总例数大于等于当总例数大于等于40404040,有一格理论频有一格理论频有一格理论频有一格理论频数小于数小于数小于数小于5 5 5 5,但大于
展开阅读全文