资源描述
第1章 绪论
案例辨析及参考答案
案例1-1 某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。得出的结论是:“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。请问其结论合理吗?为什么?应该如何?
案例辨析 ① 样本不能代表总体。总体是“大学生”,而样本仅为某地三年制职业技术学院学生;② 社会学调查的样本含量显得不足; ③ “理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选”的意思,不符合统计学要求。
正确做法 应在论文的题目中明确调查的时间范围和地点,还应给“大学生”下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。
案例1-2 两种药用于同一种病,A药治疗5例,4例好转;B药治疗50例,36例好转。结论是:A药优于B药。请问其结论合理吗?为什么?应该如何?
案例辨析 ① A药样本仅5例,样本含量太少;② 得出“A药优于B药”没有交待是否采用了统计学推断方法,若用目测法得出结论,则结论没有说服力;③ 未明确研究目的和研究结果将被使用的范围。
正确做法 ① 应明确研究目的和研究结果将被使用的范围,若是个别研究者或临床医生想了解这两种药的大致疗效,属于小规模的临床观察,其结论仅供少数人在今后临床实践中参考,其样本含量可能不需要很大,因为观察指标是定性的(有效、无效),一般来说,每个药物组也需要几十例(以不少于20例为宜);若属于新药的Ⅱ期临床试验,那就要严格按有关规定,比较准确地估计出所需要的样本含量,不仅如此,还有很多严格的要求,详见本书中临床试验设计一章;② 从明确定义的总体中随机抽样进行实验研究,得到的实验结果不能仅凭数据大小作出判断,应进行假设检验,以提高结论的可信度。
案例1-3 某研究者为了探讨原发性高血压患者肾小管早期损害的监控指标,选取尿常规、蛋白定性检查阴性,血肌酐、尿素氮均在正常范围内的原发性高血压患者74例作为病例组,其中男43例,女31例,平均年龄61岁(40~73岁)。根据高血压的病程将患者分为三组,Ⅰ组高血压病期<10年,Ⅱ组高血压病期10~20年,Ⅲ组高血压病期>20年。另选取53名体检健康的职工为对照组。观测两组尿视黄醇结合蛋白(retinal binding protein, RBP)、微量白蛋白(microalbumin, mALB)、β2 微球蛋白(β2 microglobulin, β2-MG)和N-乙酰-β-D-氨基葡萄糖苷酶(N-acetyl-β-D-glucosaminidase, NAG)四项定量指标的取值。结论为:尿RBP、mALB、b2-MG和NAG是原发性高血压患者肾小球、肾小管早期损害的敏感指标。请辨析这样设计实验存在什么问题?正确的做法是什么?
案例辨析 研究对象的选取在病例组和对照组之间存在不均衡性,即两组受试者之间,除了一组患有高血压,另一组未患高血压以外,在其他很多与评价高血压可能导致坏影响的方面都不一致。
对照组选取的是53名体检健康的职工,未明确写出平均年龄以及年龄所在的范围,也未交代性别构成情况。但由我国现行的退休制度可知,在职职工的年龄通常在18~60岁之间,平均年龄大约40岁。由临床医学基本常识可知,很多因素(比如年龄、性别等)不仅对血压有影响(通常是随着年龄的增大,血压有升高的趋势),而且对肾功能也有一定程度的影响;况且,高血压患者与健康职工还在“体力和脑力劳动强度、生活方式、心理和精神的紧张程度等诸多方面不具有可比性,而这些重要的非实验因素可能对肾功能也存在不同程度的影响。总之,原研究者所选取的病例组与对照组在很多重要的非实验因素方面(特别是年龄)不具有可比性,降低了结论的说服力。
正确做法 欲探讨高血压早期肾损害的监控指标,应根据高血压患者病程所分的三个组确定受试者的年龄段,从患者所取自的人群范围内随机选取一定数量的正常健康人(而不应仅局限在原研究者所在单位内),将正常健康人也分成相应的三个年龄段,并应尽可能确保在每个年龄段中,病例组与对照组受试者在其他重要非实验因素方面(如性别构成、体力和脑力劳动强度、生活方式、心理和精神的紧张程度等)均衡一致,采用相应的统计分析方法去比较定量指标的测定结果之间的差别,其结论才具有较高的可信度。
案例1-4 某部队共有1 200人,在某段时间内患某病的人数有120人,其中男性114人,女性6人。某卫生员进行统计分析后说,经假设检验,该病的两性发病率(114/120=95%与6/120=5%)之间的差别有统计学意义,由此得出结论:“该病男性易得”。你对这个结论有何看法?若结论是错误的,那么,错误的实质是什么?正确的做法是什么?
案例辨析 这个结论是错误的!因为在这1 200人中,究竟有多少男性和多少女性并不清楚,无法计算男性发病的频率和女性发病的频率。假如其中有1 194名男性和6名女性,则男性发病率为(120/1 194)´100% = 10.05%,而女性全部发病(女性总例数太少,不宜用百分之百发病率来描述)。显然,原来的结论是不成立的。该卫生员所犯错误的实质是将发病人员中性别的频率错误地当作人群中发病的频率了,因而得出毫无根据的错误结论。
正确做法 若这1 200人是从一个总体中抽出来的样本,要弄清在这1 200人中男、女人数各是多少,设分别为和,然后,分别计算男性和女性的发病频率,即,;要想得出两个发病频率之间的差别是否能反映总体的情况,还应进行统计推断(即进行假设检验,此处从略)。
第2章 统计描述
案例辨析及参考答案
案例2-1 本章的例2-1中,该医生同时还观察了1 402名临产母亲的住院天数(教材表2-14),并得到平均住院天数为6.6天。请对此发表评论。
教材表2-14 1 402名临产母亲生产期间的住院天数
组段
(1)
组中值Xi
(2)
频数
(3)
频率fi
(4)
1~
2
79
5.63
3~
4
316
22.54
5~
6
559
39.87
7~
8
243
17.33
9~
10
89
6.35
11~
12
57
4.07
13~
14
23
1.64
15~
16
19
1.36
17~
18
9
0.64
19~
20
1
0.07
21~
22
2
0.14
23~
24
2
0.14
25~
26
3
0.21
合计
—
1 402
1.00
由加权法的计算公式(2-2)求出平均住院天数
(天)
案例辨析 首先观察资料的分布形式,由于呈正偏峰分布,选用上述结果描述住院天数的平均水平不合适。
正确做法 宜选用不受定量资料分布情况限制的中位数来描述住院天数的平均水平。本例计算结果为M =6.1(天)。
案例2-2 某人编制了一张统计表(教材表2-15), 你认为哪些需要改进?
教材表2-15 1976—1979年吉林市各型恶性肿瘤的死亡率
年龄组
疾 病
0~
15~
35~
55~
75~
胃 癌
无
1.13/10万
19.92/10万
150/10万
313.44/10万
食管癌
无
0.1/10万
2.18/10万
35.20/10万
73.56/10万
肝 癌
0.34/10万
1.64/10万
25.30/10万
97.51/10万
134.33/10万
肺 癌
无
0.41/10万
20.21/10万
125.10/10万
137.53/10万
案例辨析 原表格存在的问题:①标题不准确;②线条过多,出现了斜线、竖线和多余的横线;③数字区域出现了文字;④小数位数不统一,小数点没有纵向对齐;⑤量纲的标注位置有误。
正确做法 将原统计表中存在的上述错误纠正过来,修改后的统计表见案例表2-1。
案例表2-1 1976—1979年吉林市各年龄组人群部分恶性肿瘤死亡情况调查结果
疾 病
各年龄组死亡率(1/10万)
0~
15~
35~
55~
75~
胃 癌
0.00
1.13
19.92
150.00
313.44
食管癌
0.00
0.10
2.18
35.20
73.56
肝 癌
肺 癌
0.34
0.00
1.64
0.41
25.30
20.21
97.51
125.10
134.33
137.53
案例2-3 某人绘制一张统计图(教材图2-11), 你认为哪些需要改进?
教材图2-11 1952年与1972年某地肺结核、心脏病和恶性肿瘤的死亡率
案例辨析 原图形存在的问题:①缺标题;②复式条图误用为单式条图;③纵轴的量纲未注明;④未正确给出图例。
正确做法 将原图中存在的上述错误纠正过来,重新绘图(案例图2-1)。
案例图2-1 某地三种疾病死亡率在1952与1972年间的变化
案例2-4 以病死率为考察指标,对两所医院某病的治疗水平进行比较,结果见教材表2-16,由合计的病死率得出结论为乙医院治疗水平优于甲医院,请评述这个结论。
教材表2-16 2000年两所医院某病的病死率比较
病情严重程度
甲 医 院
乙 医 院
出院人数
病死数
病死率/ %
出院人数
病死数
病死率/ %
轻
100
8
8.0
650
65
10.0
中
300
36
12.0
250
40
16.0
重
600
90
15.0
100
18
18.0
合 计
1 000
134
13.4
1 000
123
12.3
案例辨析 由教材表2-16可以看出,此表编制得不够规范,更为严重的是,虽然甲医院各种病情患者的病死率均低于乙医院,但总的病死率却是甲医院高于乙医院。这个矛盾的出现,是由于甲医院收治的重病人多,轻病人少,乙医院则是重病人少,轻病人多。两家医院收治患者的病情不均衡,不宜直接比较基于各自病情状况的病死率——“粗病死率”。
正确做法 因各医院收治的患者在病情方面不均衡,直接进行比较是不正确的,而是要进行标准化处理后再比较。标准化(standardization)有直接标准化法和间接标准化法两种。
(1)直接标准化 首先确定一个标准组,将其病情分布视作标准分布,即两家医院理论上共同的病情分布状况。例如,某省内两家医院的对比,可以将全省、全国该类型患者入院时的病情分布作为标准组。这里,将两家医院各种程度病情的患者数对应相加,“构造”出标准组,这是在不能获得参考文献关于全省、全国情况时的做法。直接标准化计算过程见案例表2-2。
案例表2-2 用直接标准化法对2000年两所医院某病的病死率作比较
病情严
重程度
标准组人数Ni
原病死率pi
预期病死率数Ni×pi
甲医院
乙医院
甲医院
乙医院
轻
750
8.0
10.0
60
75
中
550
12.0
16.0
66
88
重
700
15.0
18.0
105
126
合 计
2 000
13.4
12.3
231
289
甲医院的标准化病死率:
乙医院的标准化病死率:
经标准化,甲医院的标准化病死率低于乙医院,正确反映了两组病死率水平的对比关系。
以甲医院的计算为例,粗病死率是以甲医院实际病情分布为权重,对甲医院病死率水平的加权平均;标准化的则是以标准组病情分布为权重,对甲医院病死率水平的加权平均。即
当进行对比的两组率为样本率时,下结论前需做假设检验,这里略去。
(2)间接标准化 也需首先确定一个标准组(由文献获得),并给定标准组的各年龄别病死率及总的病死率。由案例表2-3求出两家医院各自收治的患者按标准组的病死率水平将发生的总的死亡数。标准组的选择依据同直接标准化法。
案例表2-3 用间接标准化法对2000年两所医院某病的病死率作比较
病情严
重程度
标准组
病死率pi
出院人数
预期病死率数Ni×pi
甲医院
乙医院
甲医院
乙医院
轻
9.0
100
650
9.0
58.5
中
14.0
300
250
42.0
35.0
重
16.0
600
100
96.0
16.0
合 计
13.5
1 000
1 000
147.0
109.5
按标准组的病死率水平,甲医院有147例死亡,而实际甲医院仅有134例死亡,甲医院实际的病死发生程度低于标准组,两者程度之比134/147=0.91称作标化死亡比(standard mortality ratio,SMR),于是
同理,。
结果,认为乙医院的病死率高于甲医院。这是根据数值大小得出的直观判断结果。若希望得出两医院标准化病死率之间的差别是否具有统计学意义,应进行假设检验,此处从略。
本题目是以“病死率”为例阐述了阳性率的标准化的问题,其余如死亡率、发病率、治愈率等同理。
第3章 概率分布
案例辨析及参考答案
案例3-1 为估计某地居民尿汞值的参考值范围, 测得某地200名正常成人的尿汞值如教材表3-6。
教材表3-6 某地200名正常成人的尿汞值/
尿汞值
0~
4~
8~
12~
16~
20~
24~
28~
32~
36~
40~
44~
48~
例数
45
30
41
20
15
12
13
5
4
6
3
4
2
试根据该样本资料估计该地居民尿汞值的95%正常值范围。
下面给出了多种解法,请辨析正误并讲出道理。若有正确的,请指出来;若没有正确的,请一定要补充上。
解法一:
计算得该样本资料的均数13.78(),标准差11.71(),于是估计该地居民尿汞值的95%正常值范围为(,)=(,36.73)。
解法二:
估计该地居民尿汞值的95%正常值范围为(,)=(2.66, 24.90)。
解法三:
估计该地居民尿汞值的95%正常值范围为(,)=(,32.98)。
解法四:
估计该地居民尿汞值的95%正常值范围为(0,)=(0,32.98)()。
解法五:
估计该地居民尿汞值的95%正常值范围为(0,)=(0,36.73)()。
解法六:
估计该地居民尿汞值的95%正常值范围为(0,)=(0,24.90)()。
解法七:
估计该地居民尿汞值的95%正常值范围为(,)=(,13.78)()。
解法八:
估计该地居民尿汞值的95%正常值范围为(,)=(,13.78)()。
解法九:
估计该地居民尿汞值的95%正常值范围为(,)=(2.66,13.78)(1)。
案例辨析 以上所有解法均是错误的。本案例解法一至解法九均利用正态分布法估计正常值范围,但却忽略了对该资料的正态性判断或检验。
正确做法 严格的正态性检验常用的方法有Z检验(通常称为矩法)、W 检验、D检验等,需要借助统计软件完成。在这里我们用粗略判断的方法:作出频率分布图看是否对称,如果对称可初步判断为正态分布,否则判为非正态。该例频率分布明显不对称(案例图3-1)。
案例图3-1 表3-6资料的频率分布
由此图可粗略判断尿汞值这个指标不服从正态分布(经对数变换后频率分布仍不对称),所以不能用正态分布法估计正常值范围,而应用适合描述偏态分布的百分位数法,计算,故估计该地居民尿汞值的95%正常值范围不高于38()。
在本例中,如果该地居民尿汞值呈正态分布,则上述解法四计算公式是正确的,因为汞是对人身体有害的微量元素,越少越好,又不可能取负值,下限应该为0,只需求出单侧上限即可。
案例3-2 某地区10万人口中出现了20例流行性腮腺炎病例,有人希望据此推断该地区10万人口中不少于20人患流行性腮腺炎的概率。于是,有几位爱动脑筋的学生给出了自己的解法。请辨析他们的解法之正误,并讲出道理。
解法一:
解法二:
解法三:
解法四:
案例辨析 上述解法均是错误的。解法一将发生流行性腮腺炎的人数看作是服从的Poisson分布,并近似服从正态分布,来计算相应的概率。但本例各观察单位是否患病不是互相独立的,不满足Poisson分布的应用条件,所以不能按照Poisson分布模型处理。解法二按照二项分布计算概率,同样因为各观察单位是否患病非独立,不满足二项分布的应用条件。解法三也是按照Poisson分布计算概率,因为模型选择的错误,所以导致结果错误,同样可分析解法四。
正确做法 就本例而言,因患这种病是有传染性的,即不满足独立性条件,没有合适的统计计算方法;若满足独立性,则以上四种计算方法均正确。在解法一中,因,将Poisson分布用正态分布来近似,近似程度较差,故计算出来的概率与直接按Poisson分布或二项分布计算的结果有较大出入。
第4章 参数估计
案例辨析及参考答案
案例4-1 某研究者测得某地120名正常成人尿铅含量(mg·L-1)如下:
尿铅含量
0~
4~
8~
12~
16~
20~
24~
28~
32~
36~
合计
例数
14
22
29
18
15
10
6
3
2
1
120
试据此资料估计正常成人平均尿铅含量的置信区间及正常成人尿铅含量的参考值范围。
由表中数据得到该例的,,,某作者将这些数据代入公式(4-20),即采用计算得到正常成人平均尿铅含量100%置信区间为(,14.068 4);采用公式计算得到正常成人尿铅含量100%参考值范围为(,26.030 6)。请问这样做是否合适?为什么?应当怎么做?
案例辨析 该定量资料呈偏峰分布,不适合用正态分布法计算参考值范围。
正确做法 可以用百分位数法求正常成人尿铅含量100%参考值范围的单侧上限。例如,当=0.05时,可直接求分位数,(0,)就是所求的正常成人尿铅含量的95%正常值范围。
欲求正常成人尿铅含量总体均数的置信区间,当样本含量n较大(比如说,大于30或50)时,样本均数就较好地接近正态分布(根据数理统计上的中心极限定理)。本例, 因为较大,不必对原始数据作对数变换就可以用估计总体均数的置信区间。
案例4-2 在BiPAP呼吸机治疗慢性阻塞性肺病的疗效研究中,某论文作者为了描述试验前的某些因素是否均衡,在教材表4-5中列出了试验前患者血气分析结果。由于作者觉得自己数据的标准差较大,几乎和均数一样大,将标准差放在文中显得不雅观,于是他采用“均数±标准误”(),而不是“均数±标准差”()来对数据进行描述。问在研究论文中以教材表4-5方式报告结果正确吗?为什么?
教材表4-5 试验组和对照组治疗前血气分析结果()
组别
例数
年龄/岁
pH
pa(CO2)/kPa
pa (O2)/kPa
Sa(O2)/%
试验组
12
63.004.33
7.360.05
63.004.33
9.250.55
85.121.73
对照组
10
62.503.95
7.380.06
63.004.33
9.160.62
86.452.25
案例辨析 描述数据的基本特征不能采用,因为为反映抽样误差大小的指标,只表示样本均数的可靠性,而不能反映个体的离散程度。不仅如此,因仅为与其对应的的,有时,即使很大(甚至大于),用表示离散度时,不易被察觉出来,因此,用表达定量资料时,往往具有欺骗性。
正确做法 当各组定量资料服从或近似服从正态分布时,反映个体的离散程度应该采用标准差,即描述数据的基本特征必须采用;否则,需要采用描述数据的基本特征。此处,为中位数、和分别为第1四分位数和第3四分位数。
案例4-3 某市往年的12岁男孩平均身高为140.0 cm。现在从该市的12岁男孩中随机抽得120名作为研究对象, 得到平均身高为143.1 cm, 标准差为6.3 cm。请估计该样本对应总体均数的95%置信区间,并确定该均数是否与往年不同。
某学生的回答如下:“该例12岁男孩平均身高的点估计值为143.1 cm,按公式(4-21)计算得到该点估计值的95%置信区间为141.9~144.2 cm。因为往年12岁男孩平均身高为140.0 cm,没有落在所计算的95%置信区间以内,所以可以认为现有男孩平均身高与往年身高有差异”。
请指出学生回答中的不恰当之处。
案例辨析 不恰当之处有三:① “点估计值的95%置信区间”的说法不对;②“以往男孩平均身高没有落在所计算的95%置信区间以内”的说法不对;③“现有男孩平均身高与往年身高有差异”的说法不对。
正确做法 ① 应该说“点估计值对应总体均数的95%置信区间”;② 应该说“95%置信区间没有覆盖(包括)以往男孩平均身高”;③ 应该说“现有男孩平均身高与往年男孩平均身高的差异有统计学意义”。
第5章 假设检验
案例辨析及参考答案
案例5-1 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取25名患者服用了新药,以常规药的疗效均值为,进行检验,无效假设是,对立假设是,检验水平α=1%。结果值很大,拒绝了无效假设。“拒绝了无效假设”意味着什么?下面的说法你认为对吗?
(1)你绝对否定了总体均数相等的无效假设。
(2)你得到了无效假设为真的概率是1%。
(3)你绝对证明了总体均数不等的备择假设。
(4)你能够推论备择假设为真的概率是99%。
(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。
(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。
提示:就类似的问题,Haller和Kruss(2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。(见Statistical Science, 2005, 20(3):223-230.)
案例辨析 6个选择均不正确。
(1)可能犯Ⅰ类错误。
(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。
(3)可能犯Ⅰ类错误。
(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。
(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是。
(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-=99%是指无效假设成立的条件下不犯错误的概率是99%。
正确做法 “拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为。
案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。最近从该厂一次抽取20个该器械检测,合格13个,计算得到合格率为65.0%;一周后又抽取15个器械检测,合格10个,计算得到合格率为66.7%,分别进行检验,得到两总体率相等的结论,表明合格率没下降,两个合格率的平均值为65.85%,进行检验,得到两总体率不等的结论,表明合格率下降了。请对这一结论发表你的意见。
案例辨析 不正确,因为分别用=20和=15的两个小样本计算的样本频率与总体概率80.0%比较,进行两次检验,样本量太小,检验功效太小,不能得到总体概率不等的结论。
正确做法 加大样本量,对样本频率所代表的总体概率与已知总体概率80.0%进行假设检验,具体方法从略。(样本量的估计见本书第15章样本含量估计)
第6章 两样本定量资料的比较
案例辨析及参考答案
案例6-1 为研究直肠癌患者手术前后血清CEA含量有无差异,作者收集了以下资料:
术 前(24例):31.5 30.0 28.6 39.7 45.2 20.3 37.3 24.0 36.2 20.5 23.1 29.0
33.1 35.2 28.9 26.4 25.9 23.8 30.4 31.6 27.9 33.0 34.0 32.7
术 后(12例): 2.0 3.2 2.3 3.1 1.9 2.2 1.5 1.8 3.2 3.0 2.8 2.1
(1)有人采用了两独立样本的检验,结果=15.92,=34,<0.05。从而得出结论:手术前后血清CEA含量有差异,术前CEA含量高于术后。
(2)也有人觉得上述分析方法不对,应该采用两独立样本的秩和检验,结果为:,<0.05。
(3)还有人认为应该采用校正t检验,结果:=22.51,<0.05。
(4)有人将上述三种方法作一比较,认为既然三者结论是一致的,所以采用哪种分析方法都无所谓。对此你有何看法?
案例辨析
(1)属于盲目套用两独立样本的检验,因为未检查定量资料是否满足参数检验的前提条件。
(2)若定量资料满足参数检验的前提条件,直接用秩和检验会降低检验功效。
(3)若定量资料不满足正态性要求,直接用校正的检验也是不妥当的。
(4)应当采用哪种统计分析方法不应仅看结论是否一致,而应根据分析目的、设计类型、资料是否满足参数检验的前提条件等方面综合考虑,事先选定统计分析方法,不能等到计算结果出来了,再确定统计分析方法。
正确做法 此案例涉及完全随机设计两小样本资料的假设检验,统计方法的选择一定要结合数据特征。通过对两组数据进行正态性检验,发现两样本均来自正态总体,但方差齐性检验结果表明,两总体方差不齐,所以最好的办法就是检验,此种情况一般不主张采用秩和检验,因为检验功效会大大降低。
案例6-2 为研究不同药物对肥胖患者的疗效,将BMI≥28的肥胖患者随机分成两组,每组10人,测得他们服药前及服药2个月后体重的变化(教材表6-10)。试评价:①A、B两种药物对肥胖患者是否有效。②A、B两种药物的疗效有无差别。
教材表6-10 两组肥胖患者服药前后体重变化/kg
药 物
1
2
3
4
5
6
7
8
9
10
A
服药前
75.6
61.2
67.8
77.2
73.2
65.4
80.0
74.4
82.6
68.6
服药后
73.0
60.2
63.6
72.0
74.6
60.8
69.4
77.4
79.6
63.4
B
服药前
69.4
89.9
66.8
63.4
70.0
86.6
90.4
74.8
67.4
84.4
服药后
60.8
95.5
61.6
62.0
69.4
78.0
71.0
76.6
58.2
75.4
(1)假设数据服从正态分布,且总体方差齐,在评价A、B两种药物对肥胖患者是否有效时,作者对A、B两组患者分别采用了独立样本的 t 检验,结果:A 组患者服药前后比较 t =1.040,P=0.312; B组患者服药前后比较 t =1.125,P=0.275。从而得出结论,两种药物均无效。(2)有人认为这种方法不太好,他采用独立样本的t检验,首先比较服药前两组基线水平,结果 t =1.533,P=0.160,表明差异没有统计学意义,两组有可比性。进而,比较治疗后两组体重的差异,结果 t =0.346,P=0.734,从而得出结论:A、B两种药物的疗效差异无统计学意义。
请对以上两种作法发表你的看法。
案例辨析
(1)误用独立样本的检验取代配对设计定量资料的检验。
(2)本案例中采用独立样本的t检验单纯比较两组治疗后体重有无差异去推断两种药物的疗效差别是不正确的。因为两组肥胖患者治疗前体重可能不同,缺乏组间可比性。因为未充分发挥两组患者服药前的信息,使结论的可信度降低。
正确做法
(1)欲评价A、B两种药物对肥胖患者是否有效,应分别对A、B两组患者服药前后体重进行配对检验,求得值后与界值进行比较,从而得出药物治疗前后体重变化有无差异的推断。另外,即使在进行配对检验时获得了一个较小的P值,拒绝了H0,下结论也一定要慎重。差异有统计学意义并不能说明药物就有效,药物是否有效以及疗效的好坏一方面要结合专业知识方可得出结论,另一方面服药前后肥胖患者的饮食习惯、运动情况等因素对体重都会有影响。因此,对同一个体处理前后某项指标进行比较,一定要保证非处理因素在处理前后保持不变,否则难以得出正确的结论。
(2)欲评价A、B两种药物的疗效有无差别,应分别计算出各组治疗前后体重的差值,然后作完全随机设计两样本比较的t检验,因为A、B两组样本是从同一总体中随机抽取的,肥胖病没有传染性,两组受试者间是相互独立的,由题中条件可知,定量资料满足正态性和方差齐性的前提条件。
总之,如果要分别评价A、B两种药物是否有效,可以首先按照自身对照设计资料,考虑采用配对t检验并结合专业与实际进行推断。另外,可以同时设定一个平行对照帮助推断。如果欲评价A、B两种药物的疗效有无差别,可以采用以下两种方法之一:①分别计算出各组治疗前后体重的差值,然后作完全随机设计两样本比较的t检验;②以治疗前两组体重数据作为协变量的值,采用多重回归扣除治疗前体重的影响(参见本书第11章)。
案例6-3 为研究长跑运动对增强普通高校学生的心功能的效果,某学校随机抽取15名男生,进行5个月的长跑锻炼,5个月前后测得的晨脉数据如教材表6-11所示,问长跑锻炼前后的平均晨脉次数有无不同?
教材表6-11 某校15名学生5个月长跑锻炼前后的晨脉次数/(次·min-1)
学生号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
锻炼前前
70
76
56
63
63
56
58
60
67
65
75
66
56
59
72
锻炼后
48
54
60
64
48
55
54
45
50
48
56
48
62
49
50
作者认为该研究属于配对设计的定量资料,通过对差值进行正态性检验,发现差值不是来自正态总体( W 检验:P=0.041),所以用配对资料的符号秩和检验,结果为 T=10,查 T界值表,得双侧P<0.05。因此认为长跑后的平均晨脉次数低于长跑前的平均晨脉次数。
你认为上述分析是否合适?请说明理由。
案例辨析 “同一受试对象处理前后的比较”严格地说不是合格的配对设计,因为处理前的个体接受的是空白处理,而处理后的同一个体接受的是“处理(长跑)+时间(5个月)”,因此,即便长跑前后的晨脉次数有差别,也不能就判断是长跑的作用,因为有5个月的时间效应混杂在其中。
正确做法 处理此类问题的最好办法是加一个平行对照,使“时间效应”在两组比较时互相抵消,从而可以更真实地揭示“长跑与否”产生的效应之间的差别有无统计学意义。
第7章 多组定量资料的比较
案例辨析及参考答案
案例7-1 某医院妇产科测定几种卵巢功能异常患者血清中促黄体素的含量(U/L),结果如下:
卵巢发育不良 42.50 38.31 35.76 33.60 31.38
丘脑性闭经 6.71 3.32 4.59 1.67 10.51 2.96 11.82 3.868.26 2.63 2.20
垂体性闭经 4.50 2.75 11.14 5.98 1.90 5.43 11.05 22.03
研究者运用t检验进行两两比较,共比较了3次。结论是卵巢发育不良者血清中促黄体素的含量高于丘脑性闭经和垂体性闭经者。这样做是否妥当?为什么?正确的做法是什么?
案例辨析 原作者用3次检验处理此定量资料是不妥当的,因为这样做割裂了原先的整体设计,对资料的利用率较低,对误差的估计不够合理,检验统计量的自由度较小,结论的可信度降低。
正确做法 这是从三个子总体内完全随机抽取受试对象的单因素3水平设计定量资料的假设检验问题,应选用与此设计对应的统计分析方法。若定量资料满足参数检验的三个前提条件(即独立性、正态性和方差齐性),应选用单因素3水平设计定量资料方差分析;若定量资料不满足参数检验的三个前提条件,可选用Kruskal-Wallis秩和检验。
假定3组定量资料满足独立性要求,对3组定量资料用检验分别进行正态性检验,得:卵巢发育不良组为=0.979,=0.930;丘脑性闭经组为=0.874,=0.087;垂体性闭经组为=0.844,=0.083。因3组正态性检验结果均有>0.05,说明3组定量资料满足正态性要求。
再对3组定量资料进行方差齐性检验(采用Levene检验),得:=1.416,=0.265。说明3组定量资料满足方差齐性的要求。
因该定量资料满足方差分析的前提条件,故建议采用单因素3水平设计定量资料方差分析处理。经方差分析,=74.64,<0.001;进而经Bonferroni检验,卵巢发育不良组高于丘脑性闭经组(<0.001),卵巢发育不良组高于垂体性闭经组(<0.001),而丘脑性闭经组与垂体性闭经组之间的差异无统计学意义(=0.234);虽然结论与原作者的相同(巧合),但原作者的处理过程不妥。
案例7-2 某研究人员将15只小白鼠随机分为3组,比较小白鼠接种3种不同的细菌后存活的天数是否有差别,实验数据如下:
A细菌 2 4 5 7 9
B细菌 4 5 7 8 12
C细菌 8 9 10 17 23
该研究者对数据进行了方差分析(教材表7-10),进而经LSD检验,C细菌与A细菌、C细菌与B细菌之间均有统计学差异,而B细菌与C细菌之间无统计学差异。
教材表7-10 小白鼠接种3种不同的细菌后存活的天数
细菌类别
例数
值
值
A细菌
5
5.402.70
B细菌
5
7.203.11
4.53
0.034
C细菌
5
13.406.43
请问该研究者所作统计处理是否合理?为什么?正确的做法是什么?
案例辨析 进行方差分析,首先要进行方差齐性及各样本的正态性检验。从3组生存天数的方差看,A细菌为7.29,B细菌为9.67,C细菌为41.34。大小方差比近5倍之多,可能方差不齐。通过Levene检验,=4.14,P=0.043,方差不齐,因此,直接进行方差分析不妥当。
正确做法 通过平方根数据变换使其尽可能接近方差分析的前提条件。通过Levene检验,=1.15,=0.348,方差齐;经过正态性检验,A细菌组=0.989,=0.976;B细菌组=0.
展开阅读全文