1、STATA软件应用-流行病学资料分析流行病学资料分析非常简便、非常简便、快速快速流行病学资料的分析第1页流行病学资料分析流行病学资料分析o病例对照研究资料 成组病例对照研究成组病例对照研究 配对病例对照研究配对病例对照研究 o队列研究资料流行病学资料的分析第2页 例例1(成组病例对照研究成组病例对照研究)某单位研究胸膜间皮瘤与接触某单位研究胸膜间皮瘤与接触石棉关系,资料见下表。试对其进行分析。石棉关系,资料见下表。试对其进行分析。流行病学资料的分析第3页成组病例对照研究分析oo 2 2检验:接触石棉与胸膜间皮瘤关系o计算OR:反应接触石棉与胸膜间皮瘤关系大小o计算OR95%置信区间:与 2 2
2、检验等价流行病学资料的分析第4页成组病例对照分析occ 病例变量病例变量 暴露变量暴露变量 fw=fw=频数变量频数变量 occi#a#b#c#d流行病学资料的分析第5页成组病例对照分析occ case exposure fw=focci 40 36 9 67流行病学资料的分析第6页解释:优势比优势比OR=8.27,其其95%CI(3.42,21.33)2=28.94,P=0.0000 由此可见,接触石棉者发生间皮瘤危险性为未接触者由此可见,接触石棉者发生间皮瘤危险性为未接触者8.278.27倍。倍。Proportion Proportion|Exposed Unexposed|Total E
3、xposed|Exposed Unexposed|Total Exposed-+-+-+-+-Cases|40 36|76 0.5263 Cases|40 36|76 0.5263 Controls|9 67|76 0.1184 Controls|9 67|76 0.1184-+-+-+-+-Total|49 103|152 0.3224 Total|49 103|152 0.3224|Point estimate|95%Conf.Interval|Point estimate|95%Conf.Interval|-+-|-+-Odds ratio|8.271605|3.4193 21.3309
4、1Odds ratio|8.271605|3.4193 21.33091 (exact)(exact)Attr.frac.ex.|.8791045|.7075425 .9531197 (exact)Attr.frac.ex.|.8791045|.7075425 .9531197 (exact)Attr.frac.pop|.4626866|Attr.frac.pop|.4626866|+-+-chi2(1)=28.94 Prchi2=0.0000chi2(1)=28.94 Prchi2=0.0000流行病学资料的分析第7页病例对照研究资料-联络强度指标oOR=ad/bc流行病学资料的分析第8页例
5、2(多暴露珠平成组病例对照研究资料)某医院一项吸烟与膀胱癌关系病例对照研究得到以下结果,试分析吸烟量与膀胱癌是否存在剂量-反应关系?流行病学资料的分析第9页多暴露珠平成组病例对照研究o目标:多个暴露珠平剂量目标:多个暴露珠平剂量-反应相关分析反应相关分析 o方法:方法:趋势趋势 2 2检验检验 H H0 0:吸烟量与膀胱癌不存在剂量:吸烟量与膀胱癌不存在剂量-反应线性关系反应线性关系 H H1 1:吸烟量与膀胱癌存在剂量吸烟量与膀胱癌存在剂量-反应线性关系反应线性关系流行病学资料的分析第10页多暴露珠平成组病例对照分析otabodds 病例变量 暴露变量 fw=频数变量,or base(#)o
6、r:指定输出各组or值 base(#):指定以哪组作为参考预计各组or值,默认是第一组作为参考。流行病学资料的分析第11页数据结构流行病学资料的分析第12页解释:OR同质性检验:同质性检验:2 2=17.52,P=0.0006,即各组,即各组OR不全同。不全同。OR趋势检验:趋势检验:2 2=15.14,P=0.0001,故可用认为伴随吸烟量增加,故可用认为伴随吸烟量增加患膀胱癌危险性也增加。患膀胱癌危险性也增加。tabodds case smoke fw=f,or tabodds case smoke fw=f,or -smoke|Odds Ratio chi2 Pchi2 95%Conf.
7、Interval smoke|Odds Ratio chi2 Pchi2 95%Conf.Interval-+-+-0|1.000000 .0|1.000000 .1|0.854167 0.11 0.7358 0.341623 2.135687 1|0.854167 0.11 0.7358 0.341623 2.135687 2|1.634058 1.55 0.2130 0.748525 3.567210 2|1.634058 1.55 0.2130 0.748525 3.567210 3|3.548077 13.40 0.0003 1.719470 7.321353 3|3.548077 1
8、3.40 0.0003 1.719470 7.321353-Test of homogeneity(equal odds):Test of homogeneity(equal odds):chi2(3)=17.52 chi2(3)=17.52 Prchi2 =0.0006 Prchi2 =0.0006Score test for trend of odds:Score test for trend of odds:chi2(1)=15.14 chi2(1)=15.14 Prchi2 =0.0001 Prchi2 =0.0001流行病学资料的分析第13页例3(分层病例对照资料)在吸烟与肺癌发生关
9、系研究中,年纪是一个混杂原因,试依据以下资料计算调整年纪后吸烟与肺癌发生关系优势比,并作假设检验。流行病学资料的分析第14页分层病例对照研究o目标:按混杂原因分层,控制混杂原因影响。目标:按混杂原因分层,控制混杂原因影响。o方法方法:Mantel-Haenszel分层分析分层分析(1)(1)公共优势比公共优势比ORORM-HM-H预计算公式为:预计算公式为:(2)(2)对公共优势比进行假设检验对公共优势比进行假设检验,统计量为:统计量为:流行病学资料的分析第15页分层病例对照分析occ 病例变量 暴露变量 fw=频数变量,by(分层变量)omhodds 病例变量 暴露变量 fw=频数变量,by
10、(分层变量)流行病学资料的分析第16页数据结构流行病学资料的分析第17页cc case smoke fw=f,by(age)age|OR 95%Conf.Interval M-H Weightage|OR 95%Conf.Interval M-H Weight-+-+-0|2.224658 1.437382 3.430672 14.28571(exact)0|2.224658 1.437382 3.430672 14.28571(exact)1|4.174907 2.554659 6.821394 7.819588(exact)1|4.174907 2.554659 6.821394 7.81
11、9588(exact)-+-+-Crude|Crude|2.7474562.747456 2.011688 3.743611 (exact)2.011688 3.743611 (exact)M-H combined|M-H combined|2.9145442.914544 2.143308 3.963297 2.143308 3.963297 -Test of homogeneity(M-H)chi2(1)=3.94 Prchi2=0.0470Test of homogeneity(M-H)chi2(1)=3.94 Prchi2=0.0470 Test that combined OR=1:
12、Test that combined OR=1:Mantel-Haenszel chi2(1)Mantel-Haenszel chi2(1)=49.43=49.43 Prchi2 Prchi2=0.0000=0.0000流行病学资料的分析第18页结果解释o粗OR2.75;调整年纪后,ORMH2.91。2MN=49.43,v=1,P=0.0000,差异有统计学意义,故可认为调整年纪后,吸烟1包/天以上者患肺癌危险度是1包/天以下者2.91倍。流行病学资料的分析第19页例4(配对病例-对照研究)某单位为研究软组织肉瘤与接触苯氧乙酸或氯酚关系,作了一次病例-对照研究,结果见下表。流行病学资料的分析第
13、20页配对四格表资料o方法:方法:McNemar检验检验o公式:公式:b+c 40b+c40流行病学资料的分析第21页配对病例对照分析omcc 暴露暴露-病例数病例数 暴露暴露-对照数对照数 fw=fw=频数变量频数变量 omcci#a#b#c#d流行病学资料的分析第22页mcci 3 16 3 30mcci 3 16 3 30|Controls|Controls|Cases|Exposed Unexposed|TotalCases|Exposed Unexposed|Total-+-+-+-+-Exposed|3 16|19 Exposed|3 16|19 Unexposed|3 30|33
14、 Unexposed|3 30|33-+-+-+-+-Total|6 46|52 Total|6 46|52McNemars chi2(1)McNemars chi2(1)=8.89 Prob chi2=0.0029=8.89 Prob chi2=0.0029Exact McNemarExact McNemar significance probability =0.0044 significance probability =0.0044Proportion with factorProportion with factor Cases .3653846 Cases .3653846 Con
15、trols .1153846 95%Conf.Interval Controls .1153846 95%Conf.Interval -difference .25 .0811853 .4188147 difference .25 .0811853 .4188147 ratio 3.166667 1.422659 7.048617 ratio 3.166667 1.422659 7.048617 rel.diff.2826087 .1253028 .4399146 rel.diff.2826087 .1253028 .4399146 odds ratio 5.333333 1.526627 2
16、8.56284 (exact)odds ratio 5.333333 1.526627 28.56284 (exact)b+c chi2=0.0281 chi2(1)=4.82 Prchi2=0.0281解释:率差率差RD=0.3623,95%CI:0.059,0.666)相对危险度相对危险度RR=2.086,95%CI:(0.971,4.485)归因危险度归因危险度 AR=0.521,其其95%CI(-0.030,0.777)人群归因危险度人群归因危险度PAR=0.397 2=4.82,P=0.0281,可认为母亲乳汁中可认为母亲乳汁中IgGIgG抗体滴度高低与婴儿呼抗体滴度高低与婴儿呼吸道
17、疾患发生率相关,吸道疾患发生率相关,滴度较低滴度较低者其婴儿较易患呼吸道疾病者其婴儿较易患呼吸道疾病。流行病学资料的分析第30页队列研究资料-联络强度指标o率差率差RD=P1-P0o相对危险度相对危险度RR=P1/P0o归因危险度归因危险度 AR=(P1-P0)/P1o人群归因危险度人群归因危险度PAR=(P-P0)/P流行病学资料的分析第31页例6(分层队列研究)某人随访研究甲糖宁治疗糖尿病人效果,其中年纪被认为是可能混杂原因,需要对年纪进行分层分析。流行病学资料的分析第32页分层队列研究分析ocs 病例变量 暴露变量 fw=频数变量,by(分层变量)流行病学资料的分析第33页数据结构流行病
18、学资料的分析第34页cs d expose fw=f,by(age)age|RR 95%Conf.Interval M-H Weight-+-0|1.811321 .6112044 5.367898 2.345133 1|1.332908 .7471514 2.37789 8.124352-+-Crude|1.505602 .8917924 2.54189 M-H combined|1.440071 .8637914 2.400817-Test of homogeneity(M-H)chi2(1)=0.240 Prchi2=0.6244o粗RR1.51;调整年纪后,RRMH1.44,其95%C
19、I:0.86-2.40,差异无统计学意义,故调整年纪后,还不能认为甲糖宁治疗糖尿病人有效。流行病学资料的分析第35页小结o病例对照研究 成组病例对照:cc case expose fw=f/cci#a#b#c#dcase expose fw=f/cci#a#b#c#d cc case expose fw=fcase expose fw=f,byby(混杂变量)(混杂变量)分层分析分层分析 tabodds case expose case expose fw=f,or base(#)多暴露珠平 配对病例对照:mcc r r c fw=f/mc fw=f/mcci#a#b#c#dcci#a#b#c
20、#do队列研究 cs case expose fw=fcase expose fw=f/csi#a#b#c#dcsi#a#b#c#d cs case expose fw=fcase expose fw=f,byby(混杂变量混杂变量)分层分析)分层分析流行病学资料的分析第36页课堂练习课堂练习1:流行病学资料的分析第37页课堂练习课堂练习2:例例18-5 在食管癌与饮酒关系分析中,年纪可在食管癌与饮酒关系分析中,年纪可能是混杂原因。将每日饮酒量资料按年纪组分解成能是混杂原因。将每日饮酒量资料按年纪组分解成4个四格表个四格表(表表18-3),预计出各层,预计出各层OR值,可见不一样年纪组值,可见
21、不一样年纪组OR有所不一有所不一样。试进行样。试进行Mantel-Haenszel分层分析。分层分析。流行病学资料的分析第38页课堂练习课堂练习3:例例18-6 依然用食管癌与饮酒关系研究依然用食管癌与饮酒关系研究资料,按照每日饮酒量将暴露珠平分成四组,资料列在资料,按照每日饮酒量将暴露珠平分成四组,资料列在表表18-4,试分析每日饮酒量与食管癌发病是否存在剂量试分析每日饮酒量与食管癌发病是否存在剂量-反应关系。反应关系。流行病学资料的分析第39页课堂练习课堂练习4:例例18-7 利用子宫内膜癌与服用雌激素病例-对照研究资料,资料整理成表18-6。试对以下资料进行分析。流行病学资料的分析第40页课后练习利用帮助功效学习STATA软件中病例对照研究资料分析ohelp ccohelp cs流行病学资料的分析第41页