1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。谢谢,李子建,济南军区疾病预防控制中心,20,13,.,12,医学期刊统计学误用分析,第1页,1,1.医学期刊统计学错误概述,国外学者对一些英文权威医学期刊调查表明,统计学误用率为50%不在少数,有甚至高达70%或100%。,Glantz调查了Circulation Research和Circulation杂志中发表文章,分别有61%和4
2、4%含有统计学错误。,Kanter等调查了1992年7月到1993年6月Transfusion杂志发表文章,发觉75%文章最少存在一处统计学错误。,第2页,2,希腊约阿尼纳大学Ioannidis等人对1990-期间发表在,N Engl J Med,、,JAMA,和,Lancet,三大著名医学杂志上,而且引用次数在1000次以上文件进行调查。,结果显示,在49篇高引用率原始文件中,45篇声称干预方法有效。而汇报结果被以后研究所否定有7篇(15.6%),最初汇报疗效被夸大有7篇(15.6%),所以靠近1/3研究结果没有经受住时间考验。,第3页,3,国际医学科研悖论,美国于1958年开始在外科手术中
3、采取麻醉剂氟烷,到1962年突然掀起一场风波,麻醉剂氟烷有严重副作用,。造成部分患者病情恶化、发烧、肝脏大片坏死而死亡。这关系到麻醉剂氟烷能否继续使用!,第4页,4,国际医学科研悖论,以后研究表明:与,氟烷,、喷妥撒、环丙烷、乙醚和其它麻醉剂对应死亡率分别为,2.1%,、2.0%、2.6%、2.0%和2.5%。,风波自然平息,!,第5页,5,国际医学科研悖论,1978年8月9号光明日报登载一条科技信息:研究者对美国20个城市做饮水氟化研究,10个城市饮水氟化,而另10个城市未氟化作对照。,结论认为饮水氟化有致癌作用。,但过了一个时期,光明日报对此消息进行了更正,。,第6页,6,国内期刊,凌瑞珠
4、阅读了中华医学检验杂志,发觉其原著中50%70%存在统计误用。,王倩等调查了国内5种中华系列杂志发表论文,发觉54%文章不能够正确应用统计分析方法。,毛宗福等汇报了5种中华关键期刊其论著中统计推断应用缺点率为62%。,胡,良平,一直关注国内一流生物医学类杂志发展动向和水平改变情况。经过分析发表在这些关键期刊上论文,发觉其平均统计学误用率达80%;一些国家自然科学基金资助重大科研项目论文,50%以上存在显著统计学错误。,第7页,7,医学统计学应用情况,近几十年来,临床论著中统计应用缺点没有发生根本改进,误用率仍居高不下。,很多医学科研工作者对统计学作用重视不够,突出表现在:,忽略医学科研设计;,
5、在统计分析时盲目套用统计分析方法;,“万能”,t,检验和卡方检验,对统计分析结果解释时轻描淡写,一笔带过。,把统计学看成无关紧要“修饰物”,严重影响了医学科研工作科学性与严谨性。,第8页,8,2.医学期刊统计学错误辨析,试验设计,资料表示与描述,定量资料分析,定性资料分析,相关回归分析,多元资料分析,结果解释,第9页,9,2.1试验设计中常见统计学错误,缺乏完善试验设计计划;,未严格遵照“随机”、“对照”、“重复”、“均衡”标准;,用单原因设计取代多原因设计;,未严格按照试验设计类型正确地进行试验和搜集数据。,第10页,10,试验原因,原因:影响试验结果各种原因,统称,为原因。,原因分为:试验
6、原因与非试验原因,试验原因:研究者希望着重考查试验条,件,称为试验原因。,非试验原因:除试验原因之外其它所,有原因都属于非试验原因。,第11页,11,试验原因,温度、药品、剂量、作用时间等,通常都是“试验原因”;,动物品种、动物起源、体重、性别等通常都是“非试验原因”。,第12页,12,怎样了解“原因与水平”,在16条件下考查去甲肾上腺素,(浓度为110,-9,)对兔肺动脉收,缩压影响。,问:在上面表述中共包括到几个,试验原因?每个原因有几个水,平?,第13页,13,原因与水平,原因是特定试验条件总称,水平是其详细表现。,仅当试验条件有两种或两种以上详细表现时,在统计学上才称其为“原因”,而详
7、细表现称为“水平”。,如:温度:16、30(),剂量:2、4、6、8(mmol/L),第14页,14,松球对慢性气管炎疗效,(1)空白对照组,(2)“松球+麻黄+地龙”组,不妥之处何在?,第15页,15,分析,“麻黄和地龙”都是中药,且对慢性支气管炎有一定作用;,即使“松球+麻黄和地龙”疗效优于单纯空白对照组,岂能将功劳完全归功于“松球”?,第16页,16,释疑,(1)空白对照组;,(2)单用松球组;,(3)“麻黄+地龙”组;,(4)“松球+麻黄+地龙”组。,这叫什么试验设计?,第17页,17,这是两原因析因设计,设A代表“松球用否”;B代表“(麻黄+地龙)用否”,则前面设计为:,-,A用否
8、B用否:不用 用,-,不用 (1)(3),用 (2)(4),-,第18页,18,试验设计基本标准,重复,随机,对照,均衡,第19页,19,重复标准作用,重复三层含义:,重复试验、重复测量、重复取样,重复作用:,掷硬币试验10次与10000次结果可知:,其作用就是“让随机变量改变规律性更加好地显露出来”。,第20页,20,重量法测定血苯-白蛋白加合物初步研究,用气-质联仪(GC-MS)测定血液中苯-白蛋白加合物,因为采取昂贵仪器和同位素内标物,在普通试验室难以进行。本研究采取重量法测定,并与GC-MS法进行比较,,同一标样,用GC-MS法测3次,重量法测7次,分别为1.90.1(mg/ml)和2
9、.00.1(mg/ml),经,t,检验,平均值之间差异无显著性(,P,0.05)。,第21页,21,分析,作者目标是检测两种方法测量结果是否含有一致性。但实际检测时,仅做了一个标样,而且仅对这一个标样进行了重复测量,表面上有若干个数据,但实际上这些数据均来自于一个样品,并不能很好地代表不一样浓度样品所在总体,这么做仅能得出对这一标样屡次重复测量结果准确性高低,并不能推论到普通样品中去。,第22页,22,释疑,应依据专业知识,合理确定标样浓度范围,选定多个标样用当前被公认测定方法和重量法同时进行测量,并选取适当统计分析方法(如直线回归分析,其零假设与备择假设分别为总体斜率=1与1,而不应采取,t
10、,检验),这么才能推论两种方法测量结果是否含有一致性。,第23页,23,随机标准作用,随机 随便,随机:总体中任何一个个体都有同等,机会被抽出,进入样本;,样本中任何一个个体都有同等,机会被抽出,进入任何某一组。,随机作用:,尽可能消除人为原因干扰,和影响,提升样本代表性。,从笼子中抓老鼠分组是随机标准应用吗?,第24页,24,对照标准作用,对照作用:,建立比较,基础,,即设置,参考物,。,对照形式:,空白对照、标准对照、,相互对照、试验对照、,历史或中外对照,第25页,25,银屑病发病与血型关系探讨,原作者对64例银屑病患者进行血型观察,其中O型血30例,A型血17例,B型血17例,AB型血
11、0例。没有进行统计分析,仅凭数字大小,认为银屑病发病与血型有显著关系,同时也证实了遗传致病决定意义。,第26页,26,分析,依据常识,正常人群中血型组成存在较大差异,AB型所占百分比就是最少,作者没有对正常人群血型分布情况进行调查,仅依据自己调查银屑病人血型组成相差悬殊情况,并不能说明银屑病人与正常人群在血型组成上存在差异,作出结论也是没有说服力。,第27页,27,释疑,正确做法应建立正常对照组,调查正常人群血型分布情况,并与银屑病人血型分布情况进行比较,假如存在差异,则为银屑病发病原因提供了某种线索,假如没有差异,则能够认为银屑病发病与血型组成没相关系。,第28页,28,均衡标准作用,均衡含
12、义:,各种非试验原因对各组影响是均等。,均衡作用:,提升组间可比性,增大结论可信度。,第29页,29,臀部注射硬结物理治疗比较,臀部注射硬结117例,男62例,女55例,,年纪18个月68岁,病程1周,注射硬结1cm1cm5cm7cm。,超声碘离子透入组30例,采取洛阳产超声药品透入机,于肌注硬结处涂以10碘化钾软膏。音频电组55例,采取太仓产音频电疗机。红外线组32例,采取落地式红外线治疗灯,局部照射。以上各组均每日治疗一次,15次为一疗程。疗效标准:痊愈:疼痛、硬结均消失;显效:疼痛显著消失,硬结缩小1/2以上;有效:,疼,痛减轻,硬结软化缩小不足1/2;无效:无显著改进(见下表)。,第3
13、0页,30,各组治愈率比较,认为超声碘离子透入法和音频电法治愈率要高于红外线法。,表 臀部注射硬结治疗结果(例数),组别,治愈,显效,有效,超声碘离子透入,11,10,9,音频电,14,24,17,红外线,4,12,16,第31页,31,分析,依据病理常识,硬结预后与年纪、病程及硬结本身大小都有很大关系(年纪小、病程短、硬结小,预后相对好)。从资料能够看出,研究对象年纪跨度大(从18个月到68岁),病程差距大(从1周到),而且硬结大小也存在较大差距(1cm1cm5cm7cm)。原作者对采取何种方法使主要非试验原因在各组间到达均衡未作任何说明,只是一味地将三组拿来直接进行比较,假如均衡性标准掌握
14、得不好,则有可能结论可靠性不高甚至得犯错误结论。,第32页,32,释疑,在进行试验之前,最好进行完善试验设计,明确所要考查试验原因,受试对象,所观察指标,以及对试验结果可能产生影响主要非试验原因,务必使各主要非试验原因在各组间尽可能到达均衡一致,这么得出结论才含有较强可信性和说服力。本例可依据情况按“不平衡指数最小分配标准”来安排试验,将主要非试验原因划分成多个水平,将每个新就诊患者加入各个治疗组,计算出在各种情形下不平衡指数,找出最小不平衡指数所在组,说明新就诊患者假如加入此组,各主要非试验原因在各组间均衡性最好。,第33页,33,提升均衡性对策,(1)研究者本身应有丰富专业知识和统计学知识
15、,(2)请同行教授审阅试验设计方案,(3)请统计学专业人员提提议,第34页,34,2.2资料表示与描述中常见统计学错误,编制统计表时纵、横标目颠倒,同一表中表示不一样性质内容,表中数据含义表示不清;,绘制统计图时资料类型与所选取统计图不匹配,坐标轴上所标刻度值违反数学标准;,使用均数标准差(误)形式表示一切定量资料集中趋势和离散趋势;,利用相对数时,分母过小,将组成比与百分率混用。,第35页,35,准分子激光原位角膜磨镶术治疗近视散光初步研究,原作者将B、C两组患者手术前后散光轴夹角度数改变绘制以下。,图 B、C两组患者手术前、后散光轴夹角度数改变(原图),第36页,36,分析,图中x轴上用等
16、长间隔代表不等时间段,这么绘制线图,其折线倾斜程度是一个假象,歪曲了事实。,第37页,37,释疑,统计图坐标轴上刻度应符合数学标准,即对于算术尺度来说,等长间隔应代表相等数量。,修改见下列图(右),可见散光轴夹角度数术后1周上升很快,以后下降较缓。,第38页,38,600例小儿烧伤休克期治疗分析,原作者在文中指出:“600例烧伤患儿,210例早期有休克症状,其中,3岁以下者110例,占52%,3岁以上者100例,占48%,,年纪越小,休克发生率越高。”。,第39页,39,分析,“比”和“率”都是相对指标,其公式基本形式相同,都是由两个绝对数之商乘以100%而得。但二者有区分,组成比是反应一事物
17、内部各组成部分在总量中所占比重,是组成相对数;而率则表示在一定时间和范围内,某现象发生次数与该现象可能发生总数之比,是强度相对数。文中两个相对数均为组成比,而作者却深入解释为“年纪越小,休克发生率越高”,把“组成比”当成“百分率”,是不妥。,第40页,40,释疑,600例烧伤患儿,210例早期有休克症状,则休克发生率为35%,此指标反应休克发生强度,属于百分率。210名休克患儿中,3岁以下者110例,占52%,3岁以上者100例,占48%,反应了事物各个组成部分所占比重,应为组成比,欲求各个年纪段休克发生率,应先算出各个年纪段患儿总数,然后拿各年纪段休克人数除以患儿总数,才是各年纪段休克发生率
18、。,第41页,41,猪活体脑片钙离子荧光强度测定及对停循环后脑缺血损伤评价,原文中资料表示见下表。,表 猪小脑病理定量(%,,),组别,猪数(只),空泡变性,轻度嗜酸,性变性,中度嗜酸,性变性,重度嗜酸,性变性,试验组,8,11,20,1927,312,00,对照组,8,28,2125,3126,3218,第42页,42,分析,“平均数标准差”是用来表示呈正态分布资料,说明其数据分布集中趋势和离散趋势。从表中数据能够看出,大部分标准差大于平均数,有甚至是平均数4倍,基本上能够认为此资料服从偏态分布,不适适用正态分布法说明此资料集中趋势和离散趋势。,第43页,43,释疑,描述偏态分布资料集中趋势
19、应该选取中位数,描述其分散趋势应该选取四分位数间距,其形式为“M(Q,R,)”,M代表中位数,Q,R,代表四分位数间距,Q,R,=Q,3,Q,1,由第3四分位数减第1四分位数得来。因为没有原始数据,故只能解释一下。,第44页,44,2.3定量资料分析中常见统计学错误,误判资料性质而采取定性资料分析方法;,忽略资料前提条件而盲目采取参数检验;,不能正确地识别资料设计类型,用,t,检验或单原因k(k3)水平设计资料方差分析处理一切定量资料。,第45页,45,美喘清与博利康尼治疗支气管哮喘各40例临床疗效与副作用比较,原作者选择80例哮喘病人随机分为美喘清组与博利康尼组各40例,统计各组病人发生疗效
20、时间,见下表。所得结果用,2,检验进行处理,认为美喘清较博利康尼发生疗效时间早,且差异有显著性(,P,0.05)。,表 美喘清与博利康尼疗效发生时间(h)比较,组别,例数,时间,0.5,1,2,24,48,72,美喘清,8,9,8,8,4,3,博利康尼,2,4,6,8,10,10,第46页,46,分析,严格地说,每个哮喘患者都能提供一个药品发生疗效时间,因而此资料从本质上讲应为定量资料,上表只是为了表示方便列出不一样时间点上频数分布,并不代表此资料中结果变量就为定性资料。原作者采取普通,2,检验对资料进行处理,,2,检验所能回答问题与原作者分析目标不一致。此时得出结论只能是美喘清组和博利康尼组
21、在不一样起效时间组成上存在差异是否含有统计学意义,并不能得出两组起效时间之间差异含有显著性意义。,第47页,47,释疑,最好将此资料中发生疗效时间还原为原始值,然后按成组设计定量资料进行统计学分析,假如每组发生疗效时间符合正态分布且两组发生疗效时间满足方差齐性,则能够进行成组设计资料,t,检验,假如不满足,t,检验前提条件,则可采取非参数统计,如成组设计两样本比较秩和检验。假如每位患者药品起效时间不像表所表示那样准确,只是一个时间段(如:00.5,0.51,4872),则能够按结果变量为有序变量单向有序列联表资料所对应统计分析方法如秩和检验,Ridit分析等进行处理,当然这么做通常会损失一部分
22、信息,降低了检验效能。,第48页,48,血清肿瘤标志在结直肠癌诊疗中作用,为研究CEA、CA19-9、CA72-4和CA242四项肿瘤标志在患者手术前、手术后及转移复发有没有差异,分别检测了58名手术前患者,30名手术后患者及19名转移复发患者,测量其四项指标,并进行,t,检验,,结果见下表。,第49页,49,表 手术前后4项肿瘤标志检测结果(),不一样时期,CEA,(,g/L),CA19-9,(,10,3,U/L),CA72-4,(10,3,U/L),CA242,(10,3,U/L),术前(n=58),34.079.0,209.0739.0,7.24.8,111.0179.0,术后(n=30
23、),2.01.2*,11.010.9*,4.32.8*,10.817.5*,转移复发(n=19),88.0107.0,212.0529.0,9.83.2,148.0240.0,注:与术前组相比较:*,P,0.05,P,*0.01,第50页,50,分析,本例中若干个单元格中标准差数值是均值2倍以上,基本上能够认为此资料服从偏态分布,不一样组间标准差也相差悬殊,并不满足方差齐性要求。作为参数检验方法,,t,检验和方差分析有其应用前提条件,只有经过正态性和方差齐性检验,满足条件后才能应用。本资料分了术前组、术后组及转移复发组,相当于一个原因3个不一样水平,从设计类型上判别应为单原因3水平设计资料,原
24、作者用了,t,检验进行分析,一样是错,因为,t,检验仅适合分析单组、配对及成组设计资料,并不适合分析单原因K(K3)水平设计资料和多原因设计资料。,第51页,51,释疑,若资料不满足参数检验前提条件,可选取适合分析偏态分布资料非参数检验(如秩和检验)进行分析,或找到满足前述两个前提条件对应变量变换方法后,再用对应参数检验法,因为试验设计类型为单原因3水平设计,可选取对应设计资料方差分析进行处理。,第52页,52,开胃理脾口服液对脾虚小鼠肠功效影响,某研究者为了研究开胃理脾口服液对脾虚小鼠胃肠功效影响,取70只小白鼠随机分为七组,每组10只,第一组为空白组,给等容生理盐水,其余各组给100大黄水
25、煎液一周(ig(即静脉注射)一次/日),造成脾虚模型。停食24h后,第一、二组ig含有10炭末冷开水,第三至五组给含10炭末开胃理脾口服液,第六组给含10炭末开胃理脾丸剂,第七组给含有10炭末儿康宁。给药30min后处死小鼠,打开腹腔,剪取小肠,分别测量小肠总长度和炭末在肠内推进距离,推进距离除以小肠总长度计算炭末推进百分率。各组详细剂量和推进率见下表,原作者对各组数据采取成组设计定量资料,t,检验,处理。试验表明,模型组与空白组比较,含有非常显著性差异,开胃理脾口服液低、中、高剂量与模型组比较含有显著性差异,提醒本品含有促进小鼠小肠运动功效作用,其作用强度较丸剂好。,第53页,53,表 各组
26、对小鼠小肠运动影响,组别,剂量(g/kg),推进率(),空白组,0,86.18,5.81,模型组,0,75.835.56,*,口服液低剂量组,2.34,91.225.32,口服液中剂量组,7.02,94.206.39,口服液高剂量组,21.06,95.003.87,丸剂组,2.34,80.2012.22,儿康宁组,2.34,92.209.03,注:与模型组比较#,P,0.05,#,P,0.01;与空白组比较*,P,0.05,*,P,0.01;与丸剂组比较,P,0.05。,第54页,54,分析,很多人简单地把上表资料视为单原因七水平设计定量资料,在实际进行统计分析时,又把它视为多个单原因两水平设
27、计(即成组设计)定量资料,重复采取成组设计定量资料,t,检验处理,这是很不正确做法。显然,在上表中,“组别”一词所代表内容是很多,现有受试动物“是否属于脾虚模型”,又有服用开胃理脾口服液“剂量”,还有服用药品剂型“是口服液还是丸剂”,甚至还有“是否服用药品(不服药、服开胃理脾药、服儿康宁)。但在已设计七个组中,没有将前述诸原因各水平之间全方面组合,而只实施了其中一部分,所以,本例中“组别”所代表原因属于“非平衡组合原因”。不考查资料试验设计类型,屡次用,t,检验进行两两比较,依据概率计算原理,这么做会大大增加犯假阳性错误概率。,第55页,55,释疑,在实际分析时,可依据不一样分析目标,拆分成若
28、干个组不一样组合,方便于识别设计类型和选取统计分析方法,作出正确专业结论。本例可依据不一样分析目标拆成以下几个组合:,组合1:空白组与模型组,组合2:模型组、低剂量组、丸剂组、儿康宁组,组合3:模型组、中剂量组、丸剂组、儿康宁组,组合4:模型组、高剂量组、丸剂组、儿康宁组,组合5:模型组、低剂量量、中剂量组、高剂量组,第56页,56,释疑,上述5种组合中,组合1可用成组设计资料,t,检验进行分析,后4种组合可视为单原因4水平设计,假如资料满足正态性和方差齐性,可利用对应方差分析进行统计分析,不然,可利用非参数检验如秩和检验进行分析。若各组合下组间差异经检验含有显著性意义,还可深入采取dunne
29、tt,t,检验(它不一样于通常,t,检验)分析其余各组与模型组之间差异是否含有显著性意义。,第57页,57,2.4定性资料分析中常见统计学错误,误用,t,检验分析定性资料;,对列联表中定性变量性质不加区分,误用,2,检验分析一切定性资料;,所采取统计分析方法与分析目标不一致;,对高维列联表资料随意压缩。,第58页,58,美泰宁对睡眠作用影响,原作者研究美泰宁对戊巴比妥钠诱导小鼠睡眠影响,选取40只体重相近雄性小鼠,随机分为溶剂对照组和3个剂量组,即0.0、12.5、25.0、75.0mg/kg体重,用蒸馏水配成所需浓度,天天灌胃。第7天灌胃15分钟后,给各组动物按28mg/kg体重剂量腹腔注射
30、戊巴比妥钠,以小鼠翻正反射消失达1分钟以上作为入睡判断标准,,观察给戊巴比妥钠25分钟内各组动物发生睡眠动物数。,经统计学处理,中、高剂量组与溶剂对照组比较差异有非常显著性(,P,0.05,25.0,10,8,80.0,3.182,0.01,75.0,10,8,80.0,3.182,0.01,第60页,60,分析,统计资料经常分为定量资料和定性资料两大类,所谓定量资料是指每个观察单位用计量方法测量某项指标数值大小;而定性资料是指统计每个观察单位某首先特征和性质。本资料观察是动物入睡情况,原作者把每组入睡每一只动物记为1,不睡动物记为0,这么第一组有2个1,8个0,第二组有5个1,5个0,第一组
31、和第二组各10个数据进行,t,检验,得,t,=1.406,,P,0.05(经验算,就计算本身而言,原作者计算结果是正确)。,第61页,61,分析,但实际上这里1并不代表真正数值,它只是代表一个状态,即入睡,而0则代表没有入睡,因而本资料从性质上说应属于定性资料。但原作者却错误地将其判断为定量资料,表标题后括号内写了 形式,但实际上表中并没有表示平均数和标准差数据,反而误导读者该资料为定量资料。普通来说,,t,检验仅适于分析定量资料,用分析定量资料方法去分析定性资料,显然是错误。,第62页,62,释疑,正确判定统计资料属于定量资料还是属于定性资料是选取统计分析方法首要前提,本资料属于定性资料,应
32、依据分析目标,合理选取适合这类资料分析方法(如fisher准确检验)进行统计分析。,第63页,63,果糖二磷酸钠治疗新生儿缺氧缺血性脑病疗效观察,为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病疗效,随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞二磷胆碱。治疗效果分为无效、有效和显效三个等级,见下表。原作者进行普通,2,检验,,2,=4.74,,P,0.05,认为两组疗效之间差异有显著性意义。,第64页,64,表 观察组和对照组疗效比较,组别,例 数,疗效:,显效,有效,无效,观察组,58,44,18,对照组,56,43,35,第65页,65,分析,此资料中原因变量(组别)是名义变量,结
33、果变量(疗效)是有序变量,因而属结果变量为有序变量单向有序列联表资料。因普通,2,检验与变量有序性没有联络,用普通,2,检验进行分析,得到结论是两组疗效频数分布是否相同,而不能得出两组疗效差异是否含有显著性意义结论。,第66页,66,释疑,适合分析单向有序列联表资料统计分析方法有秩和检验或Ridit分析等。本例采取秩和检验进行统计分析,Hc=2.8107,,P,=0.0936。不能得出两组疗效之间差异有显著性意义结论。,第67页,67,盆炎栓与野菊花栓治疗慢性盆腔炎对比观察,欲比较盆炎栓和野菊花栓治疗慢性盆腔炎疗效,分别用盆炎栓和野菊花栓治疗慢性盆腔炎300例和100例。治疗情况见下表。经,2
34、,检验,认为盆炎栓组痊愈率与野菊花栓组痊愈率存在显著性差异,前者高于后者(,P,0.01)。,第68页,68,表 两组疗效比较,病情程度,盆炎栓组人数,野菊花栓组人数,痊愈,未痊愈,痊愈,未痊愈,轻度,51,36,10,20,中度,64,74,24,28,重度,23,52,4,14,第69页,69,分析,这是一个结果变量为二值变量三维列联表资料,原作者经过简单求和把病情程度这个变量合并掉,采取普通,2,检验来分析不一样治疗组痊愈率之间差异是否有显著性意义,假如不一样治疗组病情程度分布情况不一样,即病情程度这个变量与“治疗方式”和“痊愈是否”两个变量之间并不是独立,则很轻易得犯错误结论。,第70
35、页,70,释疑,本资料适合采取加权,2,检验或M-H,2,检验进行处理,经过计算,将病情程度对不一样治疗方法影响扣除掉,从而对不一样治疗方法疗效评价更可信。经计算,,2,加权,=2.692,,P,=0.101,,2,MH,=2.673,,P,=0.102,即在扣除病情程度对不一样治疗方法影响后,尚不能认为两种方法痊愈率之间差异含有显著性意义,与原作者结论相反。,第71页,71,2.5相关回归分析中常见统计学错误,混同相关与回归概念,对型回归分析资料作相关分析;,散布图并不反应直线趋势,而作直线相关分析;,单凭相关系数假设检验结果作出必定专业解释与推断;,把相关关系直接解释为因果关系,第72页,
36、72,固定化葡萄糖氧化酶流动注射化学发光法测定血糖,原作者利用固定化葡萄糖氧化酶流动化学发光法测定50份血样血糖,并与传统氧化酶比色法相比较,每份样品用两种不一样方法均重复测定3次,两种符合程度相关系数,r,=0.90,,P,0.05,故认为原作者方法与传统氧化酶比色法测定结果无显著性差异,所以可推广应用于大量血样检测。,第73页,73,分析,进行直线相关分析目标是研究在专业上有一定联络2个变量呈直线关系亲密程度和方向,所用统计量称为相关系数,r,,当样本含量n固定时,若|,r,|越靠近0,表明X与Y之间呈直线关系亲密程度越低;若|,r,|越靠近于1,表明X与Y之间呈直线关系亲密程度越高。相关
37、系数大小受数据对子数和抽样误差影响,为了尽可能排除抽样误差影响,较客观地反应出2个变量之间呈直线关系亲密程度,需要进行假设检验,以判断总体相关系数是否等于零。所以相关系数,r,计算出来,并经假设检验拒绝原假设后,能够认为两个变量之间呈直线相关关系,但并不能说明两检测方法之间符合程度高。,第74页,74,释疑,本资料经绘制散布图,满足直线回归分析前提条件后,能够求出直线回归方程来,因为该资料含有重复试验数据,因而还应该进行失拟检验,以排除其它原因影响,然后对总体直线斜率与1,总体截距与0差异进行显著性检验,假如前者检验结果为接收原假设H,0,:=1,后者检验结果为接收原假设H,0,:=0,则能够
38、认为回归直线经过原点,并与坐标轴成45夹角,可认为两检测方法含有一致性。,第75页,75,高脂餐后内皮依赖性血管舒张功效改变及其影响原因,原作者对75名受试者测定了餐后2小时血清TG浓度增高值与餐后内皮依赖性血管功效下降值(%),并给出了散布图(见右图),经相关分析,认为餐后2小时血清TG浓度增高值与餐后内皮依赖性血管功效下降值显著正相关(,r,=0.459,,P,20ml发生率在用药组与对照组之间差异是否含有统计学意义,,2,=0.896,,P,=0.344;,第89页,89,释疑,对于两组呕吐发生率比较,一样可按四格表资料普通,2,检验进行处理,,2,=1.195,,P,=0.274;对于
39、两组人流综合征发生率比较,即使也为四格表资料,但因为有两个格子内理论频数小于1,并不适适用普通,2,检验前提条件,而应选取fisher准确检验,经计算,准确概率,P,=0.364。对前述三项指标进行正确统计分析,所对应,P,值均0.05,不能拒绝各自原假设,能够认为出血量、呕吐发生率和人流综合征发生率在两组之间差异并没有显著性意义,均与原作者结论相反。,第90页,90,3、结语,科研设计类型多,研究目标不一样,对应统计分析方法多,错误类型多,此次所列错误只是枚举,难免挂一漏万。,第91页,91,学好统计,我体会:,建立正确统计思维和思想。统计学思想是最主要,统计学是一门相对独立科学,切忌把它当成一门课来学。统计学也是一门应用性很强学问,切忌生搬硬套。努力把握统计研究设计要领。掌握选取统计分析方法秘诀。,采取逆向法,从公开发表医学论文中各种错误实例入手,给出问题原型,拿到课堂上进行讨论。,第92页,92,经过这种类似“实战”学习模式,使学习者深刻了解、熟练掌握统计学基本概念和方法,并能到达举一反三、融会贯通之效果。降低自已在实际应用统计中出现错误机会,增强处理各种实际问题能力。,熟练应用统计软件,处理各种实际统计分析问题。,第93页,93,欢迎交流,第94页,94,