资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,浙江大学公共卫生学院流行病与卫生统计学科系,沈毅,*,医学科研设计与统计学思维,浙江大学公共卫生学院流行病与卫生统计学科系,沈毅,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,医学科研设计与统计学思维,医学科研设计与统计学思维,医学统计学要说它简单吧,其实也挺简单的,常见的,统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,,虽不敢夸下海口说可以,“,以秋风扫落叶的气概横扫四海之内的杂,志,”,,但足以轻车熟路地应付一般的科学研究。要说它复杂吧,,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在,SCI,杂志上,乱用统计学的现象多如牛毛。很多人在学习医学统计,学时,都在抱怨自己很难走出,“,一学就会,一会就用,一用就错,,一错就懵,”,的怪圈。究其原因,主要是我们在学习医学统计学时,都抱着一副,“,依葫芦画瓢,”,的态度,试图,“,套用统计学方法,”,来解决,自己面临的问题,而不去仔细思考统计学方法的本身的特点。,医学科研设计与统计学思维,没有设计的临床干预试验,1685,年抢救英国国王查理二世(,Charles II,,,1630-1685,):,“,一品脱(,0.568L,)血从右臂放出,半品脱血从左肩放出,服下催吐剂、两付汤药和一种由,15,成份的灌肠剂。刮国王的头部,直到起一个大泡。再服打喷嚏的药粉和更多的催吐剂。继续放血,加服止痛剂。把沥青和鸽子粪混合后敷于脚上。服一种含有,10,种成份的草药。最后服人头盖骨粉制成的,40,滴糖浆,外敷牛黄。然后,国王陛下死了。,”,医学科研设计与统计学思维,有设计的临床干预试验,1747,年,5,月,20,日,英国的,J.Lind,医生将,12,名病情相同似的患者带到一艘船上。患者的主要症状是牙龈溃烂,皮肤有出血点,双膝无力。,Lind,将,12,名患者分为,6,组,分别给予下列主要干预:,A,组:每天饮,1,夸脱(,1.136L,)苹果汁;,B,组:服,25,滴硫酸丹剂(,elixir vitriol,),每天,3,次;,C,组:服,2,匙醋,每天,3,次;,D,组:每天饮约半品脱海水,服缓和的泻药;,E,组:每天食,2,个桔子,一个柠檬;,F,组:每天服由大蒜、芥子等成份组成的干药。,当,6,月,16,日船返回英国,Plymouth,港时,所有患者的病情都有好转,其中,E,组恢复的最快、最好,其中一人到第,6,天就可以工作了。,B,组也有一人比登船时健康。,Lind,医生的试验并没有得出明确的结论,直到,160,年后,通过动物实验才真正从科学意义上解释了,E,组疗效最好的真正原因。,医学科研设计与统计学思维,J.Lind,医生的研究有二点符合统计学的设计:,1,、设立了对照(相互对照);,2,、质量控制(消除了一些混杂)。,如果我们今天重复,J.Lind,的研究,在统计设计的上,还需要做到以下几点:,1,、研究对象的定义与纳入标准和排除标准,2,、足够多的观察对象,3,、效应指标的选择,4,、结论是否能外推,医学科研设计与统计学思维,统计学方法用于干预试验,1835,年,法国医生,P.C.A.Louis,对当时流行的“放血”疗法治疗肺炎的效果进行了比较,发现“放血”的疗效不象预期的那么好,而且早期“放血”和晚期“放血”组比较,患者的诊断、病情、病程、年龄等方面的差异很大,比较平均治愈时间意义不大。因为晚期“放血”组的平均治愈时间长,但该组患者病情重、病程长、年龄大。,Louis,对医学研究的方法学作出了很大贡献:,(,1,)用数字的方法表示不同疾病患者的特征和预后;,(,2,)提出了临床疗效对比的前瞻性原则;,(,3,)提出抽样误差和混杂(,confounding,)概念。其中前瞻性研究和减少混杂,分别成为当今临床试验和流行病学研究的基本研究方法;,(,4,)在,J.Gavarret,的协助下,,Louis,的数字方法发展为“概率框架”,,Gavarret,也于,1840,年在巴黎出版了世界第一部医学统计学教科书。,医学科研设计与统计学思维,“,非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险,”,F.Yates,,,M.J.R.Healy,医学论文中的统计问题,统计知识的运用,撰写论文:报告自己观察或实验的研究结果,阅读论文:吸收新知识,了解学术进展,1996,年,对申报科技成果的,4586,篇科研论文分析,,统计方法使用率为,76%,。,医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。,医学科研设计与统计学思维,“,调查结果反映了医学论文作者统计知识和统计水平的低下,也再次强调了生物统计学者不是令人生畏的检查官。恰恰相反,生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱,”,-JAMA,的编辑部,60,年代到,80,年代,国外医学杂志调查结果:有统计错误的论文,20%72%,。,1984,年对,中华医学杂志,、,中华内科杂志,、,中华外科杂志,、,中华妇产科杂志,、,中华儿科杂志,595,篇论文的调查结果:,相对数误用为,11.2%,抽样方法误用,15.9%,统计图表误用,11.7%,1996,年对,4586,篇论文统计(中华医学会系列杂志占,6.9%,),数据分析方法误用达,55.7%,。,医学科研设计与统计学思维,科学容不得半点虚假,造假者一旦被揭露就背上了永远洗脱不掉的耻辱,。,伪造统计数据违反科学道德,据,1976,年,New Science,杂志关于科研舞弊行为的调查,74%,的调查表反映有不正当修改数据的情况,其中,,17%,拼凑实验结果,,7%,凭空捏造数据,,2%,故意曲解结果。,就统计学本身来说,正确实验设计得出的统计结果,是用,P,值作为“重现性”的概率保证。,P,0.05,,就是说实验结果显示的差别是机遇所致的可能性不足,5%,,或者说,别人在同样的条件下重复同样的试验,得出相反结论的可能性不足,5%,。,医学科研设计与统计学思维,总体,样本,抽取部分观察单位,统计量,参,数,统计推断,统计推断,statistical inference,如:样本均数,样本标准差,S,样本率,P,如:总体均数,总体标准差,总体率,内容:,参数估计,(estimation of parameters),包括:点估计与区间估计,2.,假设检验,(,test of hypothesis),医学科研设计与统计学思维,总体,样本,抽取部分观察单位,统计量,参,数,统计推断,抽样误差,如:,样本均数,样本标准差,S,样本率,P,如:,总体均数,总体标准差,总体率,抽样误差,(,sampling error),:由于个体差异导致的,样本,统计量与,总体,参数间的差别。,医学科研设计与统计学思维,统计的结论是推断而不是证明,正确的统计结论必须,建立在科学的设计和合适的统计方法上,否则得到是不恰,当或是错误的结论。,1,、收集数据的方法(研究假说、调查或实验设计、误,差和偏倚的控制等),2,、分析数据的方法(变量的类型、数据的分布、研究,目的和因素等),3,、结论的外推(统计结论是否适合所有研究对象),医学科研设计与统计学思维,1.,采用统计学方法,发现不确定现象背后隐藏的规律。,变异,(,variation,)是社会和生物医学中的普遍现象。,变异使得实验或观察的结果具有,不确定性,,如每个人的身高、体重、血压等各有不同。,一、为什么要学统计学?,医学科研设计与统计学思维,最大值,=6.18,最小值,=3.29,极差,=2.89,。,算术均数,=4.72,,标准差,=0.57,。,医学科研设计与统计学思维,案例一:两个指标诊断疾病的问题,路人甲做了一个研究,旨在比较两个指标(,A,和,B,)对肝癌的诊断价值。路人甲以,A,和,B,的参考范围上限作为诊断界值,得出了,A,和,B,在该界值下对应的诊断敏感性和特异性。结果表明,,A,的诊断敏感性为,0.80,,特异性为,0.90,;,B,的诊断敏感性为,0.85,,特异性为,0.87,。路人甲很快撰写论文报道了自己的研究成果,指出,B,诊断肝癌的敏感性高于,A,,而特异性低于,A,。,路人乙是这篇文章的审稿人,当他看见这个结论后,毫不犹豫地在审稿意见中写道:就敏感性而言,,B,高于,A,;就特异性而言,,A,高于,B,。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映,A,和,B,的诊断价值。文章的结论到底是想说明,A,优秀还是,B,优秀呢,Reject!,这个例子说明:,统计指标选错了,,统计出来的东西往往难以,“,自圆其说,”,。,医学科研设计与统计学思维,稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较,ROC,的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了,ROC,曲线,统计结果表明,,A,的曲线下面积为,0.80,,,B,的曲线下面积为,0.82,。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:,B,的诊断效率是优于,A,的,其理由就是因为,B,的曲线下面积大于,A,。,路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,,B,的曲线下面积高于,A,,但是导致这种差异的原因有两种,一种是随机误差,一种是试验效应,即,B,确实是高于,A,的。你怎么能确定这不是抽样误差呢?在统计学上,要确定,0.82,是否高于,0.80,,就一定要经过统计学检验的。又,Reject!,这个例子说明:在医学科研中,,没有经过统计学检验的结论杂志社多半认为是不科学的。,医学科研设计与统计学思维,稿件又被退了,路人甲很是郁闷。他吸取了经验教训,自学了很多统计学理论,终于弄清楚了采用何种方法去比较曲线下面积。接下来的事情就是改稿,然后另选杂志继续投稿。路人甲在文稿中特别注明了,曲线下面积是经过了统计学检验的,,B,的曲线下面积(,0.82,)与,A,的曲线下面积(,0.80,)之间的差异是有统计学意义的,而且还大摇大摆地在后面加了个括号,写明,P=0.01,。路人甲仰天长叹了一口气,很郑重地给自己的研究下了结论:本研究表明,B,的诊断效率是优于,A,的。,路人丁是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:,B,是常见的诊断指标,其检测结果并不对临床医师设盲,在很大程度上可以检测影响临床医师对疾病的诊断。,A,是新进发现的诊断指标,其结果完全对临床医师设盲,不可能影响医生的诊断。所以作者的结论(,B,比,A,优秀)是不可靠的。再说得通俗点,如果把,A,和,B,分别理解成法庭上的原稿和被告,那,B,无疑既充当了辩护律师,又充当了法官的角色。在这种情况下,,A,输掉了官司是十分正常的。如果换一个公平的、独立的法官来断案,,B,能否胜出就不好说了。,再一次,Reject!,这个例子说明:,实(试)验设计有缺陷,即便是统计学方法准确也于事无补,。,医学科研设计与统计学思维,稿件又一次被退了,路人甲的心情极度郁闷。思来想去,决定把实验重做一遍,让,A,和,B,在一个公平的环境中比较(为便于描述,此处忽略医学伦理学问题)。在新开展的研究中,,A,和,B,都是对临床医生设盲的,不可能影响金标准。这下,A,和,B,的比较结果应该比较可靠了吧,路人甲又仰天长叹了一口气,感觉自己如释重负了。,科研太折腾人了,太不容易了!,统计结果很快出来,,A,的曲线下面积是,0.80,,,B,的曲线下面积则变成了,0.77,,经过统计学检验后发现,,A,的诊断效能确实是高于,B,的。整个研究的试验设计滴水不漏,统计学过程天衣无缝,我就不信还有人敢拒这篇稿件,路人甲心中开始暗喜。,医学科研设计与统计学思维,路人戊是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:,A,和,B,的检测并不矛盾,他们之间的关系不应该是竞争关系,而应该是合作关系。读者最关心的问题显然不是,A,和,B“,孰强孰弱,”,的问题,虽然这个问题有一定的专业价值。如果我是坐诊医生,我会说:,A,和,B,谁强谁弱关我什么事?总之来一个病人我就,A,和,B,都检测,我的患者都不差钱!作者的研究重点应该是明确,A,和,B,能否互补,联合使用是否能有助于提高诊断准确性的问题,而非,A,和,B“,孰强孰弱,”,的问题。简单地说,就是明确,1+1,是否大于,1,的问题。,还是被,Reject!,(作者吐血),这个例子说明:,研究方向错了,即使是无懈可击的实(试)验设计和天衣无缝的统计方法,也是无济于事。,这四个例子说明:医学科研是很痛苦的,不重视统计学和科研设计,会走很多弯路的。,医学科研设计与统计学思维,2.,用统计学思维方式考虑有关医学研究中的问题,“,阳性,”,结果是否是虚假联系?,某感冒药治疗,1,周后,治愈率为,90%,,能否说该感冒药十分有效?,以前的许多研究表明,血清甘油三酯的含量与冠心病危险性有关,即甘油三酯的含量越高,患冠心病的危险性就越大。有的医生以此筛选危险人群?,冠心病,甘油三酯,胆固醇,+,高密度脂蛋白,虚假联系,医学科研设计与统计学思维,案例二,,,如何看待统计学结果,路人甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白,A,)。在肝癌患者中展开的研究表明,蛋白,A,和甲胎蛋白(,AFP,)有很好的相关性,其相关程度之好,几乎可以用,“,一塌糊涂,”,来形容,相关系数达到了,0.99,(,P0.0001,)。路人甲欣喜若狂,,尽管蛋白,A,的检测过程还十分繁琐,检测费用还十分高,,但是路人甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。,路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白,A,和,AFP,的相关性十分明显。如果是这样,在临床实践中,通过检测,AFP,完全就可以得知蛋白,A,的浓度了,蛋白,A,在肝癌中的临床价值完全可以被,AFP,代替,还不说蛋白,A,的检测过程繁琐,费用太高的问题,你说蛋白,A,还有什么价值?,Reject,!,这个例子说明:,统计学阳性的结果未必是,“,好结果,”,。,医学科研设计与统计学思维,如:当专业上有一定联系的两个变量之间的变化呈“,S,型”或“倒,S,型”曲线趋势时,若错误地用直线方程去描述,从统计学角度看效果也很好,但在专业上是解释不通的。再比如,某两个统计量(如均值、率等)之间的差别在统计学上有显著性意义,有时在专业上并无实用价值。如某种新的降压药,平均降低血压,2 mmHg,,若样本含量较大,误差又较小,统计检验可能会得到“,P,0.05,”的结果,但在临床上却认为此新药的疗效没有多大提高。,另外,在运用统计学中,稍有不慎都可能犯这样或那样的错误。因此,统计结论的可靠性仍需通过实践去检验。,所以,应当牢记:运用统计学时必须结合医学实际,才能真正发挥统计学应有的作用。,组别,N,基线血压,(mmHg),治疗后血压,(mmHg),标准差,(mmHg),P,值,95%CI,(mmHg,),统计学意义,临床意义,治疗组,200,160,142,6,0.05,0.83.2,有,无,对照组,200,160,144,6,有统计学(差异)意义,并不代表有生物学、临床意义,医学科研设计与统计学思维,案例三,降糖药的研究、学生自杀事件,某医生长期从事降糖药的研究,最近他发现了一种药物,可以降低患者的血糖。为了评价该药的降糖效果,路人甲费尽心机地设计了一个看似完美的随机对照试验(,RCT,),为了保证结果可靠,路人甲严格遵守,RCT,设计准则,包括随机、双盲、安慰剂对照等措施。研究结果表明,实验组和对照组在接受药物治疗前血糖浓度的均值都是,10mmol/L,,差异无统计学意义,表明两组研究对象的基线特征具有可比性。对照组未经任何药物治疗(为便于描述,此处忽略医学伦理学问题),血糖浓度还是,10mmol/L,;实验组经过药物干预后,血糖浓度变成了,9mmol/L,,统计学检验结果表明,实验组和对照组治疗后的血糖浓度的,差异是有统计学意义的(,P0.01,),。路人甲赶紧撰写论文,并毫不客气地给研究下了个结论:,该药可以降低患者血糖。,医学科研设计与统计学思维,路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:却要确实可以降低血糖,但是一个只能降低,1mmol/L,的降糖药有何临床价值?,Reject!,这个例子说明:,有统计学意义不一定有专业意义。,医学科研设计与统计学思维,某,CDC,做了一个调查,同处一地的,A,和,B,两所中学,各有,1000,名学生,过去的一年,,A,校有,5,名学生自杀(自杀率为,0.5%,),,B,校没有学生自杀(自杀率为,0%,)。统计学结果表明,两校自杀率的差异无统计学意义(,P=0.07,,,Fisher,确切概率法)。于是写论文得出结论:,A,和,B,两校的自杀率是没有统计学上的差异,,A,校,5,名学生自杀纯属小概率事件。,路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:,5,个鲜活的生命就这样没有了,,5,个家庭就这样毁了,你却告诉我这纯属小概率事件,你就不怕,“,人神共愤,”,吗?,Reject!,这个故事说明:,有专业意义不一定有统计学意义。,这两个故事说明:统计学只是方法学,医学科研中需要借助统计学方法来发现事物的规律性,但,不能死磕统计。,医学科研设计与统计学思维,例:某医生用一种新的治疗某病的疗法(简称治疗组),用现在公认的疗法作为对照(简称对照组),经临床试验,对照组和治疗组的疗效分别为,P,1,=75%,与,P,2,=95,。问:能认为这两个有效率之间的差别有显著性意义吗?答:这两个有效率之间的差别可能有统计学意义,也可能没有统计学意义。因为其结论不仅取决于二者之差的绝对值大小,更主要的是取决于随机误差的大小和样本大小,千万不可轻率地作出统计推断。现假定这两个有效率分别来自下列甲、乙、丙三批实验的结果,则具有下列,3,种不同的统计检验结果。,“阴性”结果是否是样本含量不足?,有人曾对发表在,Lancet,N Engl J Med,,,JAMA,等著名医学杂志上的,71,篇阴性结果的论文作过分析,发现其中有,62,篇(,93%,)可能是由于,样本含,量,不足造成的假阴性。,医学科研设计与统计学思维,表,1,、两个有效率的比较,甲实验中,,P1,与,P2,之间的差别无统计学意义(校正,2,=1.765,,,P,0.05,),乙实验中,,P1,与,P2,之间的差别有统计学意义(,2,6.275,,,0.01,P,0.05,);,丙实验中,,P1,与,P2,之间的差别也有统计学意义(,2,9.412,,,P,0.01,)。,医学科研设计与统计学思维,医学科研设计与统计学思维,案例四:路人甲发明了两套诊断肺癌的方案,分别命名为,A,和,B,。为了明确这两种方到底谁,“,更胜一筹,”,,路人甲找了,100,个肺癌患者和,100,个疑似肺癌患者(结核、肺炎等),分别用,A,、,B,两套方案去进行鉴别诊断。在,200,个研究对象中(,100,个肺癌和,100,个非肺癌),方案,A,正确了,100,例,准确率,50,,方案,B,仅仅正确了,50,例,准确率仅为,25%,。卡方检验结果:方案,A,和,B,准确率之间的差异有统计学意义(,P0.01,)。很明显,方案,A,的准确性要高于方案,B,。路人甲赶紧发表论文,指出:方案,A,诊断肺癌的准确性优于方案,B,。,路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:如果我(审稿人本人)是坐诊医生,他就会反着看方案,B,的结果,凡是方案,B,认为是肺癌的,他就认为病人不是肺癌;反之亦然。这样下来,,200,个病人中,方案,B,应该能正确识别,150,个人,准确率为,75%,,统计学结果表明,方案,B,的准确率(,75%,)是高于方案,A,(,50%,)的,所以真实的情况是方案,B,优于方案,A,。实际上,当面对这,200,名患者的时候,随便到城隍庙找个瞎子来,“,算命(猜患者是否患病),”,,按照统计学理论,准确率也应该是,50%,,方案,A,的价值可以说是,“,一无是处,”,。,Reject!,这个例子说明:,统计学阴性的结果未必是,“,坏结果,”,。,医学科研设计与统计学思维,3.,保证你的研究论文能通过统计学审查,据国外,60,80,年代对不同医学杂志发表论文的调查,有,统计错误的论文的百分比最高达,72%,,最低也有,20%,。,国内,1984,年对,中华医学杂志,、,中华内科杂志,、,中华外科杂志,、,中华妇产科杂志,、,中华儿科杂志,595,篇论文的调查结果,相对数误用为,11.2%,,抽样方法误用,15.9%,,统计图表误用,11.7%,。某研究者,1996,年对,4586,篇论文统计(中华医学会系列杂志仅占,6.9%,),数据分析方法误用达,55.7%,。,医学科研设计与统计学思维,JAMA,,新英格兰医学杂志(,NEJM,)、英国医学杂志、中华医学会,杂志对来稿都有统计学要求,或统计学指导。,国际生物医学杂志编辑协会在其,生物医学期刊投稿的统一要求,中也包含了统计学要求。,Uniform Requirements for Manuscripts Submitted to Biomedical Journals www.acponline.org,医学科研设计与统计学思维,中华医学杂志,对来稿中统计学处理的有关要求,1,统计研究设计:应交代统计研究设计的名称和主要做法。如调查设计,(,分为前瞻性、回顾性或横断面调查研究,),;实验设计,(,应交代具体的设计类型,如自身配对设计、成组设计、交叉设计、析因设计、正交设计等,),;临床试验设计,(,应交代属于第几期临床试验,采用了何种盲法措施等,),。主要做法应围绕,4,个基本原则,(,随机、对照、重复、均衡,),概要说明,尤其要交代如何控制重要非试验因素的干扰和影响。,2,资料的表达与描述:用,x,和,s,表达近似服从正态分布的定量资料,用,M(Q),表达呈偏态分布的定量资料;用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不宜小于,2O,,要注意区分百分率与百分比。,3,统计分析方法的选择:对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用,t,检验和单因素方差分析;对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用,2,检验。对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资料,不应简单化处理;对于多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系进行全面、合理的解释和评价。,4,统计结果的解释和表达:当,P0,05(,或,P0,01),时,应说明对比组之间的差异有统计学意义,而不应说对比组之间具有显著性,(,或非常显著性,),的差别;应写明所用统计分析方法的具体名称,(,如:成组设计资料的,t,检验、两因素析因设计资料的方差分析、多个均数之间两两比较的,q,检验等,),,统计量的具体值,(,如,t=3,45,,,X,2,=4,68,,,F=6,79,等,),应尽可能给出具体的,P,值,(,如,P=0.0238),;当涉及到总体参数,(,如总体均数,总体率等,),时,,在给出显著性检验结果的同时,再给出,95,置信区间。,医学科研设计与统计学思维,还是那个,AFP,与蛋白,A,的例子。路人甲发现蛋白,A,和甲胎蛋白(,AFP,)之间有很好的相关性,也开始撰写论文,但是他的结论并不是,“,蛋白,A,是诊断肝癌的标记物,”,。他认为,既然蛋白,A,与,AFP,之间有很强的相关性,那提示,AFP,和蛋白,A,之间可能存在十分密切的,“,调节,”,或者,“,被调节,”,关系。最终,路人甲围绕,“,蛋白,A,与,AFP,之间的调节或者被调节关系,”,做了很多分子生物学试验,指出蛋白,A,是调节,AFP,表达的唯一(注意,“,唯一,”,这两个字)因子,因此二者之间才会呈现如此强烈的相关性。这是一项基础研究,虽然未能直截了当地地指出蛋白,A,的临床价值,但是这个研究形象生动地讲述了一个完整的分子生物学事件,丰富了我们对于肝癌发生与发展分子机制的认识。最终,论文,“,堂而皇之,”,地,accept,了。,这个例子说明:,同一统计学结果,从不同的专业角度去解释,结论是完全不同的。,以上所有案例说明:对统计学结果的解读一定要结合专业!,从专业中来,到专业中去!,医学科研设计与统计学思维,4.,获得循证医学证据的主要手段,“,良好愿望的医学,”,(,well-meaning medicine,)转入,“,以证据为基础的医学,”,(,evidence-based medicine,,,EBM,)需要有统计学方法的支持。,全世界的医学期刊每年大约刊登,600,万学术论文,但能作为可靠,“,证据,”,的论文并不多。,医学科研设计与统计学思维,二、,医学科研的基本要素,医学科研由三个基本部分组成,即处理因素(,study factor,)、受试对象(,study object,)和实验效应(,experimental effect,)。例如,观察流甲丙脯酸对肾性高血压患者的疗效。其中,疏甲丙脯酸为处理因素,肾性高血压患者为受试对象,动脉压变化为试验效应。通常将这三个组成部分称为医学科研的基本要素。如何正确选择三个要素,是科研设计的关键问题。,Study factor,Study object,Experimental effect,医学科研设计与统计学思维,1,、医学研究设计的基本原理,:,降压药,高血压病人,血压值,T,s,e,T+S=e,基本模式,:,T+s,1,=e,1,=20mmHg,O+s,2,=e,2,=5mmHg,T-O=e,1,-e,2,=20-5,T,e=15mmHg,处理因素的作用被单独的显示,统计分析的思维:,在排除或控制了一些可能,影响实验效应的因素后,以概率,为基础计算其差异是否为随机误差,(偶然性结果),从而推断处理因,素(或暴露)的效应是否不为零。,处理效应,(暴露),(目标人群),(发病风险),处理组:,对照组:,研究假说:处理效应不为零,统计假设:处理效应为零,医学科研设计与统计学思维,医学科研类型由于不同的科研目的,有多种不同的分类方法。如,按科技活动类型分为基础研究、应用研究和开发研究(发展研究);按照医学中各专业的属性,可分为:基础医学科研、临床医学科研、预防医学科研、社会医学科研(包括卫生事业管理学研究和医学心理学科)。,一般来说,医学科研的分类,常按设计类型的不同,分为以下几种基本类型。(图,1-1,),医学科研设计与统计学思维,普查,抽样调查,典型调查,横断面研究(现况研究,),常规资料分析报告,描述性研究,个案调查(病例、病例家属、周围概况,),),生态学研究(相关研究),病例对照研究(探索性、验证性),队列研究(历史性、同时性),观察性研究,医学科研方法,巢式病例对照研究,病例病例研究,病例队列研究,多阶段复合设计研究,分析性研究,实验室试验,临床试验,社区试验,实验性研究,理论性研究(数学模型研究),图,1-1,医学科研方法基本类型,医学科研设计与统计学思维,2,、,医学研究设计的,4,个基本原则,重复、随机、对照、均衡是实验设计的,4,个基本原则,在实验设计中务必要严格遵守。否则,实验研究结果的可靠性将大受影响。,所谓重复,就是实验因素各水平组合下要有足够的样本含量。因为统计学研究的是随机现象的变化规律性,重复次数少,内在规律表现不出来。在统计学上可根据设计类型选用相应的样本含量估算公式进行计算。,所谓随机,就是每一个实验单位都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。在统计学上有许多实现随机化的具体方法,应当严格实施。千万不可用“随便”取代随机。,医学科研设计与统计学思维,所谓对照,就是要设立参照物。因为没有对比,就无法鉴别优劣。例如,要考察一种新的抗癌药的疗效如何,必须设立一个对照组。在对照组里的癌症患者,可以什么抗癌药都不用(称为空白对照,在临床上应当慎用这种对照),亦可以用现在公认的最好抗癌药作为对照药(称为标准对照)。,在研究干预措施的效果时,直接观察到的往往是多种因素的效应交织在一起的综合作用,而合理的对照能成功地将措施的真实效应客观、充分地识别出来,使研究者得以做出正确评价。一般来说,设立对照可以最大可能地避免下列因素或现象对临床试验研究结果的影响:,不能预知的结局(,unpredictable outcome,),由于人类认识的局限性,干预效应受一些目前未被认识的潜在未知因素的影响。,向均数回归(,regression to the mean,)在临床实践中,有些极端的临床症状或体征有向均数回归的现象。,所谓均衡,就是要设法使各条件(即实验因素的各水平组合)下的受试对象受到非实验因素的干扰和影响的机会和数量基本相等。这样一来,由各组受试对象反映出来的实验效应才能较为客观地体现出实验因素取不同水平时所产生的效果。,医学科研设计与统计学思维,三、统计分析的意义,:,有些论文中的资料十分丰富,既有多因素又有多指标。遗憾的是有些作者未对资料作统计分析就作出了结论;有些虽然作了统计分析,但一般仅作单因素分析,并且,所选用的分析方法还不完全得当。由于统计软件日趋普及,人们可以利用科学的统计分析方法,对同一份资料进行更深入的的分析,这有助于更好地发掘资料中所蕴藏的信息,揭示资料间的相互关系和内在规律性。对于同一份实际资料,由于研究的目的、观察的角度不同,所选用的统计处理方法也会不尽相同。用多种统计分析方法对资料进行多层次、多侧面的综合处理,尽量挖掘各方面的信息是十分必要的,也是完全可能的。,医学科研设计与统计学思维,对资料作统计分析时,可从以下几个方面考虑如何合理选择各种统计分析方法。,其一,资料类型与描述统计量的选择。资料一般可分为定量与定性两大类,定量资料可细分为计量和计数两种;定性资料可细分为有序和无序(名义)两种。描述定量资料常用的统计指标有:平均指标、变异指标、分位数等;描述定性资料常用的统计指标有绝对数和相对数等。,按变量,测量的精确程度,由低到高,,将数据分类为:名义数据(如性别、,婚姻状况)、有序变量(如疗效,,类别间差别大小难以度量)、区间,变量(如摄氏体温,类别间差别有,实际意义)、比变量(如身高,除,具有区间变量的特征外,还具有真,实意义的零点。摄氏温度的零点为,水结冰时温度,并非绝对意义的零,点,所以它不属于比变量),医学科研设计与统计学思维,其二,资料类型与区间估计的选择。常用于定量资料的区间估计方法有个体值的容许区间(医学上亦称“正常值范围”)及总体均值(或其他特定参数)的可信区间;常用于定性资料的区间估计方法是总体率的可信区间。,其三,资料类型与统计分析方法的选择。一般来说,当分组变量为定性变量,指标(或结果)变量为定量变量时,常用的统计分析方法有,t,检验、,Z,检验、方差分析(亦称,F,检验)和秩和检验等;当分组变量和指标(或结果)变量均为定性变量(包括由定量变量转化而产生的)时,常用的统计分析方法有卡方检验、秩和检验、,Ridit,分析、线性趋势检验等。,其四,处理多因素多元资料的常见统计分析方法有多元回归分析、多元方差和协方差分析、聚类分析、主成分分析、因子分析、典型相关分析等。,医学科研设计与统计学思维,四、资料统计分析中的错误,:,在对实际资料进行分析时,从统计分析的角度看,常见的错误是:对资料未作统计处理就下结论;多元(或多因素)的资料用一元(或单因素)统计分析方法处理,导致资料的利用率低,不能反映资料的整体情况,不能很好地揭示变量之间的交互作用和内在联系。,医学科研设计与统计学思维,当暴露变量为一个分类变量时,为单因素设计,常见的设计类型有单组设计、两组的成组设计和配对设计及多组的完全随机设计。若满足参数检验条件,分别选用单样本,t,检验、成组两样本,t,检验、配对,t,检验及单因素多水平方差分析(,one-way ANOVA,);若不满足参数检验条件,分别选用,ilcoxon,秩和检验(或,Mann-Whitney U,检验)、,Wilcoxon,符号秩和检验或,Kruskal-Wallis H,检验。,常见错误,在做检验前,不对结局变量的分布和方差齐性进行检验,在不满足参数检验的前提条件下对定量资料盲目套用参数检验方法。,错误举例,某项研究评价治疗前后膝关节功能(表,1,),从结果来看,部分指标的标准差是均数的,2,倍,提示呈偏态分布,,而原作者用单因素方差分析检验治疗前后的功能得分。正确做法是,选用非参数检验的办法,这个研究是自,身配对设计,可选用,Wilcoxon,符号秩和检验,或对结局变量进行变换,满足参数检验的要求。,医学科研设计与统计学思维,用,Pearson,卡方检验分析有序结局变量的数据?,某项研究探讨原发性肝癌肝动脉碘油化疗栓塞(,TACE,)和三维适形放疗,(,3DCRT,)综合治疗价值(见表,5,)。原文将不同水平的疗效进行了合并,,采用,Pearson,卡方检验比较两组的有效率分别为,71%,和,45%,,,P,值为,0.0097,,,这样合并没有充分利用资料的有序信息;而若用,2C,表卡方检验,,P,值为,0.0827,,没有考虑疗效的递减关系。所以,应选用,CMH,卡方检验行平均得,分差的分析结果,,P,值为,0.0160,,(或用,Ridit,检验)才能做出正确的评价。,医学科研设计与统计学思维,重复测量的数据用单因素分析:,某研究探讨重型颅脑创伤患者硫酸镁治疗与患者血清丙二醛(,MDA,)含量及预后关系。治疗组和对照组,患者分别在入院时、用药后,24,、,48,和,72,小时抽取静脉血,检测,MDA,浓度(表,3,)。原文采用成组,t,检验在,不同时间点进行两组比较,割裂了整体设计,没有考虑到对于同一观测对象,不同时间点上的数据是不,独立的。该研究可选用重复测量设计的方差分析。对于较复杂的重复测量设计资料,可选择混合模型,(,Mixedmodel,)或广义估计方程(,GEE,)等方法进行分析。,医学科研设计与统计学思维,不能充分利用数据的信息,缺乏深入分析,(浙江预防医学,2012,年第,24,卷第,4,期),男童行为因子均数比较,(x s),女童行为因子均数比较,(x s),作者分别对男童和女童的每项因子作了,t,检验,没有很好的利用数据中隐藏的,分布信息,另外,多次重复,t,检验会增加,I,型错误的概率。,医学科研设计与统计学思维,对于这类数据可以,考虑采用轮廓分析,(,Profile Analysis),方法:,1,、平行检验,2,、相合检验,3,、水平检验,医学科研设计与统计学思维,笔误?统计学知识的缺乏?或杂志社审稿的错误?,医学科研设计与统计学思维,五,、多变量分析与单变量分析,多变量分析是对,m,个反应变量进行一次假设检验(,Hotelling T,2,检验或,MANOVA,),对组间差别作出推断。在大多数情况下,多变量假设检验结论与对,m,个反应变量进行,m,次单变量假设检验(,t,检验或,ANOVA,)的结论是一致的,即多变量假设检验拒绝,H,0,
展开阅读全文