资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,常用的几种统计方法,宿州市立医院心内一科,田 真,前言,学习统计学方法,主要目的在于建立统计学观念,提高医学统计学思维,学会运用统计学理论和方法充分挖掘资料中蕴含的信息,恰如其分地进行理性概括,并据此写出严谨的研究报告和学术论文。,呋喃硝胺,100人,西米替丁,100人,疗效,85人,疗效,90人,例如:某医生比较两种疗法对活动期十二指肠球部溃疡的疗效。,据此能否立即下结论,,呋喃硝胺的疗效高于西米替丁?,显效 有效 无效 合计,单纯西药 9 25 6 40,冠心灵 19 18 5 42,冠心灵与单纯西药 疗效对比,问题:某医师用“冠心灵”治疗冠心病,其疗效是否优于单纯西药?,授课提纲,医学统计学概述,统计工作的基本步骤,统计资料的类型,医学统计中的基本概念,常用的几种统计方法,一、医学统计学概述,定义,是用统计学原理和方法研究生物医学问题的一门学科。医学统计方法在医学研究中的运用主要有三个方面:,医学论文中的统计学问题,60,年代到,80,年代,国外医学杂志调查结果:有统计错误的论文,20%72%,。,1996,年对,4586,篇论文统计(中华医学会系列杂志占,6.9%,),数据分析方法误用达,55.7%,。,60年代到80年代,国外医学杂志调查表明:,20%72%,的论文有统计错误。,1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果为:,相对数误用占,11.2%,,抽样方法误用占,15.9%,,统计图表误用占,11.7%,1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达,55.7%,。,2001年中华预防医学杂志:中华医学会系列杂志误用约,54%,(1995)。,1996年,有机构对申报科技成果的4586篇科研论文分析,统计方法使用率为,76%,。,医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。,伪造统计数据违反科学道德,1976,年,New Science,杂志关于科研舞弊行为的调查,(,1,),74%,的调查表反映有不正当修改数据的情况,(,2,),17%,拼凑实验结果,(,3,),7%,凭空捏造数据,(,4,),2%,故意曲解结果,二、统计工作的基本步骤,设计,收集资料,整理资料,分析资料,1.专业设计:选题、建立假说、确定 研究对象和技术方法等个性2.统计设计:围绕专业设计确定统计 设类型、样本大小、分组方法、统计分析指标及统计分析方法。,(一)设计,(二)收集资料,(一)资料来源,第一手资料,经常性:统计报表(死亡登记、疫情 报告等),工作记录(病历、化验);,一时性:专题调查、实验或临床试验。,第二手资料:已公布的资料,如全国、全省卫生统计资料。,(二)收集资料,(二)资料要求,1完整:观察单位及观察项目完整。观察单位:最基本的获取数据的单元。可以是一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。2准确:即真实、可靠。真实是统计学的灵魂。3及时:即时限性。如人口普查规定调查开始日期和截止日期。,(三)整理资料,整理资料即原始数据的条理化、系统化的过程。所采取的手段合理化分组,目的实现专业目标。,质分组:按事物的属性或性质分组分类变量;,量分组:按数据的大小数值变量。,(四)分析资料,1.统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。,2.统计推断:用样本信息推断总体特征:,参数估计。,假设检验。,三、统计资料的类型,有三种类型的资料:,计量资料,计数资料,等级资料,基本概念:变量及变量值,研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。按变量值的性质可将资料分为定量资料和定性资料。,1.计量资料,定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。,特点:有度量衡单位,多为连续性资料,(通过测量得到),如患者的身高(cm)、体重(kg)、,血压(mmHg)、脉搏(次/分)、,红细胞计数(10/L),定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。,特点:没有度量衡单位,多为间断性资料(通过枚举或记数得来),如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女),2.计数资料,定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。,特点:,每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同。,癌症分期:早、中、晚。,药物疗效:治愈、好转、无效、死亡。,尿蛋白:,+,+及以上,3.等级资料,对观察对象按,属性或类型,分组计数所得的资料。每个对象之间没有量的差异,只有质的不同。,资料的类型,计量资料,(数值变量或,定量资料),计数资料,(无序分类变量,或定性资料),等级资料(,有序分类变量,或半定量资料),对每一观察对象用,定量,的方法,测定某项指标所得的资料。一般有度量衡单位,每个对象之间有量的区别。,对观察对象按属性或类型,程度的不同,分组计数,但各属性或类型之间又有程度的差别。,(1)不同类型的资料采用的统计分析方法不同;,(2)三类资料类型可以相互转化。,注意:,例:某地调查高血压的患病情况。,每人的血压:以mmHg计,计量资料,以舒张压90mmHg为高血压,结果在1000人中有10名高血压患者,990名非高血压患者,整理后的资料,计数资料,按低血压、正常、高血压分组所得资料。,等级资料,四、统计学中的基本概念,(一)总体与样本,1、总体(population),根据研究目的所确定的同质的所有观察单位某项变量值的集合。,有关总体的三个要点:,研究目的、同质的、全体,观察对象:,该地2002年全部正常成人,同质:,同一地区、同一年份、同为正常成人,全体:,该地2002年全部正常成人白细胞数,目的:,了解某地2002年正常成人白细胞数,观察单位:,每个人,观察值:,测得的白细胞数,例如:,了解某地2002年正常成人白细胞数,四、统计学中的基本概念,(二)变异:同质基础上个体值之间的差异,称为变异。,同质:指观察单位或观察指标受共同因素制约的部分。,例如,同种族、同年龄、同性别的健康人,在相同的条件下测其脉搏、呼吸、体温等生理指标可以有很大差异。,四、统计学中的基本概念,(三)参数和统计量,1.,参数,:,总体指标。,2.,统计量,:,样本指标。,(四)抽样误差,1.定义:,在统计学上把由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异统称为,抽样误差,。,四、统计学中的基本概念,(五)概率,概率:是描述随机事件发生,的可能性大小的数值。,(1)必然事件:P(A)=1,(2)不可能事件:P(A)=0,(3)随机事件(偶然事件):0 P(A)1,(4)小概率事件:P0.05 或 P0.01,t检验不是处理计数资料的万能方法,双向无序,两个分类变量皆为无序分类变量,一般用,卡方检验,。,单向有序资料,,采用秩和检验,。,双向有序且属性相同,研究目的通常是分析两种检测方法的一致性,此时应用,一致性检验,。,双向有序属性不同,根据具体情况可选择,秩和检验,,,等级相关分析,或者,线性趋势检验,。,卡方检验不是处理计数资料的万能方法,卡方检验,秩和检验或Ridit分析,原则,:选择最恰当的统计指标准确描述资料的特征。,非正态分布,计量资料,正态分布,计数资料,率或比,X,2,检验,X,2,检验或称卡方检验,是一种用途较广的假设检验方法,常用于检验,两个或多个样本率及构成比之间有无差别,,还用来检验配对定性资料及两种属性或特征之间是否有关系等。,2,检验的适用资料,两,组样本率的比较;,多组样本率的比较;,两组或多组构成比的比较;,配对设计下两分类资料检验。,一、四格表资料的检验,四格表资料的检验,主要用于,两个样本率(或构成比)的假设检验,一般制成表6-2的计算格式(以阳性和阴性为例)。,表6-2 四格表资料检验计算表,组 别,阳性数,阴性数,合计,甲 组,a,b,a,+,b,乙 组,c,d,c,+,d,合 计,a,+,c,b,+,d,a,+,b,+,c,+,d,=,n,X,2,检验的基本公式为,理论频数,T,条件:,n,40,,,T,5,四格表检验专用公式,省去计算T值,例6.7 以例6.6资料为例,表6-3 用药组和对照组流感发病率的比较,组 别,发病人数,未发病人数,合计,用药组,14(20),86(80),100,对照组,30(24),90(96),120,合 计,44,176,220,两种方法计算结果,结果判断,X,2,临界值:X,2,0.05,1,3.84,请记住,:X,2,0.01,1,6.63,X,2,=,u,2,本例 :X,2,=4.125 X,2,0.05,1,3.84,两组差别有统计学意义。与前面的结论相同。,四格表值的校正,条件:,(1)任一格的1,T,5,且,n,40时,需计算校正值。,(2)任一格的,T,1或,n,40时,用确切概率计算法。,基本公式,专用公式,例6.8,某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表6-4,问两疗法的治愈率是否相等?,表6-4 甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较,组 别,发病人数,未发病人数,合计,用药组,26(,28.8,),7(,4.2,),33,对照组,36(,33.2,),2(,4.8,),38,合 计,62,9,71,计算结果及判断,本例:X,2,2.71 X,2,0.05,1,=3.84,本例若对X,2,值不校正,=4.06,得,P,0.05,结论正好相反。,三、行列表的检验,行列表(,R,C,表)的检验主要用于解决多个样本率或多个样本构成比的比较以及有序分类资料的关联性检验。,式中,n,为总例数,,A,为每格子的实际频数,,n,R,、,n,C,分别为与某格子实际频数(,A,)同行、同列的合计数。,行列表资料的检验的注意事项,1.理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:,最好增加样本含量以增大理论频数;,根本的方法。,删去理论频数太小的行和列;,此法不好。,将理论频数较小的行或列与邻行或邻列合并以增大理论频数。但后两法可能会损失信息,,行列表资料的检验的注意事项,2.当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用下述的行列表的,分割法。,3.对于行列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。,t检验与u检验的应用条件,两组数值变量资料比较;,小样本时用,t,检验,要求资料为随机样本并服从正态分布;,大样本时用,u,检验,仍要求资料为随机样本,但正态性条件可以放宽;,在两样本均数比较的,t,和,u,检验中,要求两组总体方差相等,即方差齐性;,组间要求具有均衡可比性。,单样本均数的,t,检验,对于总体标准差未知的小样本数据(n60),单样本均数的假设检验采用,t,检验,计算公式为,例,通过以往大规模调查,已知某地新生儿出生体重均数为3.30kg。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿出生体重不同?,1.统计表的结构,2.统计表的种类,3.编制统计表应注意的事项,统计表,包括标题、标目、线条、数字、备注,标题:位于统计表的上方中央,要表达出统计表的主要内容,必要时应注明时间、地点。,标目:标目用简单的文字来说明表格内的项目,要有单位。,线条:3,4条横线,禁用竖线、斜线。,统计表的结构,统计表的种类,根据分组标目的复杂程度,统计表可大致分为简单表,和复合表。,简单表,(simple table):只按一个特征或标志分组。,组合表,(combinative table):按两个或两个以上特征或标志结合起来分组。,数字:表内的数字必须准确无误,用阿拉伯数字表示。同一指标的小数位数要一致,上下要对齐,表内不留空格,数字暂缺或未记录用“,”表示,无数字用,“”表示,数字若是0,则填写0,备注:表中用“*”标出,再在表的下方用文字加以说明。,编制统计表应注意的事项,重点突出,简单明了。,主谓分明,层次清楚。,麦亚根糖浆治疗161例急慢性肝炎疗效,改表举例:,麦亚根糖浆治疗161例急慢性肝炎疗效,Thank You!,
展开阅读全文