资源描述
Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,*,问 题,某部队野营训练,发生中暑12人,北方籍战士10人,南方籍战士2人,结论:北方籍战士容易中暑。,某单位现有10000人,其中对1000人检测某项指标,10人阳性,问阳性率?,应用情况调查,1987,年对,68,种全国性公开发行的医学专业学术期刊共,273,期近五千篇论著和研究类文章进行调查,各类杂志各种统计方法的应用率见下表。,不同类别期刊各种统计方法的应用率(,%,),统计学方法,学报类期刊,中华系列杂志,其他杂志,相对指标,33.8,33.6,37.7,平均、变异指标,43.1,28.0,21.0,可信区间,4.0,3.5,1.8,2,检验,5.0,13.0,15.0,t,、,u,检验,35.1,21.9,14.8,F,检验,8.0,4.7,4.0,直线回归、相关,10.8,5.5,1.4,曲线拟合,2.8,0.2,0.1,非参数法,1.5,0.5,0.1,多元分析,1.3,0.7,0.2,其他,5.0,0.9,0.6,应用情况调查,若按基础、临床等来观察各种统计方法的应用率,可见下表。,不同科别期刊各种统计方法的应用率(,%,),统计学方法,基础,临床,药科,内科,外科,专科,合计,相对指标,41.1,35.1,35.6,38.5,35.8,20.5,平均、变异指标,43.1,38.4,20.0,14.1,26.8,22.3,可信区间,13.3,5.0,1.7,5.7,3.7,2.1,2,检验,*,1,7.9,18.1,8.8,15.4,13.7,0.7,t,、,u,检验,*,2,31.9,35.9,8.3,9.8,20.1,9.4,F,检验,4.3,7.2,3.0,1.7,4.6,2.3,直线回归、相关,6.8,7.8,1.7,1.7,4.3,15.5,曲线拟合,1.2,0.4,0.2,0,0.2,0,非参数法,0.8,0.7,0.2,0.2,0.4,0.4,多元分析,0.7,0.7,0.5,0.2,0.5,0,其他,1.5,1.0,0.6,0,0.7,4.1,*3,第一节定性资料的分布特征,定性资料的频数表,定性资料的统计描述指标相对数,应用相对数应注意的问题,一 定性,资料的频数表,按类别或属性,分别清点各类别或属性的观察单位数(频数),,分类,变量及相应的频数所组成的频数表,称分类资料的频数表,某药对200例高血压患者的疗效,病人编号,药 物,疗 效,1,新药,有效,2,安慰剂,无效,3,安慰剂,有效,4,新药,有效,5,安慰剂,无效,6,新药,有效,7,新药,无效,8,安慰剂,有效,9,安慰剂,无效,.,.,200,新药,有效,分组,有效,无效,合计,新药,40,10,50,安慰剂,50,100,150,合 计,90,110,200,关于孕妇分娩的原始资料记录,住院号,年龄,职业,文化程度,分娩方式,妊娠结局,2025655,27,无,中学,顺产,足月,2025653,22,无,小学,助产,足月,2025830,25,管理人员,大学,顺产,足月,2025677,24,知识分子,中学,顺产,早产,2025647,30,管理人员,大学,顺产,足月,2025848,32,无,小学,剖宫产,足月,2019915,27,无,中学,顺产,死产,2025861,29,无,大学,剖宫产,足月,2000386,26,无,小学,顺产,足月,按文化程度与分娩方式整理资料,文化程度,顺产,助产,剖宫产,合计,小学,40,5,5,50,中学,100,20,30,150,大学,200,10,90,300,合计,340,35,125,500,高血压患者药物疗效比较,分组,有效,无效,合计,新药,40(实际数),10,50,安慰剂,50(实际数),100,150,合 计,90,110,200,绝对数的概念与意义,调查研究和实验研究得到的,计数,资料或等级资料经过整理,清点数目得到的数值称为绝对数。,如某病的发病人次数、医院收容人数、治愈人数等,。,绝对数反映一定条件下某种事物的规模或水平,是计划或总结工作的依据,绝对数是计算相对数与平均数的基础。,绝对数往往不便于比较。,例:调查得某年小学生中流脑发病:甲地区63例,乙地区35例。,甲地区流脑流行比乙地区严重,如已知小学生总人数:甲地区,50051,人,乙地区,14338,人,可算出两个发病率:,甲地区流脑发病率:63/500511000=1.26,乙地区流脑发病率:,35/14338 1000=2.44,乙地区流脑流行比甲地区严重,相对数的概念和意义,概念:相对数是两个有联系的指标之比。,两个特点:,表示事物出现的频度。,把基数化作相等,便于比较,。,二、定性资料的统计描述指标相对数,相对数,(relative number),是两个有联系的指标之比,常用的相对数指标,率,构成比,相对比,一、强度相对数-率(rate),1、,概念,:说明某现象在其可能发生的范围内实际发生的频率或强度,反映事物的普遍及严重程度,又称频率指标或强度指标。,2、,计算公式,:,常用相对数,公式中要注意:,分母的组成:由两部分组成。,a.实际发生的例数,b.某现象未发生的例数,分子、分母一定是同质的,关于率的几点说明,0 rate1,率常以百分率,(%),、千分率,(),、万分率,(1,万,),、十万分率,(l,10,万,),等表示。,比例基数,(,K,),可以是,100,、,1000,、,,其选取是根据习惯用法和需要选用,主要使算得的率至少保留,1,2,位整数,便于阅读。,患病率、发病率、感染率,:,百分率,(%),人口出生率与死亡率:,千分率,(),肿瘤死亡率:,十万分率,(l,10,万,),常用统计指标,1、发病率与患病率,患病率,prevalence rate,:是指在一定时间患某病的人数在该调查人群中所占的比例。,患病率:反映某时期人群中已存在某疾病的数量,发病率 incidence rate :是指在一定时间某病的新发病例人数在该调查人群中所占的比例。,发病率:反映某时期人群中某疾病,新增加的数量(速度),例 某医院现有工作人员900人,其中男性760人,女性140人,在一次流感中,发病者有108人,其中男性患者79人,女性患者29人,试计算:,(1)该院总的流感发病率,(2)男、女性的流感发病率,该院总的流感发病率=108/900*100%=12%,男性的流感发病率=79/760 *100%=10.39%,女性的流感发病率=29/140*100%=20.71%,死亡率,mortality rate,:是指某人群在一定时间内死于某病的人数在该人群中所占的比例。,反映某时期人群患某病后的危险性和预后,病死率,fatality rate,:表示一定时期内,患某病的全部病人中因该病死亡者的比例。,例 某县有人口10万人,1997年因各种疾病死亡1000人,该年共发生结核300人,原有结核400人,1997年共有60人死于结核,请问:,(1)该县的总死亡率为,a 300/10万 b 60/1000 c 60/10万,d,1000/10万 e 资料不足,不能计算,(2)结核病死率:,a 60/300 b 60/400,c,60/700,d 60/1000 e 60/10万,(3)结核发病率:,a,300/10万 b 400/10万 c 700/10万,d 300/1000 e 400/1000,(4)率的统计学意义,率是表示频率或强度的指标。影响因素相同时,率越大则事物发生的频率或强度越大;对疾病而言,频率越大,对人群的危害也越大,(5)率的特点,合计率或总率不等于100,某一部分的分率改变不影响其他分率的变化,各小组率(如年龄别率)不能直接相加求其总率,二、,构成比 proportion,1、,概念,:说明某事物内部各组成部分所占的比重或分布,2、,计算公式,:,设某事物个体数的合计由A,1,,A,2,,A,k,个部分组成,构成比计算为:,汉族不同年龄组孕妇携带HBsAg情况,(3)特 点,a.一组资料各部分构成比之和为100%;,b.当某一部分构成比增大时,其余部分的构成比相应减少。,(4)构成比的统计学意义,事物内部某组成部分的构成比越大,说明它所占的比重越大,它出现的观察单位数也越多。,三、相对比(relative ratio),概念:,是两个有关的指标之比,说明两者的对比水平,以百分数或倍数表示。,计算公式,:,相对比甲指标/乙指标(或100),例:某年某医院出生婴儿中,男性婴儿为370人,女性婴儿为358人,则出生婴儿性别比例为370/358100%=103%,(3)特点:灵活,可以两个绝对数、相对数或平均数之比,单位可以相同,也可以不同,(4)统计学意义,当性质相同的两个指标比较时:,相对比说明A是B的多少倍或几分之几;,当性质不同的两个指标之比:,相对比表示相对指标B 时,A的情况。,某地男性肺心病死亡率为101.9/10万,女性肺心病死亡率为146.8/10万,则肺心病死亡率的性别比为:,101.9/146.8=0.69,表示当地一年内男子和女子因肺心病而死亡的频率之比为0.69:1。,某市19771979年肺癌死亡率城区为19.39/10万,郊区为9.99/10万,则城区与郊区肺癌死亡率之比为:,19.39/9.99=194.1%,说明城区肺癌死亡率为郊区的194.1%或1.94倍。,相对数的例子(1),年度,(1),发病人数,(2),病死人数,(3),病死率,(4),构成比,(5),1993,584,8,1.37,8.8,1994,571,10,1.75,11.0,1995,714,12,1.68,13.2,1996,748,16,2.14,17.6,1997,942,21,2.23,23.0,1998,1095,24,2.19,26.4,合计,4654,91,1.96,100.0,表19931998年某地损伤与中毒病死率(%)与构成比(%),相对数的例子(2),血型频数 (%),O205 40.43,A112 22.09,B150 29.59,AB 40 7.89,合计507100.00,相对数的例子(3),表某市1980年和1990年5种传染病发病情况,疾病,1980年,1990年,病例数,构成比(%),病例数,构成比(%),痢疾,3604,49.39,2032,37.92,肝炎,1203,16.49,1143,21.33,流脑,698,9.56,542,10.11,麻疹,890,12.20,767,14.31,腮腺炎,902,12.36,875,16.33,合计,7297,100.00,5359,100.00,相对数的例子(4),性别比,性比例,男性人数:女性人数100,出生时:107,20岁:100,50岁:98,60岁:95,70岁:85,80岁:66,相对数的例子(5),体质指数(BMI),体重/身高,2,(kg/m,2,),低体重 18.0,正常 18.0,超重24.0,肥胖28.0,第二节动态数列 dynamic series,概念:是一系列按照时间排列起来的统计指标(绝对数、相对数或平均数),用以说明事物在时间上的变化和发展趋势。,动态数列的两个要素:,时点或时期:,统计指标:,基期 报告期 末期,动态数列的两个要素:,时点或时期:,统计指标:,基期 报告期 末期,常用的动态数列的分析指标:,绝对增长量,发展速度与增长速度,平均发展速度与平均增长速度,动态数列用途,描述事物在时间上的变化和发展趋势,可预测随后的变化情况,例1,某医院1991-1999年日门诊量的统计数据见表5-9第,(1)、(3),栏,试作动态分析。,表5-7 某医院1991-1999年日门诊量动态变化,指标的意义和计算,1、绝对增长量,意义:表示事物在一定时期所增加 的绝对数量,计算,累计增长量,=各年指标-基数年指标,逐年增长量,=某一年指标-前一年指标,2、发展速度,意义:表示两个不同时期的某事物的数值相比,说明后一时期为前一时期的倍数或百分倍数。,计算,定基比=各年指标/基数年指标100%,环 比=某年指标/前一年指标100%,3、增长速度,意义:表示两个不同时期的某种现 象的数值相比,说明后一时期比前一时期增长的倍数或百分倍数。,计算,定基比=定基发展速度-100%,环 比=环比发展速度-100%,4、平均发展速度和平均增长速度,平均发展速度,说明某事物在一个较长时期中逐期(如逐年)平均发展的程度。,平均增长速度,说明某事物在一个较长时期中逐期平均增长的程度。,平均发展速度:是各时期环比发展速度的几何均数。,a,0,:为基数年指标 a,n,:为第n年指标,平均增长速度,平均增长速度=平均发展速度-1,对,例5-7,计算平均发展速度与平均增长速度:,动态数列分析还可以进行,预测,,即根据平均发展速度公式计算几年后达到的指标。,a,10,=1.141,10,1200=4488(人次),即根据该医院1991-1999年的平均发展速度,预计到2001年该医院的日门诊量可达4488人次。,第三节 应用相对数的注意事项,计算相对数的分母不宜过小,例数较少,相对数波动较大。如:,0/2,,,1/2,,,2/2,例数较少时,宜用绝对数表示,必须用相对数时,可同时列出其可信区间,。,分析时不能以构成比代替率,也不能以构成比的动态分析代替率的动态分析,构成比和率都是相对数,但两者又属不同的概念,用时应注意两者的区别。,率与构成比的区别,1、意义,构成比:表示事物内部各个构成部分的比重,率:表示某现象发生的频率和强度,2、特点,构成比:各百分比之和为100%,当某一部分比重增大时,另一部分比 重相应减少,率:同类的各个小组率不能直接相加求其总率,3、公式,4、意义,构成比越大,该组成部分的比重大,观察实际数多,率:影响因素相同时,率越大,说明疾病的强度越重,率与构成比的区别举例,年龄组,受检,人数,白内障例数,患者年龄构成比(%),患病率(%),=(3)/(2),40,50,60,70,80,合计,560,441,296,149,22,68,129,135,97,19,15.18,28.79,30.13,21.65,4.24,12.14,29.25,45.61,65.10,86.36,1468,448,100.00,30.52,(三)计算观察单位不等的几个率的平均率(合计率)时,不能将几个率直接相加求其平均率,(四)资料的对比应注意可比性,所谓可比,就是说除了,要对比的因素外(如不同药物),其余的影响因素应尽可能的相同、相似或接近。,观察对象同质,研究方法相同,观察时间相等,以及地区、周围环境、风俗习惯和经济条件应一致或相近。,观察对象,内部构成,是否相同,若两组资料的年龄、性别构成不同,可以分组或进行标准化后再作比较。,(五)对样本的比较应遵循随机抽样,要做假设检验。,样本率和构成比也存在抽样误差,两个或多个率和构成比比较时,不能单凭数据大小作出结论,应进行假设检验。,第四节 率的标准化法,一、标准化法的意义和基本思想,甲乙两疗法某病治愈率比较,疗法 疗效(Y),(X)病人数 治愈数 治愈率%,甲疗法 400 215 53.8,乙疗法 400 190 47.5,结论:乙医院生存率为67.1%较甲医院64.2%高,乙医院医疗水平高于甲,正确?,当比较的,两组,或多组资料,其,内部各小组率明显不同,,且各,小组观察例数的构成比,,诸如年龄、性别、工龄、病情轻重、病程长短等,也明显不同时,,直接比较,两个,或多个合计率是不合理的。因为其内部构成不同,往往影响合计率大小。,要正确比较两种疗法的合计治愈率,必须先将两组治疗对象的,病型,构成按照,统一标准进行校正,,然后计算出校正后的标准化治愈率再进行比较。这种用统一的内部构成,然后计算标准化率的方法,称为,标准化法,。,标准化法的,基本思想,是:采用某影响因素的,统一,标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。,二、标准化率的计算,(一)标准化方法:直接法和间接法,标准构成:,1、某一组的人口数或人口构成;,2、两组之和的人口数或人口构成;,3、通用的或便于比较的标准。,如本地的、本省的、全国的、世界的同一指标之构成皆可酌情选用,选用不同的标准时,所得出的标准化率是不同的。但这种差别大多不致于影响对比的相对关系。,二、标准化率的计算-直接法,(二)计算公式:,直接法:选择人口数作标准,选择人口构成比作标准,N,i,:,为标准年龄别人口数;,P,i,:,为实际年龄别死亡率;,N,:,为标准人口总数。,二、标准化率的计算-直接法,(三)计算:,例5-4,,表5-4,直接法:,选择治疗人数之和做标准,第四节 率的标准化法,二、标准化率的计算-间接法,(二)计算公式:,间接法:选择死亡率做标准,P:,为标准总死亡率,,r,:为实际总死亡数,,n,i,:为实际组别人口数,,P,i,:为标准年龄别死亡率,,n,i,P,i,:为预期死亡数,,r/n,i,P,i,:为标准化死亡比,用,SMR,表示。,二、标准化率的计算-,间接法,(三)计算:,例5-6,,表5-7,间接法:50岁以上老年妇女原发性骨质疏松症的年龄组患病率作为标准,三、应用标准化时的注意事项,1,.,标准化率的应用价值,仅限于相互比较,不反映具体的实际水平。,要反映实际情况,则需用未标化前的率。,标准化率的适用范围,仅适用于某因素两组内部构成不同,并有可能影响两组总率的比较,对于因其他条件不同而产生的不可比性问题,标准化率不能解决。,标准化率也有抽样误差,两样本标准化率作比较时,当样本含量较小时,还应作假设检验,结 束,
展开阅读全文