1、分类变量资料的统计分析分类变量资料的统计分析第十章第十章主要内容主要内容分类变量资料的统计描述分类变量资料的统计描述分类变量资料的统计推断分类变量资料的统计推断卡方检验卡方检验什么是分类变量资料?什么是分类变量资料?用什么指标进行描述?用什么指标进行描述?甲、乙两地发生麻疹流行,甲地患儿甲、乙两地发生麻疹流行,甲地患儿100100人,乙地患儿人,乙地患儿5050人,人,何地较为严重?何地较为严重?若甲地易感儿童若甲地易感儿童667667人,而乙地易感儿童人,而乙地易感儿童250250人。人。甲地麻疹发病率为甲地麻疹发病率为 100/667100/667100%=15%100%=15%乙地麻疹发
2、病率为乙地麻疹发病率为 50/25050/250100%=20%100%=20%第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 用用用用相对数相对数相对数相对数能较好地反映分类变量资料的特征。能较好地反映分类变量资料的特征。能较好地反映分类变量资料的特征。能较好地反映分类变量资料的特征。主要内容主要内容v常用相常用相对对数数v应应用相用相对对数数时时的注意事的注意事项项v率的率的标标准化法准化法一、常用相对数一、常用相对数v相对数相对数(Relative numberRelative number):是两个有关:是两个有关联的数值或指标之比。用以说明事物的相对联的数值或指标之比。用
3、以说明事物的相对关系,便于对比分析。关系,便于对比分析。v常用的相对数有:常用的相对数有:率率构成比构成比相对比相对比(一)率(一)率(Rate)定义:定义:为频率指标,是某现象实际发生数与为频率指标,是某现象实际发生数与可能发生某现象的总数之比。用以说明某现可能发生某现象的总数之比。用以说明某现象发生的频率或强度。象发生的频率或强度。常用率:常用率:发病率、患病率、死亡率、病死发病率、患病率、死亡率、病死率、治愈率等。率、治愈率等。率的计算方法率的计算方法 k k为比例基数,为比例基数,常常取取百分率百分率(%)、千分率、千分率()、万、万分率分率(1/1/万)万)、十万分率、十万分率(1/
4、101/10万)万)等。等。原则:原则:保留保留1 12 2位整数位整数 惯例惯例 例如例如:患病率通常用患病率通常用100100%、婴儿死亡率用婴儿死亡率用10001000、肿瘤死亡率以肿瘤死亡率以1010万万/10/10万表示。万表示。v例例 某医院某医院19981998年在某城区随机调查了年在某城区随机调查了85898589例例6060岁及以上老人,体检发现高血压岁及以上老人,体检发现高血压患者为患者为28232823例。例。v高血压患病率为:高血压患病率为:v2823/8589 2823/8589 100%=32.87%100%=32.87%。率的计算例题率的计算例题某县某年恶性肿瘤死
5、亡统计某县某年恶性肿瘤死亡统计 年年 龄龄 人口数人口数 死亡数死亡数 死亡专率死亡专率(1/10(1/10万万)0 356980 11 3.08 15 232505 22 9.46 30 205032 142 69.26 50 121882 443 363.47 85 20047 107 533.75 合合 计计 936446 725 77.42(二)构成比(二)构成比(constituent rate)定义:定义:表示事物内部某一构成成分在全部构成中所占的比例或比表示事物内部某一构成成分在全部构成中所占的比例或比重。常以重。常以100100为比例基数,故又称为为比例基数,故又称为百分比(百
6、分比(percentagepercentage)。)。用途:用途:常用来表示疾病或死亡的常用来表示疾病或死亡的顺位、位次或所占比重顺位、位次或所占比重。计算公式:计算公式:v 设设某某事事物物个个体体数数的的合合计计由由A A1 1,A A2 2,A Ak k个部分组成,构成比的计算为:个部分组成,构成比的计算为:.构成比的特点构成比的特点构成比有两个主要特点:构成比有两个主要特点:各部分构成比的合计等于各部分构成比的合计等于100%100%或或1 1,若由于四舍五若由于四舍五入造成合计不等于入造成合计不等于100%100%时,应再进行调整时,应再进行调整,使其等使其等于于100%100%。事
7、物内部某一部分的构成比发生变化,其它部分事物内部某一部分的构成比发生变化,其它部分的构成比也相应地发生变化。的构成比也相应地发生变化。即此消彼长即此消彼长某正常人的白细胞分类计数构成比某正常人的白细胞分类计数构成比白细胞分类白细胞分类 分类记数分类记数 构成比(构成比(%)中性粒细胞中性粒细胞淋巴细胞淋巴细胞单核细胞单核细胞嗜酸性细胞嗜酸性细胞嗜碱性细胞嗜碱性细胞 140140 50 50 5 5 4 4 1 1 70.070.0 25.0 25.0 2.5 2.5 2.0 2.0 0.5 0.5合计合计 200200 100.0100.0例例10-1 2001年年对对某某地地中中小小学学学学
8、生生进进行行HbsAg检检查查,结结果果见见表表10-1,试试计计算算各各级级学学生生HbsAg检检出出率率及及阳阳性者构成比性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。率和构成比不是同一指标,在应用时应注意加以区分。(三)相对比(三)相对比(Relative ratio)v定义:定义:表示表示两个有联系两个有联系的指标之比,如的指标之比,如A A、B B两个指标之比,说明两个指标之比,说明A A为为B B的若干倍或百分之几,通常用倍数或分数表示。的若干倍或百分之几,通常用倍数或分数表示。v特点:特点:两个比较指标可以性质相同,也可以性质不同两个比较指标可以性质相同,也可以性质
9、不同两个比较指标可以是两个比较指标可以是绝对数、相对数或平均数绝对数、相对数或平均数等,但两个指标互不包含等,但两个指标互不包含v计算公式:计算公式:例例10-2 某某地地2003-2005年年不不同同性性别别新新生生儿儿数数见见表表10-2,试计算该地不同年份新生儿性别比。,试计算该地不同年份新生儿性别比。常用相对比指标常用相对比指标对比指标对比指标关系指标关系指标计划完成指标计划完成指标对比指标对比指标v定义:定义:指两个同类事物某种指标的比,说明一个数为另一指两个同类事物某种指标的比,说明一个数为另一个数的几倍或百分之几,两指标可是个数的几倍或百分之几,两指标可是绝对数、相对数或平均数绝
10、对数、相对数或平均数。v举例:举例:某市某年肺癌死亡率城区为某市某年肺癌死亡率城区为19.39/1019.39/10万,郊区为万,郊区为9.99/109.99/10万,万,则两者相对比为:则两者相对比为:19.39/9.99=1.9419.39/9.99=1.9420002000年我国人口普查,男子年我国人口普查,男子65355 65355 万人,女子万人,女子61228 61228 万人,万人,男女性别比为:男女性别比为:1:06741:0674返回返回关系指标关系指标v定义:定义:指两个相关的、但非同类事物的数量比指两个相关的、但非同类事物的数量比。v计算公式:计算公式:v举例:举例:v
11、某医院某医院19951995年医护人员为年医护人员为875875人,同年平均开放病床人,同年平均开放病床14361436张,医护张,医护人员与病床数之比为:人员与病床数之比为:(875(875 1436)1436)100=61(100=61(人),表示该医院人),表示该医院每每100100张病床平均配备张病床平均配备6161名医护人员。病床与医护人员之比为:名医护人员。病床与医护人员之比为:14361436875=1.64875=1.64,表示每名医护人员平均负责表示每名医护人员平均负责1.641.64张病床。张病床。返返回回计划完成指标计划完成指标v定义定义:说明计划完成的程度,常用实际数达
12、到计划数的百分之说明计划完成的程度,常用实际数达到计划数的百分之几或几倍表示。几或几倍表示。v计算公式计算公式:v举例:举例:v某县原计划在一个伤寒疫区周围的人群对某县原计划在一个伤寒疫区周围的人群对15001500名居民接种伤寒疫苗,名居民接种伤寒疫苗,而实际上接种了而实际上接种了19581958人,计划完成指标为:人,计划完成指标为:(19581500)100%=130.5%(19581500)100%=130.5%,即完成了计划的即完成了计划的130.5%130.5%,也可用倍数表,也可用倍数表示,即完成计划的示,即完成计划的1.3051.305 倍。倍。v某县原计划对城区居民某县原计划
13、对城区居民15001500名易感人群接种乙肝疫苗,而实际上之接名易感人群接种乙肝疫苗,而实际上之接种了种了13501350人。计划完成指标人。计划完成指标=(1350150013501500)100%=90.5%100%=90.5%,即完成了即完成了原计划的原计划的90.5%90.5%。v计算相对数时分母不宜过小计算相对数时分母不宜过小 v正确区分构成比和率,不能以正确区分构成比和率,不能以构成比代替率构成比代替率 v正确计算正确计算平均率平均率v对率和构成比进行比较时,应注意资料的对率和构成比进行比较时,应注意资料的可比性可比性 v样本率或构成比进行比较时要作假设检验样本率或构成比进行比较时
14、要作假设检验v率的率的标准化标准化二、应用相对数应该注意的问题二、应用相对数应该注意的问题甲乙两校的患病率甲乙两校的患病率返回返回当当比比较较两两个个总总率率时时,若若其其内内部部构构成成不不同同,需需要要进进行行率的标准化。率的标准化。如如:用用某某药药治治疗疗某某病病患患者者,5 5例例中中有有3 3例例治治愈愈,计计算算治治愈愈率率为为3/53/5100%=60.0%100%=60.0%,如如果果有有4 4例例治治愈愈,则其治愈率为则其治愈率为80%80%。显然,这个结果是不稳定的。显然,这个结果是不稳定的。在分母例数很少的情况下,个别的偶然因素会导致结果在分母例数很少的情况下,个别的偶
15、然因素会导致结果的变化,只有分母例数较大时,计算的相对数才比较稳定。的变化,只有分母例数较大时,计算的相对数才比较稳定。在例数较少时,通常直接用在例数较少时,通常直接用绝对数绝对数表示。如果要用相对数表表示。如果要用相对数表示,则需列出其示,则需列出其总体率的置信区间总体率的置信区间。某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿新生儿44704470例,得以下资料,据此得出结论例,得以下资料,据此得出结论:“:“母亲年龄在母亲年龄在24292429岁时,畸形儿最多,占总数的岁时,畸形儿最多,占总数的92.2%92.2%,表明该年龄段
16、易,表明该年龄段易发生畸形儿,符合一般规律发生畸形儿,符合一般规律”。试分析该结论是否合理?。试分析该结论是否合理?某地畸形儿与母亲分娩年龄的关系某地畸形儿与母亲分娩年龄的关系例例.在进行某遗传病的研究中,一研究在进行某遗传病的研究中,一研究人员发现,在该病患者中,有人员发现,在该病患者中,有90%90%是第是第一个孩子,由此可见该病的遗传与出生一个孩子,由此可见该病的遗传与出生顺序有关顺序有关-更容易遗传给第一个孩子。更容易遗传给第一个孩子。这个结论是否正确,为什么?这个结论是否正确,为什么?返回学学 生生检查人数检查人数阳性人数阳性人数检出率(检出率(%)阳性构成比阳性构成比(%)小学生小
17、学生66060.915.41初中生初中生1115494.3944.14高中生高中生1563563.5850.45合合 计计33381113.33100.00表表10-1 200110-1 2001年某地中小学学生年某地中小学学生HBsAgHBsAg检出率及构成比检出率及构成比v在在比比较较相相对对数数时时,除除了了要要对对比比的的因因素素(如如不不同同的的药药物物),其其余余的的影影响响因因素素应应尽尽可可能能相相同同或或相相近近。即:即:同质同质v在在临临床床研研究究和和动动物物实实验验时时,应应遵遵循循随随机机抽抽样样原原则则进行分组。进行分组。v下列因素可能影响对比组之间的可比性:下列因
18、素可能影响对比组之间的可比性:v (1 1)观观察察对对象象是是否否同同质质,研研究究方方法法是是否否相相同同,观观察察时时间间是是否否相相等等,以以及及地地区区、周周围围环环境境、风风俗俗习习惯惯和和经经济济条件是否一致或相近等。条件是否一致或相近等。v (2 2)观观察察对对象象内内部部结结构构是是否否相相同同,若若两两组组资资料料的的年年龄龄、性性别别等等构构成成不不同同,可可以以分分别别进进行行同同年年龄龄别别、同同性性别别的的小小组组率率比比较较或或对对总总率率(合合计计率率)进进行行标标准准化化后后再再作作比比较较(见本节见本节三、三、)。三、率的标准化法三、率的标准化法v(一)率
19、的标准化的意义和基本思想(一)率的标准化的意义和基本思想 当两组资料内部各小组的当两组资料内部各小组的率率明显不同明显不同,而且各小组观察单位的而且各小组观察单位的构成比构成比也明显不同时也明显不同时,则不能直接比较两组的总率。则不能直接比较两组的总率。定义:定义:比较两个(或两个以上)总体率时,如果两个总体的内部构比较两个(或两个以上)总体率时,如果两个总体的内部构成有所差别,就不能直接拿两个总体率来做比较和下结论。只有通成有所差别,就不能直接拿两个总体率来做比较和下结论。只有通过采用统一的过采用统一的标准消除其内部构成上的差别标准消除其内部构成上的差别之后,才能进行比较,之后,才能进行比较
20、,这种消除内部构成差别,使总体率能够直接进行比较的方法就叫做这种消除内部构成差别,使总体率能够直接进行比较的方法就叫做率的标准化法率的标准化法。采用统一标准调整后的率为采用统一标准调整后的率为标准化率标准化率,简称为简称为标化标化率(率(standardized ratestandardized rate)。)。标准化的基本思想:标准化的基本思想:采用统一的采用统一的“标准人口构成标准人口构成”,以消除人口构,以消除人口构成不同对各组总率的影响成不同对各组总率的影响,使算得的标准化率具有可比性。使算得的标准化率具有可比性。u从要比较的两组中从要比较的两组中任选任选一组的内部构成作为标准一组的内
21、部构成作为标准u将要比较的两组资料内部各相应小组的观察单位数将要比较的两组资料内部各相应小组的观察单位数相加相加,作为共同的标准作为共同的标准u另外选一另外选一个个通用的通用的或或便于比较的标准便于比较的标准作为两者的作为两者的“共同标共同标准准”,如采用全国、全省或全地区的数据作为标准。,如采用全国、全省或全地区的数据作为标准。v标准化法计算的标准化法计算的关键关键是选择统一的标准构成。是选择统一的标准构成。选择标准构成的方法通常有三种:选择标准构成的方法通常有三种:直接法的使用条件直接法的使用条件是已经有被观察的人群中各年龄是已经有被观察的人群中各年龄组的患病率(或发病率、死亡率等)资料。
22、组的患病率(或发病率、死亡率等)资料。第一步选择方法第一步选择方法直接法或间接法直接法或间接法若缺乏各年龄组的患病率资料,仅有各年龄组的观察单位若缺乏各年龄组的患病率资料,仅有各年龄组的观察单位数和总的患病率,则选择数和总的患病率,则选择间接法间接法 计算公式计算公式(二)标准化率的计算(二)标准化率的计算1.1.直接法直接法适适用用情情况况:已已知知被被标标化化组组各各年年龄龄组组的的实实际际率率P Pi i,用标准人口数或标准人口构成进行计算。用标准人口数或标准人口构成进行计算。其中其中 为第为第i 组标准人口数,组标准人口数,为标准组总人数,为标准组总人数,为第为第i 组的实际率,组的实
23、际率,为第组标准人口构成。为第组标准人口构成。甲社区标准化后的患病率甲社区标准化后的患病率 乙社区标准化后的患病率乙社区标准化后的患病率如根据选定的标准人口构成做标准,如根据选定的标准人口构成做标准,2.2.间接法间接法适适用用情情况况:已已知知被被标标化化组组的的死死亡亡总总数数及及年年龄龄别别人人口数,但不知道各年龄组的实际死亡率。口数,但不知道各年龄组的实际死亡率。标准化死亡比标准化死亡比标标准准化化死死亡亡比比:被被标标化化组组实实际际死死亡亡数数与与预预期期死死亡亡数数之之比比,称称为为标标准准化化死死亡亡比比(standard mortality ratio),简简称称为为SMR。
24、若若SMR1,表表示示被被标标化化人人群群的的死死亡亡率率高高于于标标准准组组;反反之之,若若SMR1,表表示示被被标标化人群的死亡率低于标准组。化人群的死亡率低于标准组。例例10-410-4 某某地地观观察察了了吸吸烟烟者者与与不不吸吸烟烟者者各各年年龄龄组组人人数数如如表表10-610-6,同同时时观观察察期期内内吸吸烟烟者者中中有有432432人人死死于于肺肺癌癌,不不吸吸烟烟者者中中有有210210人人死死于于肺肺癌癌,试试计计算算吸吸烟烟者者与与不不吸吸烟烟者者的的标标准准化化死死亡率。亡率。吸烟者的肺癌标准化死亡比吸烟者的肺癌标准化死亡比 非吸烟者的肺癌标准化死亡比非吸烟者的肺癌标
25、准化死亡比 吸烟者的肺癌标准化死亡率吸烟者的肺癌标准化死亡率 非吸烟者的肺癌标准化死亡率非吸烟者的肺癌标准化死亡率 当各比较组内部构成(如年龄、性别等)不同时,应对率进行标准化后,当各比较组内部构成(如年龄、性别等)不同时,应对率进行标准化后,再作比较再作比较。选定的标准不同,算得的标准化率也不同。当比较几个标准化率时,应采选定的标准不同,算得的标准化率也不同。当比较几个标准化率时,应采用统一标准用统一标准。标准化后的率并不表示率的标准化后的率并不表示率的实际水平实际水平,只能表示相互比较资料间的,只能表示相互比较资料间的相对水相对水平平。如不就算标准化率,而分别比较各分组的率,也可得出正确结论,但如不就算标准化率,而分别比较各分组的率,也可得出正确结论,但 不能比较总率的大小。不能比较总率的大小。两样本标准化率是样本值,存在抽样误差,若想得出标化组和被标化组的两样本标准化率是样本值,存在抽样误差,若想得出标化组和被标化组的总率是否相等的结论,还应作假设检验。总率是否相等的结论,还应作假设检验。3.3.率的标准化应注意的问题率的标准化应注意的问题