1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此
2、处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第四讲分类变量的统计描述率的标准误,(优选)第四讲分类变量的统计描述率的标准误,5/20/2025,3,基本内容,统计描述,统计推断,(1),统计推断,(2),数值变量,频数分布,集中趋势,离散趋势,统计图表,抽样误差,标准误,均数可信区间,t Z F,检验,秩和检验,直线相关与回归,偏相关,多元线性回归,因子分析,分类变量,相对数,(率、比),率的可信区间,2,检验,Logistic回归,主要内容,一、分类变量概述,二、分类变量的统计描述,相对数
3、应用相对数的注意事项,动态数列,率的标准化,三、分类变量的统计推断,率的标准误和可信区间,2,检验,分类变量定义,通过确定每个观察单位的某项特征的性质或类别得到的数据。,请大家举出研究中熟悉的分类变量的例子,:,特点,变量值是定性的,没有度量衡单位,第一节、分类变量概述,类型,无序分类变量:二项分类变量、多项分类变量,有序分类变量,统计分析中的处理,赋值,数据转换,SPSS,程序:,Transform Recode Into different variables,1=“,男性”,,2=“,女性”,出生体重(数值变量)低出生体重、正常出生体重、巨大儿,练习,SPSS,中变量转换操作,:,(出
4、生体重,-,率,.sav,数据库),将出生体重从数值变量变成分类变量(低出生体重、正常出生体重、巨大儿),5/20/2025,8,第二节分类变量的统计描述,一、常用相对数,二、应用相对数的注意事项,三、动态数列,四、率的标准化,5/20/2025,9,为什么引入相对数?,年甲县心脑血管疾病死亡人数253人,乙县为132人,能否说甲县心脑血管疾病的威胁比乙县严重?,5/20/2025,10,2.,在某遗传病的研究中,研究人员发现该病患者中,有,90%,是第一个孩子,由此可见该病的遗传与出生顺序有关,-,更容易遗传给第一个孩子。这个结论是否正确,为什么?,5/20/2025,11,绝对数:实际观察
5、得到的数据,反映真实情况。,相对数:两个有联系的指标(数值)之比,用于比较。,5/20/2025,12,相对数的种类,:,1.,率,2.,构成比,3.,相对比,重要区别:,分子、分母,一、常用相对数,5/20/2025,13,1.,率,概念:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。,计算公式:,如何选,K,?使算得的率至少保留,12,位整数,习惯:,IMR,,,MMR/10,万,注意:不受其它指标的影响;各率相互独立,求和不一定为,1,(如是则属巧合)。,5/20/2025,14,常用的频率,/,类频率指标:,5/
6、20/2025,15,5/20/2025,16,5/20/2025,17,病名,平均人口数,死亡人数,死亡率,(,1/10,万),高血压,172665,40,23.2,冠心病,172665,11,6.4,脑卒中,172665,253,146.5,风心病,172665,38,22.0,例:某地,2007,年四种常见心血管病死亡率,(2)选用标准不同,标化率会改变,但比较结果只有一个,不能改变;,分析时不能以(构成)比代(替)率,通过确定每个观察单位的某项特征的性质或类别得到的数据。,小样本(n50)时,可直接查“百分率的可信区间表”,即可得到总体率的1-可信区间。,80(1980-1989年),
7、环比增长速度:报告期指标比上一期水平净增加的百分比或倍数。,某年儿童体检指标中,男孩占体检儿童的比例?,P1,P2所代表的总体率相同,由于抽样误差的存在,造成了样本率不同,这种差别在统计上叫差别无统计学意义。,Europe:France,要估计至少要准备多少药物,就要估计得到该患病率的可信区间。,80(1980-1987年),要比较的两组的内部构成不相同;,试求此患病率的标准误。,总率(平均率)的计算:不能直接相加求和,5/20/2025,18,2.,构成比,概念:也叫构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,,用以说明某一事物内部各组成部分所占的比
8、重或分布,。,计算公式:,注意:各组成部分的构成比之和为,100%,;,某一部分比重增大,则其它部分相应减少。,制图:一般用圆图(饼图)或百分条图,5/20/2025,19,人数,%,甲区,200,50.0,乙区,120,30.0,丙区,80,20.0,合计,400,100.0,人数,%,甲区,300,60.0,乙区,120,24.0,丙区,80,16.0,合计,500,100.0,例:某市某病患者的地区构成,5/20/2025,20,2002,年全国各地城市农村计划生育手术构成(,%,),城市,农村,27%,46%,12%,13%,2%,5/20/2025,21,练习:,放环情况,放环人数,
9、失败人数,失败人数构成比,(?),失败率(?),人工流产后,254,76,月经后,88,40,哺乳期,17,10,合计,359,126,率及构成比的差别?,已婚妇女不同情况下放环失败比较,5/20/2025,23,3.,相 对 比,概念:是指两个有关联的指标之比,是对比的最简单形式。,计算公式:,A/B,(或,100%,),表示,A,是,B,的若干倍或百分之几。,例如:,BMI,、性别比、,CV,等。,注意:,1.,A,、,B,可以是性质相同的,也可以是性质不同的,2.,A,、,B,可以是绝对数,也可以是相对数或平均数,Country(2010),Sex Ratio,Africa:Uganda
10、96.5,Zimbabwe,95.4,North A.USA,95.1,South A.:Argentina,95.6,Asia:China,106.5,India,107.9,Bangladesh,106.1,South Korea,100.7,Europe:France,94.8,U.K.,93.9,Sweden,97.6,部分国家人口性别比,年代,调查,活产数,出生性别比,资料来源,70(1972-1979年),33915,105.2,2,生育率调查,(国家计生委),80(1980-1987年),32114,109.9,2,生育率调查,(国家计生委),80(1980-1989年),26
11、268,110.9,2001年全国计划生育/生殖健康调查(国家计生委),90(1990-2001年),23103,124.1,2001年全国计划生育/生殖健康调查(国家计生委),2000,(,1999.112000.10出生),11752,119.4,第五次全国人口普查,0.95,抽样,中国历年报告的出生性别比,1996-2005,127,2006年全国生殖健康调查,5/20/2025,26,例,1.,在某遗传病的研究中,研究人员发现该病患者中,有,90%,是第一个孩子,由此可见该病的遗传与出生顺序有关,-,更容易遗传给第一个孩子。这个结论是否正确,为什么?,以,(,构成,),比代替率的错误,
12、实例分析,5/20/2025,27,例2.某项目县为提高医疗卫生的服务水平,对卫生人员进行培训,但是,经过3年培训,与培训前相比,该县孕产妇的死亡率却上升,如何解释?,培训前(2001年):2000名孕产妇死亡2人,100/10万,培训后(2004年):名孕产妇死亡3人,149/10万,计算率时分母不能太小,5/20/2025,28,例,3.,在对肺癌病人的死亡情况进行分析时发现:北医三院肺癌病人的死亡率为,65%,,密云县医院为,25%,,请问哪家医院的治疗水平高?,两个资料要有可比性,5/20/2025,29,区名,平均人口数,新发病例数,发病率,(,%,),甲区,100000,20000
13、20,乙区,80000,12000,15,丙区,40000,6500,16.25,合计,220000,38500,?,例,4.,某市,2007,年各区流感的发病率,请问:全,市流感的发病率?,总率的计算不能是各分率的直接相加,5/20/2025,30,二、应用相对数时的注意事项,分析时不能以(构成)比代(替)率,计算相对数时分母不能太小,资料的可比性:两个率要在相同的条件下进行(标准化问题),总率(平均率)的计算:不能直接相加求和,样本相对数的比较应做假设检验:样本相对数存在抽样误差,应进行差别的显著性检验,.,按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,以便观察和比较该事
14、物在时间上的变化和发展趋势。,这些统计指标可以是绝对数、相对数或平均数等。,动态数列分析是建立在相对比基础上的,采用定基比和环比两种方式。,常用的分析指标有:绝对增长量、发展速度与增长速度、平均发展速度和平均增长速度。,三、动态数列,某大学,1992,2002,年本科专业招生动态变化,年份,符号,学生人数,绝对增长量,发展速度,(,),增长速度,(,),累计,逐年,定基比,环比,定基比,环比,(1),(2),(3),(4),(,5,),(6),(7),(8),(9),1992,a,0,4200,-,-,100.0,100.0,-,-,1993,a,1,4500,300,300,107.1,10
15、7.1,7.1,7.1,1994,a,2,4800,600,300,114.3,106.7,14.3,6.7,1995,a,3,4900,700,100,116.7,102.1,16.7,2.1,1996,a,4,5150,950,250,122.6,105.1,22.6,5.1,1997,a,5,5320,1120,170,126.7,103.3,26.7,3.3,1998,a,6,5510,1310,190,131.2,103.6,31.2,3.6,1999,a,7,5780,1580,270,137.6,104.9,37.6,4.9,2000,a,8,5950,1750,170,141.
16、7,102.9,41.7,2.9,2001,a,9,6000,1800,50,142.9,100.8,42.9,0.8,2002,a,10,6200,2000,200,147.6,103.3,47.6,3.3,绝对增长量,说明事物在一定时期增长的绝对值。,累计增长量:报告年的指标与某一固定年(基期水平)指标之差。,逐年增长量:报告年的指标与前一年指标之差。,发展速度与增长速度,定基发展速度:报告期指标的水平相当于基期水平的百分比或倍数。,定基增长速度:相对于基期水平,报告期指标净增加的百分比或倍数。,环比发展速度:报告期指标的水平相当于上一期水平的百分比或倍数。,环比增长速度:报告期指标比上一
17、期水平净增加的百分比或倍数。,描述时一定要说清楚比较的基数,以区分定基还是环比速度。,平均发展速度和平均增长速度,平均发展速度:某事物在一个较长时期内逐年平均发展变化的速度。,是环比速度的几何平均数。,平均增长速度:某事物在一个较长时期内逐年平均增长的速度。,平均增长速度平均发展速度,1,率及构成比计算的,SPSS,程序:,相对比计算的,SPSS,程序:,Analyze Descriptive Statistics Frequencies,选分析变量入,Variable(s),框,OK,Transform Compute Target Variable,(新变量名),Numeric Expre
18、ssion,(计算方式),OK,SPSS,练习,(出生体重,-,率的计算数据库),某年儿童体检指标中,男孩占体检儿童的比例?,体检儿童的母亲职业分布情况?,体检儿童中,低出生体重的发生率是多少?(出生体重低于,2500,克为低出生体重),体检儿童中,出生,BMI,是多少,?,5/20/2025,39,四、率的标准化(,standardization,),条件:内部构成影响总率;要比较的两组的内部构成不相同;比较两组的总率。,方法:,直接法(,适用于已知两组的内部构成,),间接法(略),步骤:,选定标准构成,在比较的资料中任选一组资料的内部构成作为标准构成;,两组资料各部分之和组成的构成作为标准
19、构成;,选择有代表性的、较固定的、数量较大的人群。,2.,计算预期发生数,3.,求标准化率,直接法计算甲乙两厂的标准化患病率(%),各率相互独立,求和不一定为1(如是则属巧合)。,Europe:France,说明事物在一定时期增长的绝对值。,总率(平均率)的计算:不能直接相加求和,随n增大,图形逐渐对称分布,如要作集体驱虫治疗,至少应准备多少份药物?(95%),South Korea,某大学19922002年本科专业招生动态变化,例:某市为了解已婚育龄妇女子宫颈糜烂的患病情况,进行了抽样调查,随机抽取2000人,患者80例。,培训后(2004年):名孕产妇死亡3人,149/10万,计算相对数时
20、分母不能太小,定基增长速度:相对于基期水平,报告期指标净增加的百分比或倍数。,累计增长量:报告年的指标与某一固定年(基期水平)指标之差。,第四讲分类变量的统计描述率的标准误,5/20/2025,41,例:甲乙两厂同工种工人某病的患病率见下表。某领导因发现乙厂的总患病率高于甲厂而认为乙厂的患病情况严重,并批评了乙厂,但是乙厂不服气。请你帮助解释说明真实情况。,5/20/2025,42,甲 厂,乙 厂,工 龄,(年),人数,患病人数,患病率,(,%),人数,患病人数,患病率,(,%),3,400,12,3.0,100,2,2.0,3,100,18,18.0,400,40,10.0,合计,500,3
21、0,6.0,500,42,8.4,甲乙两厂同工种工人某病的患病率,5/20/2025,43,直接法计算甲乙两厂的标准化患病率,(%),甲厂标准化患病率,=105/1000=10.5%,乙厂标准化患病率,=60/1000=6.0%,工 龄,(年),标准,人口数,甲 厂,乙 厂,原患病率,(,%),预期患病人数,原患病率,(,%),预期患病人数,3,500,3.0,15,2.0,10,3,500,18.0,90,10.0,50,合计,1000,6.0,105,8.4,60,可见,乙厂的患病率低于甲厂,与分工龄组比较的结论一致,消除了工龄构成不同的影响。,随n增大,图形逐渐对称分布,绝对数:实际观察
22、得到的数据,反映真实情况。,South Korea,环比增长速度:报告期指标比上一期水平净增加的百分比或倍数。,在对肺癌病人的死亡情况进行分析时发现:北医三院肺癌病人的死亡率为65%,密云县医院为25%,请问哪家医院的治疗水平高?,这些统计指标可以是绝对数、相对数或平均数等。,这些统计指标可以是绝对数、相对数或平均数等。,环比发展速度:报告期指标的水平相当于上一期水平的百分比或倍数。,2001年全国计划生育/生殖健康调查(国家计生委),80(1980-1989年),四、率的标准化(standardization),(三)行x列表x2检验,2.,计算公式:A/B(或100%),5/20/2025
23、44,注意事项:,(,1,)标化率不能反映实际水平,只能用于比较;,(,2,)选用标准不同,标化率会改变,但比较结果只有一个,不能改变;,(,3,)比较两样本的标化率,也要进行假设检验。,5/20/2025,45,基本内容,统计描述,统计推断,(1),统计推断,(2),计量资料,频数分布,集中趋势,离散趋势,统计图表,抽样误差,标准误,均数可信区间,t Z F,检验,秩和检验,直线相关与回归,偏相关,多元线性回归,因子分析,计数资料,相对数,(率、比),率的可信区间,2,检验,Logistic回归,5/20/2025,46,第三节分类变量的统计推断,一、,率的标准误和可信区间,二、,2,检验
24、一)成组设计四格表资料的,2,检验,(二)配对设计四格表资料的,2,检验,(三)行,x,列表,x,2,检验,(四)趋势,x,2,检验,5/20/2025,47,一、率的标准误和可信区间,样本率,p,,总体率,抽样误差产生的原因、概念,1,、率的,标准误,5/20/2025,48,x,率的,标准误,P,1,P,2,P,3,Pi,p,=0.5,时,不同,n,值对应的二项分布,=0.3,时,不同,n,值对应的二项分布,在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量,二项分布的图形现状取决于,n,和,的取值。,随,n,增大,图形逐渐对称分布,5/20/2025,
25、50,率的标准误计算公式:,与样本量的关系:成反比。,5/20/2025,51,例:某市为了解已婚育龄妇女子宫颈糜烂的患病情况,进行了抽样调查,随机抽取,2000,人,患者,80,例。试求此患病率的标准误。,点估计,:,不考虑抽样误差的大小,将样本率直接作为总体率的估计值。,区间估计,2,、总体率的区间估计,总体率的可信区间,小样本(,n,50),时,可直接查,“,百分率的可信区间表,”,,即可得到总体率的,1-,可信区间。,样本量不太小,总体率既不太小,也不太大,比如,np,与,n(1-p),均大于,5,时,样本率,p,的抽样分布近似正态分布。此时总体率的可信区间为,例:某社区共有,1200
26、0,人。现抽查了,800,人,发现,200,人患有蛔虫病。如要作集体驱虫治疗,至少应准备多少份药物?(,95%,),要知道准备多少药物,就要知道该人群中蛔虫病的患病率(点估计);要估计至少要准备多少药物,就要估计得到该患病率的可信区间。,“,至少,”,就是要保证病人都能得到药物,所以要按最高患病率来准备。,样本率,p=200/800=0.25=25%,。因此样本率的标准误为,该人群中蛔虫感染率的,95,可信区间为,即人群中蛔虫感染率在,22,28,之间。因此至少要准备,12000*28,3360,份药物。,5/20/2025,56,例:某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?,两个样本率不同:,P,1,(,14%,);,P,2,(,25%,),总体样本;资料性质;绝对数相对数,5/20/2025,57,x,率的,标准误,P,1,P,2,P,3,Pi,p,5/20/2025,58,当两个样本率不同时,有两种可能,:,P,1,P,2,所代表的总体率相同,由于抽样误差的存在,造成了样本率不同,这种差别在统计上叫,差别无统计学意义,。,P,1,P,2,所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义,。,用统计学方法进行判断属于那种情况。,x,2,检验,
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818