1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第三军医大学卫生统计学教研室,Department of Health Statistics,TMMU,2025/10/24 周五,1,1.计量资料(或定量变量),measurment data,,,quantitative data,,定义,:测定每个观察单位的某项指标量的大小,所得的资料称为计量资料。其变量值是定量的,一般带有度量衡或其它单位。,特点,:,每个观察单位的观察值之间有量的区别。,统计资料的分类,2025/10/24 周五,2,某市,110,名健康男性工人的血红蛋白量,(g/L),118
2、148,158,163,138,156,134,140,152,132,149,165,160,119,174,137,152,154,140,122,138,148,139,168,160,120,151,121,146,135,156,149,135,148,138,133,150,132,153,140,148,135,146,158,137,153,142,155,114,147,133,127,132,155,134,138,139,131,142,135,145,134,143,128,147,137,142,119,139,131,145,141,150,152,125,147
3、144,131,162,138,146,121,143,130,141,150,128,142,150,107,123,143,140,140,147,130,141,126,151,149,140,139,140,125,147,129,149,142,154,151,2025/10/24 周五,3,3.等级资料(或半定量资料,有序分类变量),ranked data,semi-quantitative data,,ordinal category data,定义:,将观察单位按某个指标量的大小分成等级或某种属性的不同程度分成等级后分组计数,分类汇总各组的观察单位数称为等级资料。,特点:,等
4、级,是,有序,分组。同计数资料的区别是:,属性,的,分组有程度的差别,,各组按一定顺序排列;与计量资料的区别是:,每个观察单位未确切定量,,所以又称为半定,量,资料。,2025/10/24 周五,6,季节,营养状况,缺乏,不足,适宜,合计,夏季,5,7,8,20,冬季,11,9,2,22,某地居民体内核黄素营养状况调查结果,*核黄素营养状况评价标准:缺乏为1000,g。,2025/10/24 周五,7,计量资料的统计描述,Statistical Description,2025/10/24 周五,8,某市,110,名健康男性工人的血红蛋白量,(g/L),118,148,158,163,138,
5、156,134,140,152,132,149,165,160,119,174,137,152,154,140,122,138,148,139,168,160,120,151,121,146,135,156,149,135,148,138,133,150,132,153,140,148,135,146,158,137,153,142,155,114,147,133,127,132,155,134,138,139,131,142,135,145,134,143,128,147,137,142,119,139,131,145,141,150,152,125,147,144,131,162,138,
6、146,121,143,130,141,150,128,142,150,107,123,143,140,140,147,130,141,126,151,149,140,139,140,125,147,129,149,142,154,151,2025/10/24 周五,9,2025/10/24 周五,10,平均数指标,平均数,(,average,),是描述一群,同质变量值集中位置,的特征值,用以说明同类现象或,事物数量,的,中等水平,(集中趋势)。,常用指标:,算术均数、中位数,等。,2025/10/24 周五,11,1.,定义,:,简称,均数,,,符号为 (相应的总体均数记为,)。,定义公式为
7、一)算术均数,(mean),2025/10/24 周五,12,算术均数适合于对称分布的资料,如,分布均匀,的小样本数据或,近似正态分布,的大样本数据;,算术均数容易,受极端值的影响,。,2.,均数的应用与特点,2025/10/24 周五,13,将一组变量值按,大小顺序排列,,位次,居中,的变量值即为中位数。中位数将变量值一分为二,一半比它小,一半比它大。符号为,M,、,M,d,。,1.,中位数的计算,(二)中位数(,median,),2025/10/24 周五,14,2.,中位数的应用与特点,中位数将频数等分为二,所以中位数适合,各种类型,的资料,尤其适合于,大样本偏态分布,的资料。,由于
8、中位数总处在居中的位置上,因而它不受特大或特小值的影响。,2025/10/24 周五,15,变异指标,又称,离散指标,,用以描述一组计量资料各观察值之间参差不齐的程度。,变异指标越大,观察值之间差异愈大,说明平均数的代表性就越差;反之亦然。,变异指标,2025/10/24 周五,16,三组同性别、同年龄儿童体重,甲组,26,28,30,32,34,乙组,24,27,30,33,36,丙组,26,29,30,31,24,丙组,乙组,甲组,三组均数均为,30,2025/10/24 周五,17,一,.,四分位数间距,四分位数间距,(,Q),包括了全部变量值中,居于中间,水平的一半数据的分布范围。,Q
9、P,75,P,25,缺点:,比较稳定,但不能反映其余数据的变异情况,没有充分利用每个变量值的信息。,四分位数间距仅用来描述,大样本偏态资料,的变异情况。,Q,2025/10/24 周五,18,二,.,方差与标准差,方差,(,Variance,),分为样本方差和总体方差。样本方差符号为 ,相应的总体方差符号为 。,(一)方差的定义,2025/10/24 周五,19,2025/10/24 周五,20,(二)标准差的定义,标准差即为方差的,平方根,,样本标准差符号为,s,,,相应的总体标准差符号为,。,2025/10/24 周五,21,丙组,乙组,甲组,三组同性别、同年龄儿童体重,甲组,26,28
10、30,32,34,乙组,24,27,30,33,36,丙组,26,29,30,31,24,2025/10/24 周五,22,方差或标准差属同类变异指标,它们多用来描述,均匀分布,或,近似正态分布,的资料,大、小样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中常用 的形式表达资料。,(三)方差与标准差的应用,2025/10/24 周五,23,三,.,变异系数,变异系数(,CV),:,2025/10/24 周五,24,例,2-12,某部队干部体检得到体脂的均数和标准差分别为,18.9%,和,5.8%,,血清胆固醇的均数与标准差分别为,4.84mmol/L,和,1.0
11、3mmol/L,,试比较两者的变异情况。,体脂变异系数:,血清胆固醇变异系数:,2025/10/24 周五,25,变异系数可用于,不同类型资料间,变异程度的比较,如比较儿童的身高与体重的变异,比较同性别、同年龄的正常人的血压与血脂的变异等;,变异系数也可用于,均数相差悬殊时同单位资料间,变异程度的比较,如不同年龄段同性别儿童的体重变异大小比较等。,2025/10/24 周五,26,常用统计指标的特点及其应用场合,指标,特点,应用场合,精确,易受极端值影响,均匀分布的小样本数据或近似正态分布数据,稳定,不受特大或特小值的影响,应用范围广,特别是大样本偏态分布资料,标准差与均数的比值,无单位,比较
12、不同资料或同类资料均数相差悬殊时变异程度,2025/10/24 周五,27,计量资料的统计推断,Statistical Inference,2025/10/24 周五,28,教学的设计和理念,强调,SPSS,结果解释,强调设计模型,以实例引入,2025/10/24 周五,29,假设检验,Why,What,How,Where,2025/10/24 周五,30,依据,随机样本,对未知事物进行判断和决策 假设检验,一是需要从全局的范围,即从总体上对问题作出判断,单纯比较样本会有风险;,二是不可能或不允许对研究总体的每一个个体均作观察。,Why,2025/10/24 周五,31,假设检验,(hypot
13、hesis testing),亦称,显著性检验,(significance testing),:它是利用,小概率反证法思想,,目的是通过考察一部分样本对总体作出,二择一,的决策。,What,2025/10/24 周五,32,实例,通过以往大规模调查,已知某地一般新生儿的头围均数为,34.50cm,,标准差为,1.99cm,。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿,55,人,测得其头围均数为,33.89cm,,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?,假设检验的,目的,就是判断差别是由哪种原因造成的。,抽样误差造成的,本质差异造成的,How,2025/1
14、0/24 周五,33,根据,变量和资料类型,、,设计方案,、,统计推断的目的,、是否满足,特定条件,等(如数据的分布类型)选用适当的统计方法,选择并计算相应的统计量,(,如,t,u,F,值,),。,Where,2025/10/24 周五,34,P,值概念,P,值概念,错误拒绝,H,0,的概率。,即,在,H,0,所规定的总体中作随机抽样,得到绝对值,等于或大于,上一步计算出的检验统计量的概率。,2025/10/24 周五,35,若,P,结论为按所取,检验水准拒绝,H,0,,,接受,H,1,,,差别有统计学意义;,其,统计学,依据是,在,H,0,成立的情况下,得到现有统计量的概率,P,,,结论为按
15、所取检验水准不拒绝,H,0,,,差别没有统计学意义。,不拒绝,H,0,,,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。,2025/10/24 周五,36,P,值和,的关系,P,和,本质相同,都为概率,,P,是根据当前试验计算的概率,,是预先给定的概率,为检验水准,是定义了的小概率上限。因此计算得到的,P,值要与,进行比较才能给出假设检验的结论。,P,值的意义:,如果总体状况和,H,0,一致,统计量获得的现有数值以及更不利于,H,0,的数值的可能性(概率)有多大?,值的意义:,错误地拒绝,H,0,的概率或接受,H,1,的风险。一般,=0.05,或,0.
16、01,2025/10/24 周五,37,假设检验的注意事项,(,1,),可比性,(,2,),正确选用假设检验方法,(,3,),判断结论时不能绝对化,提倡使用精确,P,值。,(,4,),单侧检验与双侧检验,(,5,),可信区间与假设检验各自不同的作用,要结合使用。,95,CI,既能说明差别的大小,也具有检验的作用,建议使用。,2025/10/24 周五,38,样本均数与已知总体均数比较,两样本均数比较,配对样本均数比较,多个样本均数比较,单因素计量资料的分析,两组样本,2025/10/24 周五,39,t,检验,t-test,2025/10/24 周五,40,t,检验(,t-test,)源于,t
17、分布,t,分布是英国统计学家,W.S.Gosset,于,1908,年以“,Student”,笔名发表论文提出的,所以又称“,Students t-distribution”,。,t,分布的发现使得小样本统计推断成为可能,它被认为是统计学发展历史中的里程碑之一。,以,t,分布为基础的检验称为,t,检验,在医学统计学中,,t,检验是非常活跃的一类假设检验方法。,2025/10/24 周五,41,应用:,1.,小样本均数与总体均数的比较,;,2.,配对资料的比较,;,3.,两样本均数的比较,。,t,检验(,t-test,)主要用于,样本含量较小,,总体标准差,未知的,正态分布,资料。,2025/1
18、0/24 周五,42,样本均数与,已知总体均数比较,2025/10/24 周五,43,样本与总体比较,正态或转换后为正态,非正态,单样本,t,检验,(均数),Wilcoxon,符号秩和检验(中位数),2025/10/24 周五,44,例,某地正常成年男子凝血酶时间,(TT),均数为,16.00s,。某研究小组测得,30,例男性肺癌患者的凝血酶时间均数为,18.39s,,标准差为,4.66s,,问肺癌患者的凝血酶时间是否高于正常男子,?,注意:,医学中一些,公认的生理常数,一般可看作总体均数,0,。,凝血酶时间,21.22,15.80,15.83,14.46,16.34,12.06,21.21,
19、18.37,16.40,15.27,12.67,18.08,21.85,19.55,25.33,12.80,27.65,21.80,17.39,18.08,19.69,22.66,11.33,12.54,29.88,25.25,18.00,19.31,14.16,16.85,2025/10/24 周五,45,例,SPSS,操作结果,正态性检验结果,P=0.2000.05,,资料符合正态分布。,2025/10/24 周五,46,基本统计描述,均数,标准差,标准误,2025/10/24 周五,47,单样本,t,检验结果,P,值,自由度,t,值,与总体均数差值的可信区间,检验统计量,t=2.811,
20、P=0.0090.05,,资料符合正态分布。,2025/10/24 周五,54,基本统计描述,2025/10/24 周五,55,配对,t,检验结果,t,值,P,值,差值均数的95%可信区间,差值均数,差值的标准差,差值均数的标准误,检验统计量,t=12.319,,,P=0.0000.05,,方差齐性。,2025/10/24 周五,62,t,检验结果,均数差值,均数差值的标准误,均数差值的95%可信区间,t,值,自由度,P,值,独立样本,t,检验结果,检验统计量,t=2.734,,,P=0.0140.05,,方差齐性。,2025/10/24 周五,71,完全随机设计单因素方差分析表,组间,组内,平方和,均方,F,值,P,值,检验统计量,F=3.729,,,P=0.03,72,)均数比较;,该资料是否符合正态分布和方差齐性的条件;,若资料符合正态分布和方差齐性,则选用单因素方差分析,(0ne-way ANOVA),;若不符合正态分布和方差齐性,则考虑变量变换或选用成组设计多样本秩和检验,(,Kruskal,-Wallis,test),。,若检验结果有统计学意义,则还需进行两两比较,(LSD),。,不能用,t,检验(会导致,型错误概率增大),2025/10/24 周五,75,2025/10/24 周五,76,Thank you!,2025/10/24 周五,77,






