1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 变异程度的统计描述,衡量变异程度的指标,正态分布及应用,医学参考值范围,例3.1 对甲乙两名高血压患者连续观察5天,测得的收缩压(,mmHg),结果如下:,患者,第1天,第2天,第3天,第4天,第5天,均数,甲患者,162,145,178,142,186,162.6,乙患者,164,160,163,159,166,162.4,可以看出:,两患者收缩压的均数十分接近,,,但甲患者血压波动较大,而乙患者相对稳定。,
2、通常,描述一组观察值,除需要表示其平均水平外,还要说明它的离散或变异的情况。,优点:,简单明了,容易使用。如用于说明传染病、食物中毒等的最短、最长潜伏期等。,缺点:,没有利用观察值中的全部信息,不稳定。,2,、四分位数间距,(,quartile,),将所用观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的,25%,,去掉两端的,25%,,取中间的,50%,观察值的数据范围即为四分位数间距。用,Q,表示。,上四分位数,Q,u,(,P,75,)与下四分位数,Q,l,(,P,25,)之差,包含了全部观察值的一半。,四分位数间距主要用于衡量明显偏态分布资料的变异程度。,Q,越大,说
3、明资料变异程度越大。,第二章例,2.4,:,Q,=,P,75,-,P,25,=135.763.2=72.5mg/L,优点:与极差相比不易受极端值影响,缺点:仍然没有利用观察值中的全部信息,不稳定。,二、离均差平方和、方差、标准差和变异系数,平均偏差,离均差平方和,方差,标准差,变异系数,(一)平均偏差(,M,ean,D,ifference,),1,、概念:,将每个观察值与均数之差的绝对值相加,然后取平均值称为平均偏差。,2,、公式:,平均偏差越大,说明资料离散程度越大。,缺点:由于使用绝对值,应用受到限制,实际,中很少用到。,乙患者:,如对于例3.1:,甲患者:,(二)离均差平方和(,Sum
4、of Square,,SS,),为了克服平均偏差的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,,,其计算公式为,SS,通常作为一个中间统计量使用。,(三)方差(,Variance),方差是将离均差平方和再取平均,即,注意:对于样本资料,分母用的是,n,-1,,称为自由度,(,degree of freedom,df,),。,方差的特点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。,(四)标准差(,Standard Deviation),将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差:,例如对于例3.1,经计算,有,甲患者:,乙
5、患者:,对于频数表资料,f,为各组段的频数,为各组段的组中值,例,3.2,根据第二章表,2-2,频数表资料,计算成年男子红细胞数的标准差。计算表如下:,红细胞计数(,x10,12,/L,),组中值(,x,),频数(,f,),f x,f x,2,(,1,),(,2,),(,3,),(,4,),(,5,),3.80,3.90,2,7.80,30.42,4.00,4.10,6,24.60,100.86,4.20,4.30,11,47.30,203.39,4.40,4.50,25,112.50,506.25,4.60,4.70,32,150.40,706.88,4.80,4.90,27,132.30,
6、648.27,5.00,5.10,17,86.70,442.17,5.20,5.30,13,68.90,365.17,5.40,5.50,4,22.00,121.00,5.60,5.70,2,11.40,64.89,5.805.95,5.90,1,5.90,34.81,合计,140,669.80,3224.20,表,3-1 140,名成年男子红细胞计数(,10,12,/L,)的标准差计算表,根据公式计算:,标准差为:,0.3810,12,/L,标准差的意义:,全面反映了一组观察值的变异程度,越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好。,标准差的应用:,描述变异程度、计算标
7、准误、计算变异 系数、描述正态分布、估计正常值范围。,(五)变异系数(,Coefficient of Variation),意义:标准差与均数之比用百分数表示。,符号,:CV,计算,:,无单位,应用:单位不同的多组数据比较,均数相差悬殊的多组资料比较,例3.3,测得某地成年人舒张压均数为77.5,mmHg,标准差为10.7,mmHg;,收缩压均数为122.9,mmHg,标准差为17.1,mmHg。,试比较舒张压和收缩压的变异程度。,第二节、正态分布及应用,正态分布,标准正态分布,正态分布应用,图,3-1,某地成年男子红细胞数的分布逐渐接近正态分布示意图,一、正态分布,(,Normal Dist
8、ribution),正态分布有两个参数:和 ,分别表示均数和标准差。,正态分布的特征,均数处最高,以均数为中心,左右对称,曲线下面积集中在以均值为中心的中心部分,曲线下的面积有一定规律,正态分布完全由参数,和,决定,图3-2 正态分布曲线下的面积,图3-3 三种不同均值的正态分布,图3-4 三种不同标准差的正态分布,二、标准正态分布,(,Standard Normal Distribution),是均数为,0,,标准差为,1,的正态分布。,正态分布的特殊形式:,标准正态分布,N,(,0,,,1,),记作:,X,N,(,0,,,1,),二、标准正态分布,对任何参数的正态分布,都可以通过一个简单的
9、变量变换 化成,和 的,标准正态分布,。通常,,可以利用标准正态分布表求出与原始变量,X,有关的概率值。,二、标准正态分布,(,Standard Normal Distribution),图3-5 标准正态分布及曲线下面积,对任意的正态分布,都可以通过下面的公式转化为标准正态分布。,例:成年男子的红细胞数近似服从正态分布,假设均值为,4.7810,12,/L,,标准差为,0.3810,12,/L,,试计算红细胞数低于,410,12,/L,所占的比例,。,查附表,1,得(,-2.05,),=0.0202,,表明成年男子的红细胞数低于,410,12,/L,的人占总体的,2.02%,。,例:成年男子
10、的红细胞数近似服从正态分布,假设均值为,4.7810,12,/L,,标准差为,0.3810,12,/L,,试计算红细胞数在,410,12,/L,5.510,12,/L,范围内所占的比例,。,成年男子的红细胞数在,410,12,/L,5.510,12,/L,范围内所占的比例,95.04%,。,三、正态分布应用,医学参考值范围的估计,误差分析和质量控制,统计推断方法的理论基础,第三节、医学参考值范围,一、,医学参考值范围的概念,:,医学参考值范围(,reference value range,)传统上称正常值范围(,normal range,),是指特定健康人群的解剖、生理、生化、免疫及组织代谢产
11、物的含量等各种数据的波动范围。习惯上是确定包括,95%,的参照总体的范围。,使用医学参考值目的,一是基于临床实践,着眼于个体,作为划分正常人与异常人的界限。,二是基于预防医学,着眼于人群,如制订不同性别、年龄的儿童某项发育指标的等级标准,用来评价儿童的发育水平等。,二、,医学,参考值范围的制定方法:,1,、选取足够数量的正常人作为参照样本,2,、对选定的参照样本进行准确的测定,3,、决定取单侧范围还是双侧范围值,4,、选取适当的百分范围,5,、估计参考值范围的界限,估计参考值范围的界限,参考值范围估计,主要,有百分位数法和正态分布法。,百分范围(%),单 侧,双,侧,下限,上限,下限,上限,9
12、5,P,5,P,95,P,2.5,P,97.5,99,P,1,P,99,P,0.5,P,99.5,表3-2 参考值范围所对应的百分位数,估计参考值范围的界限,参考值范围估计,主要,有百分位数法和正态分布法。,百分范围,(%),单 侧,双,侧,下限,上限,下限,上限,95,99,表3-3 参考值范围所对应的正态分布区间,例,3.4,若已算得某地正常成年男子红细胞数的均数为4.7810,12,/,L,标准差为0.3810,12,/,L,试估计该地成年男子红细胞数的95%参考值范围。,下限:,上限:,例3.5 见第二章表2-4资料。,为该地区50岁60岁女性高血脂诊断与治疗提供参考依据,,试估计血清
13、甘油三脂含量的95%单侧参考值范围。,即95%单侧参考值范围为小于2.098,mmol/L。,百分位数法和正态分布法比较,一、,百分位数法,1,、适合于任何分布资料,实际中最为常用。,2,、必须有较大的样本含量,否则结果不稳定。,二、,正态分布法,1,、资料必须近似服从正态分布,适用范围较窄。,2,、结果稳定。,小 结,1.描述一组观察值,除需要表示其平均水平外,还要说明它的离散或变异的情况。,2.衡量变异程度大小的指标有多种:极差、四分位数间距、方差、标准差和变异系数。其中应用最多的是标准差和变异系数。,3.,标准差与均数结合能够完整地描述一个正态分布,。对任何参数的正态分布,都可以通过一个
14、简单的变量变换化成标准正态分布。,利用正态分布可以很容易地确定其数值出现在任意指定范围内的概率,。,4.医学参考值范围指“正常,参照人群”,的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。,主要用,作划分正常人与异常人的界线,。,5,.,医学参考值范围的制定,需要按照一定步骤进行,。实际中最好结合正常人和病人的数据分布特点,权衡假阳性和假阴性的比例,选择一个适当的百分范围,,,最常用的百分界限是95%。,6.,参考值范围估计的方法有多种,其中最基本的有百分位数法和正态分布法。,正态法的优点是结果较稳定,但对资料要求严格;,百分位数法,适合于任何分布类型的资料,但要求大样本。,






