1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,离散趋势的统计描述,例3、1 对甲乙2名高血压患者连续观察5天,测得得收缩压分别为:,甲患者(,mmHg,):,162 145 178 142 186,(),乙患者(,mmHg,):,164 160 163 159 166,(),两者收缩压之间得离散程度,第一节,衡量变异程度(或离散程度)得指标,衡量变异程度大小得指标大体可以分为两类,:,
2、按间距计算,:,极差、四分位数间距,按平均距离计算,:,离均差平方与、方差、标准差与变异系数,一、极差与四分位数间距,(一)极差,也称全距,用符号,R,表示。,R=,最大值-最小值,甲乙患者收缩压得极差分别为:,R,甲=186-142=42(,mmHg,),R,乙=166-159=7 (,mmHg,),简单,仅仅利用了两端点得数据值,稳定性差。,(二)四分位数间距,P,25,最大值,最小值,P,75,25%,25%,50%,四分位数间距,把所有得观察值排序后,分成四个数目相等得段落,每个段落得观察值数目各占总例数得25%,取中间50%观察值得数据范围。用符号,Q,表示,Q=P,75,-P,25
3、例题:50-60岁正常女性血清甘油三酯含量得四分位数(教材15页)。,Q=135、7-63、2=72、5(mg/dl),常用于描述偏态分布资料得离散程度。,二、离均差平方与、方差、标准差与变异系数,(一)平均偏差,间接反映平均偏差,表示离散程度。,(二)离均差平方与(,sum of squre,SS,),反映一组数据得离散水平,平均每例变异得大小。,总体,样本,分母为,n-1,(三)方差(,mean of squre,MS,),总体标准差,样本标准差用,S,表示,其度量单位与均数一致,所以,最常用,。,(四)标准差(,standard deviation,SD,或,S,),大家学习辛苦了
4、还是要坚持,继续保持安静,标准差得公式还可以写成:,利用,频数表,计算标准差得公式为:,f=n,对于例3、1(见教材18页),说明甲患者血压波动比乙患者血压波动大。,红细胞数(,10,12,/L),组中值,频数(,f),),fx,fx,2,3、8,3、90,2,7、80,30、42,4、00,4、10,6,24、60,100、86,4、20,4、30,11,47、30,203、39,4、40,4、50,25,112、50,506、25,4、60,4、70,32,150、40,706、88,4、80,4、90,27,132、30,648、27,5、00,5、10,17,86、70,442、17
5、5、20,5、30,13,68、90,365、17,5、40,5、50,4,22、00,121、00,5、60,5、70,2,11、40,64、98,5、8,6、00,5、90,1,5、90,34、81,合计,140,669、80,3224、20,140名正常成年男子红细胞计数得标准差计算表,标准差得意义与用途,意义:,说明资料得离散趋势(或变异程度),标准差得值越小,说明变异程度越小,均数得代表性越好。,用途:,用于计算变异系数,用于计算标准误,结合均值与正态分布得规律,估计参考值得范围。,标准差与原始数据得单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料得集中趋势与离散趋势
6、五)变异系数(,coefficient variation,CV,),主要用于,度量单位不同,得变量间,或,均数差别较大,得变量间变异程度得比较。,CV,实际上就是标准差得另一种表示方式,即将标准差转化为均数得倍数,以百分数得形式表示。,例3、3 测得某地成年人舒张压得均数为77、5,mmHg,标准差为10、7,mmHg,;收缩压得均数为122、9,mmHg,标准差为,17、1mmHg,。试比较舒张压与收缩压得变异程度。,可见两种指标得变异度几乎没有什么差别。,1985,年通过十省调查得知,农村刚满周岁得女童体重均数为,8、42kg,标准差为,0、98kg,;身高均数为,72、4cm,标
7、准差为,3、0cm,。试比较身体与体重得变异情况?,思考题:,变异指标小结,1、,极差较粗,适合于任何分布;,2、,标准差与均数得单位相同,最常用,适合于近似正态分布;,3、,四分位数间距用于各类型分布得资料,但更适合偏态分布资料;,4、,变异系数主要用于,单位不同,或,均数相差悬殊,资料。,平均指标与变异指标分别反映资料得不同特征,常配套使用,正态分布:均数、标准差;,偏态分布:中位数、四分位数间距。,第二节 正态分布及应用,正态曲线:就是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交得钟型曲线。,由曲线所描述得分布称为正态分布。,该曲线得函数表达式,f(x),称为正态分
8、布密度函数。,习惯上用,N,(,2,)表示均数为,标准差为得正态分布。,一、正态分布,1、,参 数:就是反映总体特征得统计指标,如总体均数,、总体率,等。,2、,统计量:就是指与总体参数相对应,通过样本计算得统计指标,如样本均数 ,样本率,P,等等。,(一)基本概念,多数情况下,总体得参数就是不易知道得,但可通过随机抽取有代表性得样本,用算得得样本统计量估计未知得总体参数。,总体参数就是固定得常数,统计量就是在总体参数附近波动得随机变量。,总体,样本,抽取部分观察单位,统计量,参 数,(二)主要特征:,1、正态分布以均值,为中心,左右对称。,2、正态分布中,曲线下面积集中在以均值,为中心得中心
9、部分,越远离中心,曲线越接近,X,轴,曲线下面积越小,超过一定范围以外得面积可以忽略。,3、正态分布曲线下得面积分布有一定得规律。,累积面积可通过对概率密度函数,f,(,X,),积分求得,(累积)分布函数:,曲线下得面积有以下规律:,曲线下横轴上得总面积为100%或1;,包含得面积为68、3%;,1、96,包含得面积为95%;,2、58,包含得面积为99%。,正态曲线面积分布示意图,4、正态分布曲线完全由参数,与,决定。,就是位置参数,决定分布曲线在横轴得偏移位置。,就是变异参数,决定分布曲线得形态。,方差相等、均数不等得正态分布图示,3,1,2,均数相等、方差不等得正态分布图示,2,1,3,
10、二、标准正态分布,(,standard normal distribution),习惯上用,N,(,2,)表示正态分布,那么标准正态分布可以表示为,N,(,0,1,2,)。,均数为0、标准差为1得正态分布。,标准正态分布(累积)分布函数为:,为了方便,统计学家编制了标准正态分布曲线下面积分布表,通过查表可以得到,u,值左侧得面积。(见附表1),u,-,标准正态分布曲线下面积,(u),u,0、00 0、02 0、04 0、06 0、08,-3、00、0013 0、0013 0、0012 0、0011 0、0010,-2、50、0062 0、0059 0、0055 0、0052 0、0049,-2
11、00、0228 0、0217 0、0207 0、0197 0、0188,-1、90、0287 0、0274 0、0262 0、0250 0、0239,-1、60、0548 0、0526 0、0505 0、0485 0、0465,-1、00、1587 0、1539 0、1492 0、1446 0、1401,-0、50、3085 0、3015 0、2946 0、2877 0、2810,00、5000 0、4920 0、4840 0、4761 0、4681,0,u,对于任何参数,与,得正态分布,都可以通过一个简单得变量变换化成标准正态分布,即:,X,1,u,1,例题:成年男子得红细胞数近似服从正态
12、分布,均数为,4、78,标准差为,0、38,。若需要求出在4-5、5范围内所占得比例。(教材24页),可以通过下面简单计算获得:,三、正态分布得应用,1、估计频数分布,2、制定医学参考值范围,3、质量控制,正常情况下,测量误差服从正态分布。所以,一般以,X2S,作为上、下警戒值,以,X3S,作为上下控制值。,4、多种统计方法得理论基础,2,分布、,t,分布与,F,分布都就是在正态分布得基础上推倒出来得,t,分布、二项分布与,Poisson,分布得极限形式均为正态分布。,第三节 医学参考值范围,医学参考值范围:指正常人体得解剖、生理、生化、免疫及组织代谢产物得含量等各种数据得波动范围。,由于存在
13、生物个体变异,因此同属正常人也不能以某一个测量数据作为标准,而必须确定一个波动范围,但不就是“金标准”。,使用参考值得目得:一基于临床实践,二基于预防医学实践,一、医学参考值范围得概念,二、医学参考值范围得制定方法,(一)选择足够数量得正常人作为参照样本,“正常人”,得健康水平应有明确得界定,所谓正常不就是指机体任何器官、组织得形态与功能都正常得人,而就是指符合特定健康水平得人。,例如:研究某市成人血铅得参考值范围,就是以留住该市一年以上、无明显肝肾疾病,无铅作业或接触史得成人作为被研究得正常人总体。,参照样本含量得确定没有统一得规则,一般认为至少应在120例以上。,(二)对选定得正常人进行标
14、准得测定,严格控制检测误差;必须对测量条件做出统一得规定与说明。,(三)决定取单侧范围还就是双侧范围值,单侧下限,异常,正常,单侧上限,异常,正常,异常,正常,双侧下限,双侧上限,异常,单侧下限-过低异常 单侧上限-过高异常 双侧-过高、过低均异常,如肺活量,如尿铅值,如体重,(四)选择适当得百分范围,最常用得百分界限就是95%,也可以选80%、90%、99%等。,正常人,病人,假阳性率,假阴性率,正常人与病人得数据分布重叠示意图,正常人,病人,假阳性率,假阴性率,正常人与病人得数据分布重叠示意图,(五)估计参考值范围得界限,方法:正态分布法与百分位数法,1、正态分布法,适用于正态或近似正态分
15、布得资料。,2、百分位数法,适用于任何分布型得资料,特别就是适用于偏态分布得资料。,常用参考值范围,正态分布法 百分位数法,概率,(%)双侧 单侧 双侧 单侧,下限 上限 下限 上限,90,X1.64S X-1.28S X+1.28S P,5,P,95,P,10,P,90,95,X1.96S X-1.65S X+1.65S P,2,.,5,P,97.5,P,5,P,95,99,X2.59S X-2.33S X+2.33S P,0.5,P,99.5,P,1,P,99,例3、4 若以算得某地正常成年男子红细胞数得均数为4、7810,12,/,L,标准差为0、38 10,12,/,L,试估计该地成年男子红细胞数得95%参考值范围。,分析:资料近似服从正态分布,选择正态分布法,红细胞数过多过少均为异常,双侧参考值范围,下限:,X-1、96S=4、78-1、96,0、38=4、04(1012/,L,),上限:,X+1、96S=4、78+1、96,0、38=5、52,(1012/L),即该地区成年男子红细胞数得95%参考值范围为:,4、04 5、52(10,12,/,L,),






