1、单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,正态分布,重要的概率分布,统计分析方法的基础。,医学研究中的多数观察指标服从或近似服从正态分布;,很多统计方法建立在正态分布的基础之上;,很多其他分布的极限为正态分布。,一、正态分布的概念和图形,(,a,),(,b,),(,c,),(,d,),正态分布的概率密度函数为:,(-,X,+),式中,有,4,个常数,,为总体均数,,为总体标准差,,为圆周率,,e,为自然对数的底,其中,,,为不确定的常数,,,,e,为固定常数,仅,X,为变量,代表图形上横轴的数值,,f,(,X,),为纵轴数值。当给定,和,,就可绘
2、制出一条正态分布曲线。正态分布曲线是一簇曲线。,特征一 正态分布是一单峰分布,高峰位置在均数,X,=,处。,特征二 正态分布以均数为中心,左右完全对称。,特征三 正态分布取决于两个参数,即均数,和标准差,。,为位置参数,,变大,则曲线沿横轴向右移动;,变小,曲线沿横轴向左移动。,为形态参数,表示数据的离散程度,若,小,则曲线形态“瘦高”;,大,则曲线形态“矮胖”。,特征四,有些指标不服从正态分布,但通过适当变换后服从正态分布,如对数正态分布。,特征五 正态分布曲线下的面积分布是有规律的。,用,F,(,X,),代表横轴自,-,到,X,间曲线下面积,即下侧累计面积,(,概率,),。,曲线下(,X,
3、1,,,X,2,)两个数值之间的面积则可以用 与 的差值求得:,无论,,,取什么值,正态分布密度曲线下的面积分布有以下几个规律:,正态密度函数曲线与横轴间的面积恒等于,1,或,100%,;,正态分布是对称分布。其对称轴为直线,X,=,,,X,与,X,0,的范围面积,利用正态分布的对称性,通过,(,u,),=1-,(-,u,),来求曲线下的面积。,注意点一,例、已知,u,1,=-1.20,,,u,2,=1.60,,求标准正态曲线下(,-1.20,,,1.60,)范围内的面积。,查附表,1,,得(,-,,,-1.20,)范围内的面积为,0.1151,,(,-,,,-1.60,)范围内的面积为,0.
4、0548,,,利用正态分布的对称性,求,(,1.60,)=1-,(-1.60),则(,-,,,1.60,)范围内面积为,1-0.0548=0.9452,。,(,-1.20,,,1.60,)范围内的面积,D=0.9452-0.1151=0.8301,。,注意点二,对于非标准正态分布,求曲线下任意(,X,1,,,X,2,)范围内的面积,可先作标准化变换,再借助标准正态分布表求得。,例、某市,120,名,12,岁男童身高的例子中已求得均数为,143.05cm,,标准差,s=5.82cm,。设该资料服从正态分布,试求,该地,12,岁男童身高在,132cm,以下者占该地,12,岁男童总数的比例,,分别求
5、1s,、,1.96s,和,2.58s,范围内,12,岁男童占该组儿童总数的实际百分数,并与理论百分数比较。,计算,u,=,(,132.0-143.05,),/5.82=-1.90,查表得,,(,u,)=,(,-1.90,)=0.0287,身高范围,(cm),实际分布,理论分布,(%),人数,百分数,(,),1.00,s,137.23,148.87,87,72.50,68.27,1.96,s,131.64,154.46,114,95.00,95.00,2.58,s,128.03,158.07,118,98.33,99.00,四、正态分布的应用,医疗卫生领域中有很多的指标是服从或近似服从正态分布
6、如:同性别同年龄正常儿童的身高、体重,同性别健康成人的红细胞数以及实验中的随机误差等一般都服从正态分布。,有一些指标不服从正态分布,但经过变量变换后,能近似服从正态分布。,如:对数正态分布,(一)估计频率分布,例、若由某项研究得某地婴儿出生体重为,3100g,,标准差为,300g,,试估计该地区当年出生低体重儿(出生体重,2500g,)所占比例。,认为当年该地区婴儿出生体重近似服从正态分布,N,(,3100,300,2,),作标准化变换:,查附表,1,,得,(-2.00)=0.0228,得出结论,估计该地区当年出生低体重儿所占比例为,2.28%,。,例、已知某地健康成年男子的红细胞计数是以
7、5.0010,12,/L,,,=0.2510,12,/L,的正态分布,试问红细胞计数在,4.5010,12,/L,至,5.2010,12,/L,之间,占该地健康成年男子的百分之几?,将变量值标准正态转换为,u,。,当,x=4.50,时,,u,1,=,(,4.50-5.00,),/0.25=-2.00,当,x=5.20,时,,u,2,=,(,5.20-5.00,),/0.25=0.80,查附表,1,标准正态曲线下面积得,(u,1,)=(-2.00)=0.0228,(u,2,)=1-(-0.80)=0.7881,D=(u,2,)-(u,1,)=0.7881-0.0228=0.7653,所以,该
8、地健康成年男子中,估计有,76.53%,的人红细胞数在(,4.505.20,),10,12,/L,范围内。,(二)医学参考值范围的确定,医学参考值(,reference value,)是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数。也称正常值(,normal value,)。,由于个体差异的存在,因此需要确定绝大多数正常人各种指标一定的波动范围,这个范围就叫做参考值范围,(reference interval),又称正常值范围,(normal range),。,1,、参考值范围确定的注意点,“正常人”的概念,样本数据大小的问题,检测误差的问题,判断是否分组,单、双侧的
9、问题,“绝大多数”的含义,是否需要确定可疑范围,变量转换的问题,不管将正常界值定在什么位置,都可能出现假阳性或假阴性,产生这两种误判的根本原因是正常人的分布与病人的分布有重叠。,正常人,病人,假阳性,假阴性,正常人与病人的数据分布重叠示意图,2,、参考值范围的估计方法,方法一、正态分布法,双侧,单侧,(,高侧,),(,低侧,),某些偏态资料经过数据转换后服从正态分布,也可按正态分布规律处理。,对于一个指标,随机抽取一个样本含量足够大的样本(一般认为应大于,100,例),可按下表利用正态分布法制定参考值范围。,例、某地调查正常成年男子,200,人的红细胞数得均数,=55.2610,12,/L,,
10、标准差,S,=0.3810,12,/L,,试估计该地区正常成年男子红细胞数的,95%,参考值范围。,红细胞数过多或过少均为异常,故取双侧。该地区正常成年男子红细胞数的,95%,参考值范围为:,下限:,上限:,例、某地调查了,360,名成年男子的平均血红蛋白,=13.45(g/100ml),,标准差,s,=0.71(g/100 ml),,试估计该地成年男子血红蛋白,95,的参考值范围。,根据前表得,95,参考值范围:,下限:,1.96s=13.45,1.960.71,=12.06(g/100ml),上限:,1.96s=13.45,1.960.71,=14.84(g/100ml),例、某地调查,120,名健康成年男子的第,1,秒肺通气量得均数,=4.2L,,标准差,S,=0.7L,,试估计该地区健康成年男子的第,1,秒肺通气量的,95,参考值范围。,解题,由于第,1,秒肺通气量仅过低属于异常,故取单侧下限。该地区健康成年男子的第,1,秒肺通气量的,95,参考值范围为:,下限:,方法二、百分位数法,双侧,P,2.5,P,97.5,单侧,(,低侧,),P,5,;,(,高侧,),P,95,方法三、对数正态分布法,x,=ln,X,,经变换后的,x,分布服从正态分布。按正态分布法算出,x,值的参考值范围,再计算反对数,即得所求。,谢谢!,






