1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,一、正态分布的概念和特征,(一)、正态分布的概念和图形,5岁女孩身高的直方图,身高x(cm),频,数,f(x),5岁女孩身高的直方图,身高X(cm),频,数,f(x),正态分布以均数为中心,左右两侧对称,靠近均数两侧的频数较多,而距均数两侧较远处,频数逐渐减少,形成的,钟形,分布。,X,f,(,X,),m,正态分布是应用最广泛的一种连续型分布.,正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.,德莫佛,德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是,正态分布的首次露面.,正态分布,高斯
2、正态分布,(normal distribution)也叫高斯分布(Gaussian distribution),是最常见、最重要的一种连续型分布。,因为医学卫生领域中,有许多变量为连续的随机变量,并呈现正态分布。如,身高、体重,血压。,(二)、正态分布的特征,正态分布曲线的密度函数:,分析三条正态曲线的共同特征:,均数处最高(一个最高点),左右对称(一个对称轴x=,),观察以上三条正态曲线,归纳出正态曲线的性质,曲线在,x,轴的上方,与,x,轴不相交,曲线关于直线 对称,且在 时位于最高点.,当时 ,曲线上升;当时 ,曲线下降并且当,曲线向左、右两边无限延伸时,以,x,轴为渐近线,向它无限靠
3、近,当 一定时,曲线的形状由 确定 越大,曲线越“矮,胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总,体的分布越集中,为正态曲线的位置参数,三条不同和的正态分布曲线,当相同时,正态分布曲线的位置由来决定.,为正态曲线的形态参数,正态分布有两个参数,一个正态分布,可以表示为N(,2,),正态曲线下面的面积分布有一定规律,二、标准正态分布,X,f,(,X,),m,a,标准正态分布(standard normal distribution)的两个参数为:,=0,=1 记为,N,(0,1),一般正态分布为一个分布族,:,N,(,m,s,2,),;标准正态分布只有一个,N,(0,1),;这样简
4、化了便于应用。,曲线下面积,u,-,附表1(P261)就是根据此公式和图形制定的,正态曲线下面积,标准正态曲线下面积分布规律,正态曲线下面积分布规律,标准正态分布的意义,标准正态曲线下面积分布有规律,统计学家将曲线下所有的U值对应的的面积全部计算出来,并做成一个表,叫“标准正态分布表”,供查用。见P,261,附表1。,借助于“标准正态分布表”,任何正态分布都可以进行正态变换,计算出曲线任意两个变量值之间的面积。,例题2.17:已知u,1,=-1.76,u,2,=-0.25,,求标准正态曲线下(-1.76,-0.25)范围内的面积。,解:查附表1,得;,(u,1,)=0.0392,同理,,(u,
5、2,)=0.4013,则(-1.76,-0.25)范围内的面积为 D=,(u2)-,(u1)=0.4013-0.0392=0.3621,例题2.18:已知u,1,=-1.2,u,2,=1.6,,求标准正态曲线下(-1.2,1.6)范围内的面积。,请同学们不看书,自己试做一下。,题目有什么不同,如何解决?,例题2.19:已知120名5岁女孩身高X=110.15,S=5.86,现欲估计该市城区某年身高界于104.0108.0cm范围内的5岁女孩所占比例和人数。,解:第一步,将该分布进行标准正态变换,以样本均数和标准差代替总体均数和标准差,进行U变换。,U1=(104.0-110.15)/5.86=
6、1.05,U2=(108.0-110.15)/5.86=-0.37,第二步,查附表1得,:,(u,1,)=0.1469,(u2)=0.3557,D=0.3557-0.1469=0.2088,f=120,0.2088=25(人),三、正态分布的应用,正态分布是一种重要的分布,它是许多统计处理方法的基础。对于服从正态分布或近似正态分布或对数正态分布的资料,都可以借助于正态分布的规律来解决问题。其在医药卫生领域的应用有以下方面:,(一)估计频数分布,(二)制定医学参考值范围,(三)质量控制,(四)作为许多统计方法的基础,(一)估计频数分布,例题2.20 某项研究显示,某地婴儿出生体重均数为3100
7、g,标准差为300g,试估计该地当年出生低体重儿(,2500g)所占比例。,解:已知婴儿出生体重服从正态分布。记做变量X,则当X,2500时,其对应于标准正态分布的u值为:,查表得:,(-2.00)=0.0228=2.28%,即该地当年低体重出生儿的比例为2.28%,(二)制订医学参考值范围,定义:指包括,绝大多数,正常人的人体形态、功能和代谢等各种生理生化指标的波动范围,也可以看作是常数,又称“正常值”,制订方法有两种:,1、正态分布法:适合正态或近似正态分布的资料,2、百分位数法:适合偏态分布资料,步骤:,1.从“正常人”总体中抽样:明确研究总体,2.统一测定方法以控制系统误差。,3.判断
8、是否需要分组(如性别、年龄)确定。,4.根据专业知识决定单侧还是双侧。,5.确定绝大多数的比例;最常用95%,6.选择适合的计算方法,单侧下限,异常,正常,单侧上限,异常,正常,异常,正常,双侧下限,双侧上限,异常,医学参考值制订,医学参考值制订,1,正态分布法估计参考值范围公式为:,如制定,95,参考值范围,双侧界值,u=1.96,,单侧界值,u=1.645,。,双侧界值:x,1.96s,单侧上界:x,+1.645s,单侧下界:x,-1.645s,医学参考值制订,例,2.21,某地调查正常成年男子,200,人的红细胞数近似正态分布,得均数,5.526,(,10,12,/L,),标准差,s=0
9、38,(,10,12,/L,),试估计该地成年男子红细胞数的,95%,参考值范围。,因红细胞数过多或过少均为异常,故按双侧估计,95%,界值。,下限为:x,-1.96s=5.526-1.96,0.38,=5.452(10,12,/L),上限为:x,+1.96s=5.526+1.96,0.38,=5.600(10,12,/L),故该地成年男子红细胞数的,95%,参考值范围(,5.452,5.600,),10,12,/L,医学参考值制订,例,2.21,某地调查正常成年男子,120,人的第一秒肺通气量,得均数,4.2L,标准差,s=0.7L,,试估计该地成年男子第一秒肺通气量的,95%,参考值范围。,因肺第一秒通气量过低为异常,故按单侧估计,95%,界值。,下限为:x,1.64s=4.2-1.64,0.7,=3.05(L),故该地成年男子第一秒肺通气量的,95%,参考值范围为不低于3.05,L,医学参考值制订,2.百分位数法,用于描述偏态分布资料。,白细胞数的95参考值范围,因为白细胞数无论过高或过低均属异常,则分别计算P2.5和P97.5。这是双侧95参考值范围;,确定尿铅的95%参考值范围,因为尿铅以过高为异常,应计算P95,






