1、第一讲 医学统计学的一些基本知识,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,正态分布,正态分布的通俗概念:,如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。,正态分布的概念,下面我们以第一节某地,13,岁女孩,118,人的身高,(,cm),资料,来
2、说明身高变量服从正态分布。,频数分布表:,频数分布图一,(,又称直方图),从频数表及频数分布图上可得知:,该数值变量资料频数分布呈现中间频数多,左右两侧基本对称的分布。所以我们通俗地认为该资料服从正态分布。,频数分布图二,频数分布图三,正态分布图四,正态分布的数理统计学概念:,如果随机变量(,X,),的概率密度函数为:,-,x,+,则该随机变量服从正态分布。,式中,为总体标准差;,为总体均数;,为圆周率,即3.14159;,e,为自然对数的底,即2.71828。,若某一随机变量的概率密度函数(频率曲线方程)为上式,则称该变量,X,服从参数为,和,的正态分布,记为:,X,N,(,2,)。,函数方
3、程中,为位置参数,,为形状参数。,在,不变的情况下,函数曲线形状不变,若,变大时,曲线位置向右移;若,变小时,曲线位置向左移。,在,不变的情况下,函数曲线位置不变,若,变大时,曲线形状变的越来越“胖”和“矮”;若,变小时,曲线形状变的越来越“瘦”和“高”。,若某一随机变量,X,,,其总体均数,=0,总体标准差,=1,,,即,X,N(0,1),则称变量,X,服从标准正态分布。习惯把服从标准正态分布的变量用字母,U,或,Z,表示,此时,我们把,U,或,Z,称为标准正态变量。,标准正态分布是正态分布中的一个典型分布,数理统计上证明:对一服从正态分布的随机变量,(,X,),,,若进行特定的变量变换,可
4、将任何一服从正态分布的随机变量,(,X,),转变成服从标准正态分布的随机变量,(,U,或,Z,),,,这种变量变换过程称为变量的标准化,也称为,U,或,Z,变换。,式中符号意义如前述。,正态分布的特征及其面积规律,正态分布曲线位于横轴上方,呈钟形。,正态分布曲线以均数所在处最高,且以均数为中心左右对称,。,正态分布曲线由两个参数决定,即总体均数,和总体标准差,。,在,不变的情况下,函数曲线形状不变,若,变大时,曲线位置向右移;若变小时,曲线位置向左移,故称,为位置参数。在,不变的情况下,函数曲线位置不变,若,变大时,曲线形状变的越来越“胖”和“矮”;若,变小时,曲线形状变的越来越“瘦”和“高”
5、故称,为形态参数或变异度参数。,N,(,,0.5,2,),、,N,(,,1,2,),、,N,(,,2,2,),N,(,1,,,2,)、N,(,2,,,2,),正态曲线下面积分布有一定的规律性。,对于服从正态分布的随机变量(,X,),,随机变量值出现在某一区间(,x,1,x,2,),的概率与正态分布概率密度曲线与横轴在该区间所围成的区域的面积大小相对应(相等)。,正态分布概率密度曲线与横轴围成的区域的总面积恒等于1。,正态分布概率密度曲线下横轴上一定区间的面积可应用数学知识求出。,在实际应用中,由于所有正态分布都可以通过变量变换转变为标准正态分,为了省去积分计算不同正态分布曲线下横轴上一定区间
6、面积的繁琐过程,所以数理统计学家专门编制了标准正态分布曲线下横轴上一定区间面积分布表,供查表求标准正态分布曲线下一定区间面积。,标准正态分布,标准正态分布曲线下对称于,0,的区间,面积相等,各占,50%,,即左右各为,0.5,。,标准正态分布曲线的纵坐标与面积关系图,即纵坐标从移到,u,所对应区域的面积为上图红色区域面积的大小,这样一个区域的面积我们用,(,u,),表示,可通过查标准正态分布曲线面积分布表得到,(,u,),的大小。,u,值查表所对应的面积是区间(-,,u,),所对应的面积,即,(,u,)。,若,u=-1.96,,那么,(-1.96),则表示从移到,1.96所对应区域的面积,通过
7、查标准正态分布曲线面积分布表得到,(-1.96)=0.025。,u,u,指单侧,U,界值,也称随机变量,U,的上侧,分位数。其意义为:从到+这一侧的面积为,也即在随机变量,U,的所有取值中,有100,的值比大,有100(1-,),的值比小。,u,/2,当有一随机变量,X,服从正态分布,N(,,2,),,,若要求某一区间,(,x,1,x,2,),的曲线与横轴围成的面积时,无须运用积分学知识求从,x,1,移到,x,2,所对应区域的面积大小来得到这一区间所对应的面积。此时,我们可以通过变量变换,把,X,转变成,u,,即把一般的正态分布变换为标准正态分布,通过求标准正态分布区间,(,u,1,u,2,),所对应的面积来间接求得一般正态分布区间,(,x,1,x,2,),所对应的面积。,当随机变量的参数,和,未知时,若来自该总体的样本含量,n,很大时,可分别用样本均数和样本标准差作为,和,的估计值来计算,u,值。,正态分布的应用,