资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,学习要求,掌握内容,正态分布的概念和特征,正态分布的概念和两个参数,正态曲线下面积分布规律,标准正态分布,标准正态分布的概念和标准化变换,正态分布的应用,估计频数分布,制定参考值范围,熟悉内容,标准正态分布表。,了解内容,正态分布进行质量控制,正态分布是利用许多统计方法的基础,1,1.,正态分布,(normal distribution),2,120,名,8,岁男孩身高频数表,组段,频数,112,2,114,7,116,9,118,14,120,15,122,21,124,18,126,15,128,10,130,5,132,3,134,136,1,1.1 正态曲线(normal curve),是高峰位于中央,(,均数所在处,),、两侧逐渐降低且左右对称、不与横轴相交的钟型光滑曲线。,3,习惯上用,N(,2,),表示正态分布。,例如:,X,N,(,120,,,8.2,2,),X,N,(,5,,,3,2,),6,1.4 正态分布的重要性,医学研究中的某些观察指标服从或近似服从正态分布;,很多统计方法是建立在正态分布的基础之上的;,很多其他分布的极限为正态分布。因此,正态分布是统计分析方法的重要基础。,1.5 正态曲线下面积分布规律,曲线下横轴上的总面积为,100%,或,1,。,常用的三个区间:,1.645,之间的曲线下,面积占总面积的,90%,1.96,之间的曲线下,面积占总面积的,95%,2.58,之间的曲线下,面积占总面积的,99%,8,-1.96,95%,+1.96,2.5%,2.5%,正态曲线下的面积分布示意,实际工作中,当样本含量,n,为大样本时(如,50,),可选用如下公式:,(,或,1.96s,、,2.58s),10,2.标准正态分布,变量值,1,变量值,2,变量值,3,均数,标准差,1,2,3,1+2,2+2,3+2,+2,13,23,33,3,3,13+2,23+2,33+2,3 +2,3,x,1,x,2,x,n,ax,1,+b,ax,2,+b,ax,n,+b,a,+b,a,11,N(,2,),最简单的正态分布,N(,0,1,),即,a +b=0,,,a =1,解方程组得:,12,变量值,变量值,变量值,均数,标准差,x,1,x,2,x,n,ax,1,+b,ax,2,+b,ax,n,+b,Z,1,Z,2,Z,n,0,1,13,把正态分布按上式进行变量代换,得到,标准正态分布,。,标准正态分布用,N,(0,1),表示,也称为,Z,分布,。,14,统计学家按标准正态分布的累积概率分布函数,(z),编制了附表,1,,表示从,-,到,z,的曲线下面积。,15,当分布不是标准正态分布,但已知,,,和,x,时,先按式,z=(x-,)/,求得,z,值,再查表求得曲线下某区间的面积。,大样本时,可近似使用以下公式:,16,例:,已知某地,1986,年,120,名,8,岁男孩的身高均数为,124.0cm,,标准差为,4.0cm,。,估计理论上身高在,116cm,以下,者占该地,8,岁男孩总数的百分比。,估计理论上身高在,132cm,以上,者占该地,8,岁男孩总数的百分比。,估计理论上身高在,116-132cm,之间者占该地,8,岁男孩总数的百分比。,17,1.,估计理论上身高在,116cm,以下者占该地,8,岁男孩总数的百分比。,18,2.,估计理论上身高在,132cm,以上者占该地,8,岁男孩总数的百分比。,19,3.正态分布的应用,医学参考值范围,质量控制图,20,3.1 医学参考值范围的定义,也称,医学正常值范围,,是指所谓,“,正常人,”,的解剖、生理、生化等指标的波动范围,“,正常人,”,不是指,“,健康人,”,,而是指排除了影响所研究指标的疾病和有关因素的同质人群。,21,为什么,波动,?,“个体变异”,同一指标的数据因人而异,同一个体的数据随环境、时间等改变而变,22,为什么要确定一个,范围,?,既然同属正常人,就不能以甲的数据为标准,认为乙异常,亦不能以甲此时的数据为标准,认为彼时的异常。所以必须确定一个波动范围。,如,WBC,:,4000,10000,个,/mm,3,23,意 义,横向分析,划界、分类临床医生判断正常与异常的参考依据,动态分析,如某个地区不同时期发汞的正常值可反映环境污染的动态变化或环保效果,3.2 参考值范围确定的原则,选定同质的正常人作为研究对象,控制检测误差,判断是否分组,单、双侧问题,选择百分界值,3.2.1,选定“正常人”作为研究对象,同质,正常,“足够数量”,例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的可靠性。,一般认为每组,100,例以上;有人认为确定临床生化指标的正常值应取,300500,例。,3.2.2 控制检测误差,通过人员培训、控制检测条件、重复测定等措施,严格控制检测误差。,3.2.3 判断是否分组,组间差别是否有统计学意义并有临床意义?,各组的分布范围、高峰位置等是否基本一致?,3.2.4 单、双侧问题,过大或过小均属异常:双侧界值,例:血红蛋白含量,过大异常:单侧上限界值,例:尿铅,过小异常:单侧下限界值,例:肺活量,3.2.5 选择百分界值,参考值范围的涵义:绝大多数的正常人在该范围内,习惯上将“绝大多数”定义为正常人的,80%,、,90%,、,95%,或,99%,。,应根据研究目的、研究指标的性质、数据分布特征等情况综合考虑百分界值的选择。,确定可疑范围,若病人与正常人的数据重叠较多的情况下,为避免较大的假阳性和假阴性错误率,可设定可疑范围。,正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠示意图,3.3 计算方法,33,95,医学参考值范围,正态分布法,百分位数法,相 同,1,、同质人群,2,、,n100,不同,分布类型,正态分布,任何分布类型,指标特点,血红蛋白,(,1.96s,),肺活量,-,1.645s,尿铅,P,5,尿铅,P,95,扩展知识,对数正态分布法,34,3.4 例题,35,例,:,某地调查正常成年男子,200,人的红细胞数得均数,=55.2610,12,g/L,,标准差,S,=0.3810,12,g/L,,试估计该地正常成年男子红细胞数的,95%,参考值范围。,因红细胞数过多或过少均属异常,故取双侧。该地正常成年男子红细胞数的,95%,参考值范围为,:,下限:,=55.26-1.960.38=54.52(g/L),上限:,=55.26+1.960.38=56.00(g/L),3.5 案例讨论,教材,78,页案例,5-1,。求医学参考值范围。,资料样本含量,n50,,为偏态分布,血铅为过高异常,所以应计算单侧上限,P,95,。,36,谢 谢,欢迎提问,
展开阅读全文