收藏 分销(赏)

第四节正态分布及标准误.pptx

上传人:天**** 文档编号:4338182 上传时间:2024-09-07 格式:PPTX 页数:47 大小:642.27KB
下载 相关 举报
第四节正态分布及标准误.pptx_第1页
第1页 / 共47页
第四节正态分布及标准误.pptx_第2页
第2页 / 共47页
第四节正态分布及标准误.pptx_第3页
第3页 / 共47页
第四节正态分布及标准误.pptx_第4页
第4页 / 共47页
第四节正态分布及标准误.pptx_第5页
第5页 / 共47页
点击查看更多>>
资源描述

1、本次课要点:本次课要点:l1、熟悉正态分布、标准正态分布的概念;掌握其主要特征及其应用;l2、掌握医学参考值的概念及其范围的制定方法。l3、了解均数标准误的意义及计算l4、掌握总体均数可信区间的概念及计算方法第四节 正态分布(normal distribution)一、正态分布的概念一、正态分布的概念 1.图形图形正态分布正态分布u=(X-)/标准正态分布标准正态分布 高峰位于中央(均数所在处)、两侧逐渐降低且左右对称、不与横轴高峰位于中央(均数所在处)、两侧逐渐降低且左右对称、不与横轴相交的光滑曲线。正态分布是一种重要的连续型分布。相交的光滑曲线。正态分布是一种重要的连续型分布。正态曲线(正

2、态曲线(normal curve)在横轴上方均数处最高;)在横轴上方均数处最高;正态分布以均数为中心,左右对称;正态分布以均数为中心,左右对称;正态分布有两个参数,即均数正态分布有两个参数,即均数 与标准差与标准差,常用,常用N(,)表表示示,用用N(0,1)表表示示标标准准正正态态分分布布。其其位位置置与与均均数数有有关关,形形状状与与标标准准差差有有关关。标标准准差差大大,离离散散程程度度大大,正正态态分布曲线则分布曲线则“胖胖”,反之,则,反之,则“瘦瘦”;正态分布的面积分布有一定的规律性正态分布的面积分布有一定的规律性。二二 正态分布分布曲线的特征三三 正态曲线下面积的分布规律正态曲线

3、下面积的分布规律统计学家求出了标准正态分布从统计学家求出了标准正态分布从-到(到(-u)的面积。)的面积。实际工作中经常要用的面积分布规律有以下三点:实际工作中经常要用的面积分布规律有以下三点:三三 正态曲线下面积的分布规律正态曲线下面积的分布规律正态曲线下的面积规律正态曲线下的面积规律-1.96+1.962.5%2.5%95%正态曲线下的面积规律正态曲线下的面积规律-1.64+1.645%5%90%正态曲线下的面积规律正态曲线下的面积规律-2.58+2.580.5%0.5%99%三、正态分布的应用1.1.估计参考值范围;估计参考值范围;2.2.估计总体参数的可信区间;估计总体参数的可信区间;

4、3.3.差异显著性检验;差异显著性检验;4.4.质量控制。质量控制。1、估计频数分布、估计频数分布l出生体重低于2500g为低体重儿,某市婴儿出生体重均数3200g,标准差为s=350g。设该资料服从正态分布,试求该地低体重儿占该地所有出生婴儿的比例。计算:计算:首先计算标准离差:查标准正态分布表:(-2)=0.0228结果:估计低体重儿的比例为2.28%.参考值范围参考值范围(reference interval)l参考值范围又称正常值范围(normal range)。l什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。l确定参考值范围的意义:用

5、于判断正常与异常。l“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。参考值范围确定的原则参考值范围确定的原则l选定足够例数的同质的正常人作为研究对象 l控制检测误差l判断是否分组(性别,年龄组)l单、双侧问题 l选择百分界值(90%,95%)l确定可疑范围参考值范围的估计方法:正态分布法参考值范围的估计方法:正态分布法2.5%2.5%95%-1.96+1.96参考值范围的估计方法:百分位数法参考值范围的估计方法:百分位数法P2.5P97.595%参考值范围的估计方法参考值范围的估计方法方法双侧 单侧下限单侧上限正态分布法百分位数法 P2.5P97.5 P5 P95例:参考

6、值范围的计算例:参考值范围的计算l某地调查了200名成年女子的平均血清总蛋白为73.5(g/L),标准差3.9(g/L),试估计该地成年女子血清总蛋白95的参考值范围。由得95参考值范围:下限:1.96s=73.51.963.9=65.9(g/L)上限:1.96s=73.51.963.9=81.1(g/L)此可作为判断该地区成年女子血清总蛋白含量正常与否的参考值。单侧与双侧参考值范围单侧与双侧参考值范围l根据医学专业知识确定!双侧:白细胞计数,血清总胆固醇,单侧:上限:转氨酶,尿铅,发汞 下限:肺活量,IQ,第五节 均数的抽样误差及应用一、概念一、概念1.1.误差:实测值与真值之差。误差:实测

7、值与真值之差。(1 1)系统误差:在收集资料过程中产生的误差,值恒定不变,)系统误差:在收集资料过程中产生的误差,值恒定不变,遵循一定的规律变化。遵循一定的规律变化。(2 2)随机误差:一类不恒定、随机、变化的误差。如抽样)随机误差:一类不恒定、随机、变化的误差。如抽样误差。误差。2.2.抽样:从总体中获得有代表性样本的过程。抽样:从总体中获得有代表性样本的过程。3.均数的抽样误差:均数的抽样误差:由抽样而造成的样本均数与总体均数的由抽样而造成的样本均数与总体均数的差异或各样本均数的差异。差异或各样本均数的差异。抽样误差的定义抽样误差的定义l假如事先知道某地七岁男童的平均身高为119.41cm

8、。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。119.41cm=4.38cm抽样误差的定义抽样误差的定义l三次抽样得到了不同的结果,原因何在?个体变异随机抽样不同男童的身高不同每次抽到的人几乎不同抽样误差【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差。各种参数都有抽样误差,这里我们以均数为研究对象抽样误差的定义抽样误差的定义:总体标准差总体标准差 n:样本含量:样本含量S S:样本标准差样本标准差 计算公式计算公式反映均数抽样误差大小的指标。样本均数的反映均数抽样误差大小的指标。样本均数的标

9、准差。标准差。标准误越小,说明样本均数与总体标准误越小,说明样本均数与总体均数越接近,样本均数的代表性越好均数越接近,样本均数的代表性越好意义意义二、标准误二、标准误例:对某地成年男性红细胞数的抽样调查中,随例:对某地成年男性红细胞数的抽样调查中,随机抽取了机抽取了100名成年男性,调查得到其均数是名成年男性,调查得到其均数是5.38 /L,标准差为,标准差为0.44 /L,求其标准误。,求其标准误。依题意,依题意,n=100n=100;s=0.4410s=0.44101212/L/L。计算得到标准误为计算得到标准误为:例题:例题:(10101212/L/L)标准误的意义标准误的意义l反映了样

10、本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。l标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。l标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。样本均数的抽样分布规律样本均数的抽样分布规律l中心极限定理u从均数为,标准差为的正态总体中随机抽样,样本均数服从均数为,标准差为 的正态分布。u从均数为,标准差为的任意总体中随机抽样,当样本含量足够大时,样本均数近似服从均数为,标准差为 的正态分

11、布。t分布的演化分布的演化l根据中心极限定理的内容,当样本含量足够大时,对从均数为,标准差为的任意总体中随机抽样所得的样本均数进行标准化变换,有t分布的演化分布的演化l由于总体标准差往往是未知的,此时往往用样本标准差代替总体标准差,这里,为自由度,取值为n-1l由W.S.Gosset提出t分布的图形分布的图形自由度分别为1、5、时的 t 分布t分布的性质分布的性质lt分布为一簇单峰分布曲线,高峰在0的位置上,说明从正态总体中随机抽样所得样本计算出的t值接近0的可能性较大。lt分布以0为中心,左右对称。l分布的高峰位置比 u 分布低,尾部高。lt分布与自由度有关,自由度越小,t分布的峰越低,而两

12、侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。l每一自由度下的t分布曲线都有其自身分布规律。t界值表。t t界值表界值表单侧:P(t=t,)=双侧:P(t=t,)=即:P(-t,t t,)=1-例 查t界值表得t值表达式 t 0.05,10=2.228 (双侧)t 0.05,10=1.812 (单侧)-tt0统计推断统计推断l所谓统计推断(statistical inference),是指如何抽样,以及如何用样本性质推断总体特征。参数估计(parameter estimation)l点估计l区间估计假设检验(hypothesis te

13、sting)参数估计之一:点估计参数估计之一:点估计l用样本统计量作为总体参数的估计 例如:用样本均数作为总体均数的一个估计点估计的缺陷点估计的缺陷区间估计区间估计l可信区间的定义l总体均数之可信区间的求解l可信区间的要素l正确理解可信区间的含义区间估计区间估计【例4.1】随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,估计正常成年男子脉搏总体均数。区间估计的实质区间估计的实质l假设某个总体的均数为,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含。即P(AB)=0.95可信区间的定义可信区间的定义l按一定的概率或可

14、信度(1-)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-)称为可信度或者置信度(confidence level),常取95%或99%。l可信区间(CL,CU)是一开区间 CL、CU 称为可信限均数的均数的(1-)100%可信区间可信区间-t/2,v 0 t/2,v 1-/2/2均数的均数的95%可信区间可信区间l样本含量不是很大时,l样本含量较大时,t分布逼近u分布例:例:【例4.1】随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男

15、子脉搏总体均数95%的可信区间。【例4.2】某市2001年120名7岁男童的身高=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。可信区间的两个要素可信区间的两个要素l可信度(Confidence):准确性,可靠性,即1-。一般取90%,95,可人为控制l精确性(Precision):区间的大小,越小越好。l必须二者兼顾95%可信区间的含义可信区间的含义-2 -1 0 1 2 按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。下列说法正确吗?下列说法正确吗?算得某95%的可信区间,则:总体参数有95%的可能落在该区间。有95%的总体参数在该区间内。该区间包含95%的总体参数。该区间有95%的可能包含总体参数。该区间包含总体参数,可信度为95%。概念辨析概念辨析l标准差标准误l个体变异 抽样误差l参考值范围 可信区间l变量分布 抽样分布作业:作业:l简述标准差和标准误的区别和联系l简述参考值范围与均数的可信区间的区别和联系谢谢 再见

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服