收藏 分销(赏)

第5章-常用概率分布.ppt

上传人:仙人****88 文档编号:13322766 上传时间:2026-03-01 格式:PPT 页数:61 大小:2.01MB 下载积分:10 金币
下载 相关 举报
第5章-常用概率分布.ppt_第1页
第1页 / 共61页
第5章-常用概率分布.ppt_第2页
第2页 / 共61页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,5,章 常用概率分布,二项分布,二项分布的概念与特征,一个袋子里有,5,个乒乓球,其中,2,个黄球,,3,个白球,我们进行摸球游戏,,每一次摸到黄球的概率是,0.4,,摸到白球的概率是,0.6,,这个实验有三个特点:一是各次摸球是彼此独立的;二是每次摸球只有二种可能的结果,或黄球或白球;三是每次摸到黄球(或摸到白球)的概率是固定的。具备这三点,,n,次中有,X,次摸到黄球(或白球)的概率分布就是二项分布。,二项分布涉及许多预备知识,归纳起来有以下四个方面。,1,、,二项分布适用于两种互斥结果的事件,称为,二项分类变量。,2,、二项式定理,:,(a+b),n,C,n,0,a,0,b,n,+C,n,1,a,1,b,n-1,+,+,C,n,k,a,k,b,n-k,+,C,n,n,a,n,b,o,二项式,(a,十,b),n,的展开式共,n,十,1,项,C,n,k,是组合数,,C,n,k,=n!/k!(n-k)!,任一项,a,、,b,的指数之和等于,n,通式为,C,n,k,a,k,b,n-k,3,、,二项分布资料,的统计推断也包括,参数估,计和假设检验,这两个方面的内容。,4,、假设检验的内容很多(如,t,检验、,F,检验、,u,检验、,2,检验等),这些检验是通过,检验统计量,t,、,F,、,u,、,2,等,才能确定概,率,P,值。换句话说,假设检验的概率,P,是,间接确定的。,二项分布的某些假设检验,是直接计算概率,P,值。,注意间接和直接确,定,P,值方法的区别。,二项分布,例,5-1,用针灸治疗头痛,假定结果不是有效就是无效,每一例有效的概率为,,。,某医生用此方法治疗头痛患者,5,例,,3,例有效的概率是多少?,因为每例有效的概率相同,且各例的治疗结果彼此独立,,5,例患者中可以是其中的任意,3,例有效,二项分布,医学研究中很多现象观察结果是以两分类变量来表示的,如阳性与阴性、治愈与未愈、生存与死亡等等。如果每个观察对象阳性结果的发生概率均为,,阴性结果的发生概率均为(,1,);而且各个观察对象的结果是相互独立的,那么,重复观察,n,个人,发生阳性结果的次,人,数,X,的概率分布为二项分布,记作,B,(,X,;,n,,,)。,二项分布的概念,1,、二项分布:,是在总体阳性率,已知的两分类资料中,,n,例观察对象的观察结果相互独立,出现阳性数为,k,的概率可以由二项式,十,(1),n,求得,这些概率的集合称为二项分布。,(1),二分类资料是定性资料之一,在医学中常见,如检查结果阳、阴性;人的性别、生存或死亡等。,二分类资料的观察结果相互对立或互斥,非阳则阴,非生存则死亡。其总体阳性率,已知,总体阴性率,1,也是已知的,因总体阳性率,已知,意味着每个观察对象出现的阳性结果具有等概性。,已知,且样本例数,n,也已知,,n,可看成重复实验的次数,样本例数和重复次数就统计学本质而言是一致的。,已知,n,和,是二项分布应用的先决条件,否则,不能进行统计推断。,(2),观察对象的结果互相独立。任一观察对象的结果出现阳性不受其它观察对象是阳性或阴性结果的影响。因此,,二项分布不适用于传染病、遗传性和有家庭聚集性疾病的研究。,(3),出现阳性数为,k,的概率,由二项式展开后可得:,十,(1,一,),n,C,n,0,0,(1,一,),n,十,C,n,1,(1,一,),n-1,十,十,C,n,k,k,(1,),n-k,十,+C,n,n,n,(1-,),0,=1,阳性数恰为,k,的概率,等于:,C,n,k,k,(1),n-k,;,表达为:,P(x,k),C,n,k,k,(1),n-k,二项分布,二项分布的概率函数,P,(,X,),可用公式(,4-1,)来计算。,二项分布,例,5-2,临床上用针灸治疗某型头痛,有效,的概,率为,60%,,现以该法治疗,3,例,其中两例有效的概率是多大?,二项分布,表,5-1,治疗,3,例可能的有效例数及其概率,有效人数,(x),x,(1,),n-x,出现该结果概率,P,(,x,),0,1,0.6,0,=1,0.4,0.4,0.4,0.064,1,3,0.6,0.4,0.4,0.288,2,3,0.6,0.6,0.4,0.432,3,1,0.6,0.6,0.6,0.4,0,0.216,二项分布,由表,5-1,可知,各种可能结果出现的概率合计为,1,,即,P,(,X,)=1,(,X,=0,1,n,)。,因此,如果欲求,1,例以上有效的概率可以,是,P,(x1)=,P,(1)+,P,(2)+,P,(3)=0.288+0.432+0.216,=1,P,(,0,),=1,0.064,=0.936,也可以是,P,(x1)=1,P,(0)=1,0.064=0.936,二项分布,二项分布的特征,二项分布的图形特征,接近,0.5,时,图形是对称的;图,4-1,离,0.5,愈远,对称性愈差,但随着,n,的增大,分布趋于对称。图,4-2,当,n,时,只要,不太靠近,0,或,1,,当,nP,和,n,(1,P,),都大于,5,时,二项分布近似于正态分布。,二项分布图形取决于,与,n,,,高峰,=,n,处,二项分布,图,5-1,=0.5,时,不同,n,值对应的二项分布,二项分布,图,5-2 =0.3,时,不同,n,值对应的二项分布,二项分布,二项分布的均数和标准差,总体均数:,方差:,标准差:,二项分布,如果将出现阳性结果的频率记为,总体均数:,标准差:,二项分布,例,5-4,研究者随机抽查某地,150,人,其中有,10,人感染了钩虫,钩虫感染率为,6.7%,,求此率的抽样误差。,二项分布,二项分布的应用,(一)概率估计,例,5-5,如果某地钩虫感染率为,13%,,随机观察当地,150,人,其中有,10,人感染钩虫的概率有多大?,从,n,=150,,,=0.13,的二项分布,由公式(,4-1,)和(,4-2,),二项分布,可以得出,150,人中有,10,人感染钩虫的概率为,二项分布,单侧累积概率计算,二项分布出现阳性的次数至多为,k,次的概率为,出现阳性的次数至少为,k,次的概率为,二项分布,例,5-6,例,4-5,中某地钩虫感染率为,13%,,随机抽查当地,150,人,其中至多有,2,名感染钩虫的概率有多大?至少有,2,名感染钩虫的概率有多大?至少有,20,名感染钩虫的概率有多大?,二项分布,根据公式(,5-10,)至多,有,2,名感染钩虫的概率为,至少有,2,名感染钩虫的概率为,二项分布,至少有,20,名感染钩虫的概率为,Poisson,分布,Poisson,分布的概念,Poisson,分布也是一种离散型分布,用以描述罕见事件发生次数的概率分布。医学上人群中出生缺陷、多胞胎、染色体异常等事件等都是罕见的,可能发生这些事件的观察例数,n,常常很大,但实际上发生类似事件的数目却很小很小。,Poisson,分布,Poisson,分布可以看作是发生的概率,(或未发生的概率,1,)很小,而观察例数,n,很大时的二项分布。除二项分布的三个基本条以外,,Poisson,分布还要求,或(,1,)接近于,0,或,1,(例如,0.999,)。,Poisson,分布,Poisson,分布的特征,Poisson,分布的概率函数为,式中,为,Poisson,分布的总体均数,,X,为观察单位内某稀有事件的发生次数,;,e,为自然对数的底,为常数,约等于,2.71828,。,Poisson,分布,由图,5-3,可以看到,Poisson,分布当总体均数,值小于,5,时为偏峰,,愈小分布愈偏,随着,增大,分布趋向对称,。,Poisson,分布有以下特性:,(,1,),Poisson,分布的总体均数与总体方差相等,均为,(,2,),Poisson,分布的观察结果有可加性,Poisson,分布,图,5-3,取不同值时的,Poisson,分布图,Poisson,分布,Poisson,分布的应用,(一)概率估计,例,5-7,如果某地新生儿先天性心脏病的发病概率为,8,,那么该地,120,名新生儿中有,4,人患先天性心脏病的概率有多大?,=,n,=120,0.008=0.96,Poisson,分布,单侧累计概率计算,如果稀有事件发生次数的总体均数为,,,那么该稀有事件发生次数至多为,k,次的概率,发生次数至少为,k,次的概率,Poisson,分布,例,5-8,例,4-7,中,至多有,4,人患先天性心脏病的概率有多大?至少有人患先天性心脏病的概率有多大?,至多有,4,人患先天性心脏病的概率,至少有人患先天性心脏病的概率为,Poisson,分布,例,5-9,实验显示某,100,cm2,的培养皿平均菌落数为,6,个,试估计该培养皿菌落数小于,3,个的概率,大于,1,个的概率。,该培养皿菌落数小于,3,个的概率,菌落数大于,1,个的概率为,第三节 正态分布,正态分布,(,normal distribution,),也叫高斯分布(,Gaussian distribution,),,一种最常见、最重要的连续型对称分布。,(正态分布是对称分布,但对称分布不一定是正态分布。),实际频数分布:中间频数多,两端越来,越少,且左右大致对称,理论频数分布:正态分布曲线。,一、,数学形式,正态分布,正态分布的概念,正态曲线,(normal curve),是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线该曲线表现为中间高,两边低,左右对称,略显钟形,类似于数学上的正态分布曲线。因为频率的总和等于,1,,故横轴上曲线下的面积等于,1,。,正态分布,图,5-4,体模“骨密度”测量值的分布接近正态分布示意图(频率密度,=,频率,/,组距),正态分布,正态概率密度曲线的位置与形状具有如下特点,(,1,)关于,x=,对称。,(,2,)在,x=,处取得该概率密度函数的最大值,在,处有 拐点,表现为钟形曲线。,(,3,)曲线下面积为,1,。,(,4,),决定曲线在横轴上的位置,,增大,曲线沿横轴向右移;反之,减小,曲线沿横轴向左移。,(,5,),决定曲线的形状,当,恒定时,,越大,数据越分散,曲线越“矮,胖,;,越小,数据越集中,曲线越,瘦高,。见图,4-5,。,X,f,(,X,),m,正态分布,u1 u2 u3,不同均数,正态分布,不同标准差,正态分布,对任意一个服从正态分布 的随机变量,可作如下的标准化变换,也,称,Z,变换,Z,服从总体均数,为,0,、总体标准差,为,1,的正态分布。我们称此正态分布为标准正态分布,(standard normal distribution),,用,N,(0.1),表示。,正态分布,统计学家编制了标准正态分布曲线下面积分布表(附表,1,),因为正态分布两边对称,所以只给出,Z,取负值的情况。,表内所列数据表示,Z,取不同值时标准正态分布的分布函数值,此值大小相当于,Z,值左侧标准正态曲线下面积,记作 。,正态分布,例,5-9,已知,X,服从均数为,、,标准差,为,的正态分布,试估计:,X,取值在区间 上的概率:,X,取值在区间 上的概率。,正态分布,查附表,1,,,。,因为曲线下两侧面积对称,区间(,1.96,,,)相应面积也是,0.025,,故,Z,取值于(,1.96,,,1.96,)的概率为,1-2,0.025=0.95,,即取值在区间上的概率为,0.95,。,同理,我们可以求,出,X,取值在 区间上的概率为,0.99,。,正态分布,正态曲线下面积的分布规律,-3 -2 -2 -3,68.27%,95.44%,99.74%,正态分布,z,(z),正态分布,1.96,1.96,0.025,0.025,正态分布,1.46,-1.46,0.07,0.07,图,4-9,例,4-10,示意图,正态分布,例,5-11,某地,1986,年,120,名,8,岁男孩身高均数为,=123.02cm,,,标准差为,S,=4.79cm,,,试估计,(1),该地,8,岁男孩身高在,130cm,以上者占该地,8,岁男孩总数的百分比,(2),身高在,120cm,128cm,者占该地,8,岁男孩总数的百分比,;,(3),该地,80%,的男孩身高集中在哪个范围?,正态分布,求,Z,值,:,查表,:,理论上该,地,8,岁男孩身高在,130cm,以上者占该地,8,岁男孩总数的,7.21%,。,正态分布,先计算,120,和,128,所对应,的,Z,值,:,正态曲线下区间(,0.63,,,1.04,)上的面积等于,正态分布,查附表,1,,标准正态分布曲线下左侧面积为,0.10,所对应的,Z,值为,1.28,,,80%,的,8,岁男孩身高集中在 区间内,即,116.9cm,与,129.2cm,之间。,正态分布,正态分布的应用,(一)确定医学参考值范围,医学参考值范围,(reference ranges):,是指特定的,“,正常,”,人群数据中大多数个体的取值所在的范围。人们习惯用该人群,95%,的个体某项医学指标的取值范围作为该指标的医学参考值范围。,步骤:,1.,从,“,正常人,”,总体中抽样:明确研究总体,2.,统一测定方法以控制系统误差。,3.,判断是否需要分组(如性别、年龄)确定。,4.,根据专业知识决定单侧还是双侧。,意义:,单侧下限,-,过低异常 单侧上限,-,过高异常 双侧,-,过高、过低均异常。,单侧下限,异常,正常,单侧上限,异常,正常,异常,正常,双侧下限,双侧上限,异常,正态分布,确定医学参考值范围的方法有两种:,(,1,)百分位数法,:,适用于任何分布型的资料。,双侧,95%,参考值范围,:,(,P,2.5,P,97.5,),单侧范围,:,P,95,以下,(如血铅、发汞),,或,P,5,以上(如肺活量)。,(,2,)正态分布法,正态分布,例,5-11,调查某地,120,名健康女性血红蛋白,直方图显示,其分布近似于正态分布,,(,g/L,),(,g/L,),,试估计该地健康女性血红蛋白的,95%,参考值范围。,因血红蛋白过高、过低均为异常,所以按双侧估计,95%,医学参考值范围,某市,1995,年,110,名,7,岁,-,身高的均数为,121.95cm,标准差为,4.72cm,现欲估计该地,1995,年身高界于,116.5cm,到,119.0cm,范围内的,7,岁男童比例及,110,名,7,岁男童中身高界于,116.5119.0cm,范围的人数。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 小学其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服