收藏 分销(赏)

常用概率分布.ppt

上传人:可**** 文档编号:766826 上传时间:2024-03-08 格式:PPT 页数:86 大小:5.63MB
下载 相关 举报
常用概率分布.ppt_第1页
第1页 / 共86页
常用概率分布.ppt_第2页
第2页 / 共86页
常用概率分布.ppt_第3页
第3页 / 共86页
常用概率分布.ppt_第4页
第4页 / 共86页
常用概率分布.ppt_第5页
第5页 / 共86页
点击查看更多>>
资源描述

1、常用概率分布内 容二项分布PoissonPoisson分布分布正态分布正态分布 分布的概念分布的条件分布的特征 分布的应用概率的意义及相关的一些概念考虑:考虑:确定确定n n之后,阳性数目的概率分布(随机之后,阳性数目的概率分布(随机变量变量X=X=阳性数目)阳性数目)掷一枚均匀钱币掷一枚均匀钱币:P(P(正面朝上正面朝上)0.50.5,P(P(正面朝下正面朝下)0.50.5掷一枚均匀骰子:掷一枚均匀骰子:P(1P(1朝上朝上)P(2P(2朝上朝上)P(6P(6朝上朝上)1/61/6第一节 二项分布二项分布是一种重要的离散型随机变量的分布,又叫伯努利分布(Bernoulli)。二项分布的总体:

2、由非此即彼事件构成的总体。离散型随机变量离散型随机变量的概率的概率掷一枚均匀钱币,其结局可视为一个变量,这个变量的“值”或为“正面朝上”,或为“正面朝下”,而且,不同的值各有一个出现的概率。P(正面朝上)0.50;一般地,一个随机变量含两个要素:1.它是一个变量;2.这个变量可能值的出现各具有一定的概率。概 念与定理:组组合合(combination):从几个元素中抽取x个元素组成一组(不考虑其顺序)的组合方式个数,记Cnx几个相互独立事件同时发生的概率等于各独立事件的概率之积。1.摸球模型一个袋子里有一个袋子里有5 5个乒乓球,其中个乒乓球,其中2 2个黄球,个黄球,3 3个白球,个白球,我

3、们进行摸球游戏,每次摸我们进行摸球游戏,每次摸1 1球,然后放回再摸。先球,然后放回再摸。先后摸后摸100100次,摸到零次黄球的概率?次,摸到零次黄球的概率?(1)(1)第第1 1次摸到白球的概率:次摸到白球的概率:0.60.6(2)(2)第第2 2次摸到白球的概率:次摸到白球的概率:0.60.6 (100)(100)第第100100次摸到白球的概率:次摸到白球的概率:0.60.6100100次都摸到白球的概率:次都摸到白球的概率:0.60.6 0.6=0.60.60.6 0.6=0.6100100摸到摸到3 3次黄球的概率有多大?次黄球的概率有多大?黄黄黄白白白白黄黄黄白白白白白白 概率概

4、率=0.4=0.43 30.60.69797黄黄白黄白白白黄黄白黄白白白白白 概率概率=0.4=0.43 30.60.69797黄黄白白黄白白黄黄白白黄白白白白 概率概率=0.4=0.43 30.60.69797三个特点:二分类:每次摸球只有二种可能的结果,或黄球或白球;独立:各次摸球是彼此独立的;重复:每次摸到黄球(或摸到白球)的概率是固定的。具备以上三点的概率分布就是二项分布。例如:口袋内黑球80%,白球20%,摸球放回,摸5次,黑球出现总次数X的概率函数。例5-1 用针灸治疗头痛,假定结果不是有效就是无效,每一例有效的概率为。某医生用此方法治疗头痛患者3例,2例有效的概率是多少?二项分布

5、二项分布一、概率函数 (概率分布表)二项分布二项分布名词解释:观察结果二项;概率等于二项展开式。二项分布的三个条件二项分布的三个条件各事件相互独立:即任何一件事的出现与否不影响其他事件的发生概率。各事件相互排斥:即二项试验的两种对立的结果不可能同时发生,二者必居其一,而且只有其一。每次试验的条件不变,各事件发生的概率不变。二项概率分布二项概率分布二二项项概概率率分分布布:如如果果一一个个事事件件A A,在在n n次次独独立立试试验验中中,每每次次试试验验都都具具有有概概率率,那那么么这这一一事事件件A A将在将在n n次试验中出现次试验中出现k k次的概率为:次的概率为:(三)二项分布的特征(

6、三)二项分布的特征1 1、二项分布的图形特征、二项分布的图形特征由此可见:&1、二项分布的图形取决于两个参数与n,高峰在=n 处。&2、当接近0.5时,图形是对称的;离0.5愈远,对称性愈差。&3、当n 时,只要不太靠近0或1,特别是nP和n(1-P)都大于5时,二项分布则近似于正态分布。2 2、二项分布的均数与方差、标准差、二项分布的均数与方差、标准差(1)以阳性数计算:已知二项分布的,n,则阳性事件的 均数 n 方差 2 n(1-)标准差(2)以率计算&则平均阳性率 (即样本率的均数为总体率)&方差2(1-)/n&标准差&为率的标准差,反映率的抽样误差大小,也称率的标准误,反应了样本率相对

7、于总体率分布的离散程度。四、二项分布的应用四、二项分布的应用一、概率估计X X为出现阳性的次数,例子见为出现阳性的次数,例子见P51P51二、单侧累计概率计算二、单侧累计概率计算第二节第二节 Poisson 分布分布一、概念&Poisson 分布是一种离散型分布,用以描述罕见事件发生次数的概率分布。&Poisson 分布可看作是发生的概率(或未发生的概率1-)很小,而观察例数很大时的二项分布。&Poisson 分布一般记作()医学领域中医学领域中PoissonPoisson分布的实例分布的实例单位容积(水、牛奶)中细菌的分布;患病率很小的非传染病在人群中的分布野外旷野中单位面积上昆虫(钉螺)的

8、分布计数器中单位格中的细胞数的分布。Poisson 分布的特征分布的特征(泊松分布的数学表达式为:泊松分布的数学表达式为:(在在n n个取样单位内,出现个取样单位内,出现x x0 0,1 1,2 2,n,n个阳性个阳性事件的理论概率分别为下列公式的展开式:事件的理论概率分别为下列公式的展开式:(式中式中P(x)P(x)为出现阳性事件例数为为出现阳性事件例数为x x的理论概率的理论概率,e e为自然对数的底,为自然对数的底,(x x x x是是为观察单位内为观察单位内某稀有事件的发生次数某稀有事件的发生次数,(=n=n 为为总体总体总体总体平均数平均数,在实际应用中可以用在实际应用中可以用在实际

9、应用中可以用在实际应用中可以用样本样本样本样本均数作为均数作为均数作为均数作为总体总体总体总体均数的均数的均数的均数的估计估计估计估计。Poisson Poisson 分布在分布在2020时时,近似于正态分布近似于正态分布。Poisson分布的分布的特点特点:1、Poisson 分布的总体均数与总体方差相等,均为。2、Poisson 分布的观察结果有可加性。如水样的细菌培养。Poisson 分布的应用分布的应用一、概率估计一、概率估计一、概率估计一、概率估计见例见例4-74-7二、二、二、二、单侧累计概率单侧累计概率单侧累计概率单侧累计概率计算计算计算计算见例见例4-9正正 态态 分分 布布

10、及及 其其 运运 用用1 1、概概 念念2 2、图图 形形3 3、特特 征征4 4、面面 积积5 5、正态分布的运用正态分布的运用1、正 态 分 布 的 概 念正态分布(normal distribution):又称Gauss分布,正态分布曲线是一条高峰位于中央(均数所在处),两侧完全对称,两端永远不与横轴相交的钟型曲线。组段频数频率(%)1.22821.14 1.23421.14 1.24074.00 1.246179.71 1.25 2514.29 1.2583721.14 1.26 2514.29 1.270169.14 1.27642.29 1.28210.57 1.2583721.1

11、4 合计175100.00 表表5-4 5-4(体模)骨密度测量值的频率分布表(体模)骨密度测量值的频率分布表2 2、图、图 形形对象分布 概况分布特征数样本数据频数分布表 频数分布图 描述指标()(p)随机变量概率分布表 概率分布图 总体参数()()联系联系:正态分布的函数式为:X+为为总体均数总体均数,为为总体标准差总体标准差。3、正态分布的特点、正态分布的特点1、关于 x=对称。2、在x=处,该概率密度函数为最大值,在 X=处有拐点,表现为钟型曲线。3、曲线下面积为1。4、决定曲线在横轴上的位置。5、决定曲线的形状。正态分布:有两个参数正态分布:有两个参数1、位置参数位置参数 :描述正态

12、分布的集中趋势位置。2、形态参数形态参数 :描述正态分布的离散程度。越小,分布越集中,曲线越“瘦高”;越大,分布越离散,曲线越“肥胖”。记为N(,2),表示均数为,标准差为的正态分布 见图4-5。13314 4、正态分布曲线下面积的分布规律、正态分布曲线下面积的分布规律面积的分布规律由两个参数决定;横轴上、曲线下的面积为1;曲线下的面积就是概率。曲线下,横轴上对称于0的面积相等。正态曲线下面积分布可用公式求得:但求该积分相当困难,可通过以下变换:但求该积分相当困难,可通过以下变换:标准正态分布标准正态分布则Z服从均数为0,标准差为1的标准正态分布。它将均数作为坐标原点,并使新坐标的横轴尺度以

13、为单位。通过该变换,对于通过该变换,对于非标准非标准正态正态分布,可求得曲线下任意(分布,可求得曲线下任意(X X1 1,X X2 2)范围内的面积。)范围内的面积。(-z):其大小相当于z值左侧标准正态曲线下面积。见书P431,统计用表。当z值一定时,曲线下:左侧面积:(-z)右侧面积:1(-z)中间面积:12(-z)常用:常用:x x取值在区间取值在区间 当资料是样本资料,且样本含量较大时,总体均数 可用样本均数 代替;总体标准差 可用样本标准差s代替;正态分布曲线下的面积分布规律,可以写成 s;1.96s;2.58s 。正态分布和标准正态分布曲线下面积分布规律正态分布和标准正态分布曲线下

14、面积分布规律正态分布和标准正态分布曲线下面积分布规律正态分布和标准正态分布曲线下面积分布规律 正正 态态 分分 布布 标标 准准 正正 态态 分分 布布 面面 积积(或概率或概率)-1+1+2.58-2.58-1.96+1.96-1 +1-1.96+1.96-2.58+2.5868.27%95.00%99.00%正正 态态 分分 布布 的的 面面 积积 分分 布布 规规 律律标标 准准 正正 态态 分分 布布 的的 面面 积积 分分 布布 规规 律律许多医学指标许多医学指标服从正态分布或服从正态分布或近似近似正态分布正态分布如:同性别、同年龄儿童的身高;同性别健康成人的红细胞数、血红蛋白;实验

15、中的随机误差等。因此,通过正态曲线下面积的分布规律:概括地估计变量值的频数分布;用于了解某个体值在其所属群体中占据何种位置。例 如:已知某地120名20岁男大学生身高均数172.90cm,标准差s=4.09cm。(1)身高在182cm以上者占该地20岁男大学生总数的百分数?(2)身高在165175cm者占该地20岁男大学生总数的百分数?(3)该地80%的男大学生身高集中在哪个范围?(1)已知身高)已知身高 172.9cm B、查附表查附表 (标准正态曲线下的面积)标准正态曲线下的面积)左侧找到左侧找到Z=-2.22,即,即2.22的面积为的面积为0.0132 故故 2.22的面积也为的面积也为

16、1.32%,即即身高在身高在182cm以上者占该地以上者占该地20岁男大学生的岁男大学生的1.32%A、先做标准正态变换先做标准正态变换:(2 2)已知已知x1x1165cm165cm,x2=175cmx2=175cm A A、计算、计算u u值值 Z Z1 1=(165-172.90)/4.09=-1.93=(165-172.90)/4.09=-1.93 Z Z2 2=(175-172.90)/4.09=0.51=(175-172.90)/4.09=0.51 B B、查附表:、查附表:(1.931.93)0.02680.0268,即,即 1.931.93的面积为的面积为0.02680.026

17、8 (0.510.51)0.30500.3050,即,即 0.510.51的面积为的面积为0.30500.3050 则则0.510.51的面积为的面积为0.30500.3050 区间(区间(1.931.93,1.511.51)的面积)的面积:p p1 10.02680.02680.30500.30500.66820.6682身高在身高在165165175cm175cm者占该地者占该地2020岁男大学生的岁男大学生的66.82%66.82%。(3)求)求80%的男大学生身高集中在哪个范围?的男大学生身高集中在哪个范围?查附表:查附表:标准正态分布曲线下左侧面积为标准正态分布曲线下左侧面积为0.1

18、0所对应所对应的的u值值是是1.28,所以所以80%的男大学生身高集中的男大学生身高集中在在 1.28s 区间内。区间内。即在即在 167.66cm至至 178.14cm之间。之间。练习题 张三期末考试物理为86分,数学为92分,已知其班级物理均分是78分,标准差是10,数学均分为84分,标准差是16。问张三哪门功课考得好?5 5、正、正 态态 分分 布布 的的 应应 用用(一)确定医学参考值范围在医学上,一般常把95%的正常人某指标所在的范围作为参考值范围。正常人:不是指完全健康的人,而是指排除了影响所研 究指标的疾病和有关因素的同质人群。95%医学参考值范围仅仅是指某特定人群中,95%的个

19、体指标值在此范围内,并不能说明凡在此范围内都“正常”,凡不在此范内都不“正常”。该范围在临床上只能作为参考。确定参考值范围必须抽取足够例数的样本如果测定值在性别间或年龄组间差别较大,则应分“层”确定参考值范围。根据资料的类型,选用正态分布法和百分位数法对健康人的一些生理、生化指标的观察值,如果它们的分布是近似正态的,在求得均数和标准差后,即可应用概括估计变量值频数分布的方法,计算其参考值范围。双测双测95%95%的界值为的界值为 1.961.96s s,换言之,换言之,1.961.96s s ,包括其相对频数,包括其相对频数9595,均数均数1 1个标准差范围内,包括其相对频数个标准差范围内,

20、包括其相对频数6565,均数均数3 3个标准差范围内,包括其相对频数个标准差范围内,包括其相对频数99.799.7两种确定参考值范围的方法两种确定参考值范围的方法正态分布法正态分布法百分位数法百分位数法适用对象适用对象正态或近似正态正态或近似正态比如常见的生理指标比如常见的生理指标偏态分布资料偏态分布资料双侧界限值双侧界限值 P2.5和和P97.5单侧上界单侧上界 P95单侧下界单侧下界 P5如双侧95%医学参考值范围为:P2.5P97.5 单侧范围P5 以上或P95以下。如:肺活量用P5 以上来表示单侧95%医学参医学参考值范围。考值范围。血铅、发汞含量用P95以下来表示单侧95%医医学参考

21、值范围。学参考值范围。2.质量控制图控制图的基本原理就是:如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布。:作为上下警戒线作为上下警戒线:作为上下控制线作为上下控制线 图图(a)图图(b)判断异常的八种情况(1 1)有一个点距中心线的距离超过)有一个点距中心线的距离超过3 3个标准差(位于控制限个标准差(位于控制限以外)。以外)。(2 2)在中心线的一侧连续有)在中心线的一侧连续有9 9个点。个点。(3 3)连续)连续6 6个点稳定地增加或减少。个点稳定地增加或减少。(4 4)连续)连续1414个点交替上下。个点交替上下。(5 5)连续)连续3 3个点中有两个点距中心线

22、距离超过个点中有两个点距中心线距离超过2 2个标准差个标准差(位于警戒限以外)。(位于警戒限以外)。(6 6)连续)连续5 5个点中有个点中有4 4个点距中心线距离超过个点距中心线距离超过1 1个标准差个标准差(7 7)中心线一侧或两侧连续)中心线一侧或两侧连续1515个点距中心线距离都在个点距中心线距离都在1 1个标个标准差以内。准差以内。(8 8)中心线一侧或两侧连续)中心线一侧或两侧连续8 8个点距中心线距离都超出个点距中心线距离都超出1 1个个标准差范围。标准差范围。三、二项分布、泊松分布的三、二项分布、泊松分布的正态分布近似正态分布近似1 1、二项分布的正态近似、二项分布的正态近似二

23、项分布图取决于和n因二项分布在当n 时,只要不太靠近0或1,特别是n 和 n(1-)都大于5时,二项分布则近似于正态分布N(n,n(1-)二项分布累积概率正态近似计算公式为:见例见例4-14,与例与例4-6比较比较Poisson 分布的正态近似分布的正态近似当当20时,时,Poisson分布资料可按正态分布处理分布资料可按正态分布处理见例见例(3)正态分布是许多统计方法的理论正态分布是许多统计方法的理论基础基础t检验、方差分析、相关回归等均建在正态分布的基础上。t分布,泊松分布的极限分布是正态分布。案例讨论案例讨论见见P62已知已知:=7/10万,万,n=10万,求万,求(17)=?可求得可求

24、得:=n=7,则:,则:因因0.00060.01,故,故2000年与年与2001年年艾滋病感染率持平的说法是艾滋病感染率持平的说法是不成立的。对否?不成立的。对否?答案答案该例不能用Poisson 分布来计算,因爱滋病是传染病,不是独立事件练习题练习题1:经大量调查得知,某市正常经大量调查得知,某市正常3岁女童的体重岁女童的体重近似服近似服 从正态分布,平均体重从正态分布,平均体重 x=15.5公斤公斤,标准差标准差s=1.9公斤。今有一女孩生后公斤。今有一女孩生后随母亲接触铝尘,随母亲接触铝尘,3岁时其体重为岁时其体重为12公斤。公斤。按按99%的正常值范围衡量,问此女孩体重的正常值范围衡量

25、,问此女孩体重是否正常?是否正常?答案答案答案:(正常)答案:(正常)因因99%99%正常值范围为:正常值范围为:练习题练习题2 观察某观察某第第100名名12岁男孩身高,均数为岁男孩身高,均数为138.00cm,标准差,标准差为为4.12cm,Z=(128.00-138.00)/4.12=-2.43。(z)是标)是标准正态分布的分布函数,准正态分布的分布函数,1 (z)=1(-2.43)=0.9925,结论是:,结论是:A、理论上身高低于、理论上身高低于138.00cm的的12岁男孩占岁男孩占99.25%。B、理论上身高高于、理论上身高高于138.00cm的的12岁男孩占岁男孩占99.25%

26、。C、理论上身高在、理论上身高在128.00cm至至138.00cm的的12岁男孩占岁男孩占99.25%。D、理论上身高低于、理论上身高低于128.00cm的的12岁男孩占岁男孩占99.25%。E、理论上身高高于、理论上身高高于128.00cm的的12岁男孩占岁男孩占99.25%。答案答案 答案为答案为E E。练习题练习题3 为了解某城市为了解某城市7岁男童身高发育情况,随机抽查该市区岁男童身高发育情况,随机抽查该市区110名名7岁男童,平均身高为岁男童,平均身高为119.95cm,标准差为,标准差为4.72cm。(1)用算式)用算式119.951.28 4.72计算得到的区间,可以解释为:计

27、算得到的区间,可以解释为:理论上有多少的理论上有多少的7岁男童身高在此范围内?岁男童身高在此范围内?A、95%B、80%C、90%D、10%E、20%答案为答案为B:80%(2)理论上)理论上90%的的7岁男童身高集中在岁男童身高集中在A、119.951.28 4.72B、119.951.64 4.72C、119.950.13 4.72D、119.951.96 4.72E、119.952.58 4.72答案答案答案为答案为B B 119.95119.951.64 1.64 4.724.72练习题 4已知已知x x服从均数为服从均数为 ,标准差为,标准差为 的的正态分布正态分布,试估计:试估计:(1 1)x x取值在区间取值在区间 1.96 上的概率;(2)x x取值在区间取值在区间 2.58 上的概率;

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 教育专区 > 高中数学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服