1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,第五章 离散型变量的概率分布,学习目标,1.,确定可以用二项分布描述的统计试验并会计算和应用。,2.,确定可以用泊松分布描述的统计试验并会计算和应用。,2,习 题,1.P144-3(P170-3)4.P151-17 (P178-17),2.P147-8(P173-8)5.P160-30 (P192-28),3.P149-14(P175-14)6.P164-40 (P197-36),3,概率分布,(,probability distribution,):随机变量取一切可能值或范围的概率或概率的规律,简称
2、分布,。,4,第一节 离散型概率分布的基本问题,一、概率函数,离散变量只取离散的值,比如骰子的点数、次品的个数、得病的人数等等。,变量的每一种取值都有某种概率。离散变量取特定值的概率称为,概率函数,(,Probability function,),5,二、离散概率函数需满足以下两个条件:,三、期望值和方差,期望值,(,Expected value,)随机变量的均值或中心位置的测度。,6,方差,(,Variance,)对随机变量的差异性或离散性的一种测度。,7,【,案 例,】,北方汽车公司在过去,300,天时间内汽车的销售资料如下:,8,根据上述资料:,1.,给出北方汽车公司在过去,300,天
3、时间内,某一天销售汽车数目的概率分布。,2.,绘制北方汽车公司在过去,300,天时间内,某一天销售汽车数目的概率分布图。,3.,计算北方汽车公司每天汽车销售量的期望值和方差。,4.,假如你是该公司经理,对上述数据资料会做出哪些反应?,9,10,11,12,13,第二节 二项概率分布,一、二项分布的假设条件,1.,试验是由一个包含,n,次相同的序列组成。,2.,每次试验都有两种可能的结果。我们把其中一个称为,成功,,另一个称为,失败,。,3.,成功的概率用,p,表示,失败的概率用,q,表示,(q=1,p),。,p,和,q,不随着试验的变化而变化。,4.,试验都是独立的。,14,*,成功和失败的确
4、定,通常,把研究者感兴趣的结果定义为,成功,(是)。,把成功的反面定义为,失败,(非)。,例如,,在质量管理中要测定次品的数量,就会把找到一个次品定义为成功,即使次品对这个工厂不是好事。,15,*,关于各个试验相互独立的确定,(,1,)试验本身是独立的,如扔硬币或掷骰子。,(,2,)试验是有放回试验。,各个试验相互独立的假设,目的就是保证成功的概率,p,在各次试验中不变。,以下情况可以,不考虑,相互独立的假设:,16,二、二项分布的概率函数,:n,次试验中,x,次成功的概率,n,:试验次数,n,次试验中恰有,x,次成功的试验结果个数,17,【,案 例,】,北京某大商场计划在郊区建一家分店。商场
5、准备当分店建成后从处于市中心的总店调一批员工到分店工作。,商场人事部门在确定调动人员名单时遭到部分员工的拒绝。经过调查发现,员工不愿意更换工作地点的原因主要有家庭原因、经济原因等等。其中,有,4%,的被调查者指出:他们拒绝的原因是,更换工作地点到郊区工作得到的补助太少。,18,现随机抽取,5,名拒绝更换工作地点的员工进行调查。研究其中有,1,名员工因为得到补助太少而拒绝,其余,4,人是因为其他原因而拒绝的概率是多少?,19,已知:,n=5 p=0.04 (1-p)=0.96 x=1,利用二项分布概率函数公式计算:,20,统计分析:,该商场在对拒绝更换工作地点的员工随机抽取,5,名人员中,恰有,
6、1,人因为得到补助太少而拒绝,其余,4,人因为其他原因而拒绝的概率是,0.16985,。,问题进一步展开:,根据这样一种研究结果,该商场人事部门该做出什么样的决策呢?,21,三、二项概率表的使用,见教科书,P459,表,5,(机械版)。,四、二项概率分布的期望值和方差,22,例如,,利用上述公式计算案例中的期望值、方差和标准差,23,问题:,在本案例中,上述期望值,0.2,人的含义是什么?,0.2,的含义是,在该商场拒绝更换工作地点的员工中,平均每,5,人就有,0.2,人是因为得到的补助太少而拒绝到郊区工作。,24,假如该商场计划从总店抽调,100,名员工到分店上班。其中,有,40,人拒绝人事
7、部门的安排。估计一下,这些拒绝的人中大约有多少是因为得到的补助太少而做出这一决定的呢?,在抽调,100,名员工到分店上班而遭到拒绝的,40,名员工中,会有,1.6,名员工是因为补助太少而做出不去分店上班的决定。,25,算法,1,:,算法,2,:,26,【,补充内容,】,商务统计中的,是非标志,(,交替标志,)及其期望值和方差,凡是某种现象能够被分成两部分,其中,我们感兴趣的那部分(要研究的那部分)称为,是,(相当于前面的成功),不感兴趣的那部分(不研究的那部分)称为非(相当于前面的失败)。,27,是非标志的有关符号,1,:具有,“,是,”,标志的标志值(变量值),0,:具有,“,非,”,标志的
8、标志值(变量值),N,:总体单位个数,N,1,:具有是标志的单位个数,N,0,:具有非标志的单位个数,p:,具有是标志的单位个数占总体单位数的比重,即,p=N,1,/N,q:,具有非标志的单位个数占总体单位数的比重,即,q=N,0,/N,28,是非标志的期望值和方差,例:,某企业生产的,500,件产品中,经检验有,5,件废品。,问:该企业产品的平均合格率是多少?,29,利用,Excel,计算二项分布的概率,1.,选择,fx,(粘贴函数),2.,在,“,选择类别,”,中,“,统计,”,3.,在,“,选择函数,”,中,“,BINOMDIST,”,4.,在第一个框输入,X,值,第二个框输入,n,值,
9、第三个框输入,p,值,第四个框键入单一概率(,X,5,),“,false,”,或累积概率(,X,小于等于,5,),“,true,”,5.,确定,30,课后实践,教科书第,171,页附录,5B,,用,Excel,计算马丁服装商店二项分布概率。,31,第三节 泊松概率分布,泊松分布,(,Poisson distribution),考虑在某一时间或空间段出现的次数。,一、泊松分布的特点(运用条件),1.,它是离散型分布。,2.,事件相互独立。,3.,描述在某一时间或空间段出现的次数。,4.,每个时间段发生的次数从,0,到无穷大。,5.,每个时间段中预期发生的次数保持不变。,32,泊松分布的例子有:,
10、1,)某电话交换机每分钟接到电话的次数。,(,2,)每,10,万人中患有某种罕见疾病的人数。,(,3,)使用期为一年的个人电脑打印机每个季度的故障次数。,(,4,)每辆新汽车的喷漆斑点数。,33,二、泊松公式,对某泊松分布进行长期研究,就可以得到长期的平均值,用 表示。,泊松公式:,泊松公式用来计算对于给定的 值在某一时间段内某事件发生的概率。,34,其中,,x,:要计算的概率的时间段内发生的次数。,X,1,,,2,,,3,,,。,:长期平均值。,e:,自然对数的底。,e,2.718282,。,35,【,案 例,】,北京银行某营业部的统计人员经过长期观察发现,在工作日的下午平均每,4,分钟
11、就有,3.2,名顾客到达该银行。该统计人员根据这一数据想做如下几项研究:,(,1,)在一个工作日下午,,4,分钟时间内恰有,5,名顾客到达该银行的概率是多少?,(,2,)在一个工作日下午,,4,分钟时间内有,7,名以上顾客到达该银行的概率是多少?,(,3,)在一个工作日下午,,8,分钟时间内恰有,10,名顾客到达该银行的概率是多少?,36,问题(,1,),【,统计分析,】,计算结果表明,该银行在平均每,4,分钟有,3.2,名顾客到达的情况下,,某个工作日下午,,4,分钟时间内恰有,5,名顾客到达的概率是,0.1141,。,37,【,思考,】,如果你是该银行的经理,当你得到这样一个统计分析报告后
12、会做出什么决策呢?,38,问题(,2,),分析:,要知道在一个工作日下午,4,分钟时间内有,7,名以上顾客到达该银行的概率是多少,理论上要计算,x=8,,,9,,,10,,,的值。事实上,只要计算到对于 ,3.2,,概率等于,0,时所对应的,x,值即可。将它们相加,得到,x7,的概率。,39,40,【,统计分析,】,计算结果表明,该银行在平均每,4,分钟有,3.2,名顾客到达的情况下,,某个工作日下午,,4,分钟时间内有,7,名以上顾客到达的概率是,0.0169,。,这一结果表明,在,4,分钟时间内几乎不大可能有,7,名以上顾客同时到达该银行。,提示:,银行经理可以据此安排前台工作的人数。,
13、41,问题(,3,),分析:这个问题与前面两个问题不同,因为 的间隔与,x,的间隔不同。这时,需要将两个间隔调整为相同。,调整的方法是,将 的值调整为与,x,有相同的间隔。,此处,x,的间隔为,8,分钟,所以应当将 的间隔也调整为,8,分钟。,既然一个工作日下午,4,分钟时间内有,3.2,名顾客到达该银行,那么,,8,分钟约有,6.4,名顾客到达该银行。,42,同理,如果,x,的间隔为,2,分钟,则应将 的间隔由,4,分钟调整为,2,分钟,1.6,人。,问题(,3,)的答案是:,【,统计分析,】,计算结果表明,该银行在平均每,8,分钟有,6.4,名顾客到达时,,某个工作日下午,,8,分钟时间内
14、有,10,名顾客到达该银行的概率是,0.0528,。,43,三、泊松分布表的使用,P469,表,7,(机械版),案例中问题(,1,),,x,5,,,44,四、泊松分布的均值和标准差,泊松分布的期望值,泊松分布的标准差,【,例如,】,案例中,泊松分布的期望值为,3.2,人,标准差为,1.79,()。,45,五、运用泊松分布解决涉及长度或间隔的案例,事件:,观察京藏高速公路某一部分路面重新铺过,1,个月后又出现损坏的情况。,条件:,(,1,)假定在这段高速路上任何两个相等长度间隔内路面损坏出现或不出现的概率相等。,(,2,)假定任何一段长度间隔内路面损坏出现或不出现与另一段长度间隔内路面损坏出现或
15、不出现相互独立。,46,背景:,经了解每公里路面重新铺过,1,个月后出现损坏处的平均数是,2,处。,问题:,求,3,公里长的高速路上没有出现损坏的概率。,分析:,在此问题中,我们感兴趣的是,x=,在,3,公里长的高速路上出现损坏的次数为,0,。,47,利用泊松公式:,【,统计分析,】,上述计算结果表明,在,3,公里的高速路上没有损坏几乎是不可能的。换句话说,在高速路的这部分路面上,至少有,1,处损坏的概率是,1-0.0025=0.9975,。,48,【,思考,】,假如你是京藏高速公路管理处负责路面维修的人员,当你得到这样一个统计信息后,该如何做呢?,49,利用,Excel,解决泊松分布和累积泊
16、松分布的问题,1.,选择,“,粘贴函数,”,fx,2.,在,“,选择类别,”,框,统计,3.,在,“,选择函数,”,框,POISSON,4.,在第一个框中输入,X,值,在第二个框中输入 值,在第三个框输入,false(,单个概率,),或,true,(累积概率),50,第四节 超几何概率分布,一、超几何分布(,Hypergeometric distribution,)与二项分布关系密切,统计学家经常用它来补充分析二项分布。,二者之间的联系与区别:,51,二项分布,超几何分布,离散型分布,每个结果包括成功或失败,每次实验成功的概率相同,每次实验之间相互独立(放回实验),总体是无限的,总体中成功的数
17、目未知,离散型分布,每个结果包括成功或失败,每次实验成功的概率不同,每次实验之间相互不独立(无放回实验),总体是有限的,并已知,总体中成功的数目已知,52,二、超几何概率函数,F(x),:,n,次子实验中成功,x,次的概率,n,:子实验的次数,N,:总体中单位(元素)个数,r:,总体中成功元素的次数,53,54,案例:,假设北京主要的,18,家计算机公司中,有,12,家位于中关村。采用无放回抽样方法,从,18,家公司中随机抽取,3,家,问:,(,1,)其中恰有,1,家位于中关村的概率是多少?,(,2,)其中至少有,1,家位于中关村的概率是多少?,55,解答:,(,1,)已知:,N,18,,,n=3,,,r=12,,,x=1,56,(,2,)本问包括,3,种情况:,x,1,,,x=2,,,x=3,57,利用,Excel,计算超几何概率分布的概率,1.,选择,“,粘贴函数,”,fx,2.,在,“,选择类别,”,框,统计,3.,在,“,选择函数,”,框,HYPGEOMDIST,4.,在第一个框中输入样本中成功的次数,X,值,在第二个框中输入样本容量,n,值,在第三个框输入总体成功的次数,r,值,在第四个框中输入总体大小,N,值。,5.,确定,






