资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,(本科)第5章概率基础ppt课件,统计学,(第二版),谢谢,!,第五章 概率基础,概率的基本概念,随机变量及其分布,几种常见的概率分布,大数定律与中心极限定理,2,(本科)第5章概率基础ppt课件,第一节 概率的基本概念,随机试验与随机事件,概率,3,(本科)第5章概率基础ppt课件,一、随机试验与随机事件,在自然界和日常生活中存在着许多不确定现象,如每天的天气都可能不同,抛硬币的结果也不可预测,工厂领导者所做出的决策是否可以给工厂带来利润等等,即使在同样的条件下,也有可能出现不同的结果。就以抛硬币来说,在周围环境和条件不变的情况下,可能会得到两种截然不同的情况,即是正面和反面。我们把这类在相同条件下重复同样的试验所得结果不确定的现象称为,随机现象,。曾经有许多学者作过这样的试验,最后发现,如果抛的次数足够多的话出现正面和反面的次数是差不多的。这说明了在不确定的表象下还是有其规律性的。于是我们利用随机试验来研究这种内在的规律性。,4,(本科)第5章概率基础ppt课件,(一)样本空间,从总体中随机抽取一个单位并把结果记录下来称为一次,试验,。举一个最简单的例子,从,09,这,10,个数字中随抽取出一个,并记录下所抽到的数字,即完成一次试验,抽到的数字可能是:,0,,,1,,,2,,,3,,,4,,,5,,,6,,,7,,,8,,,9,共,10,种情况,每种情况对应着一个样本点,总体中共有十个样本点。以全部样本点为元素的集合称为样本空间,记为:,S,0,1,2,3,4,5,6,7,8,9,如果样本空间 中样本点的数目是有限的,则 是一个,有限的样本空间,。如果 其中可能包括无限个样本点,则 是一个,无限的样本空间,,如观察一小时中落在地球上某一区域的粒子数,则样本空间取为,=0,,,1,,,2,,,。,5,(本科)第5章概率基础ppt课件,由此可见,,随着,问题的,不同,样本空间,可以,复杂,也,可以变得简单。应该,指出,样本空间,的界定会随着研究目的和样本设计不同而有,差异,而,不是一成不变的。如上面数字抽取的,例子,我们,所关心的是数字的,出现,因此,样本点有,10,种情况。如果我们关心的仅是“出现的数字为质数,”,则,得到的样本点集合为,1,,,2,,,5,,,7,。又,如,要求,的是“,6,的倍数,”,则,得到的是,6,这样一个样本空间。而如果进行多次,试验,则,得到的结果会有不同的,表示,可能,要用多维的方式来表示。例如掷一次铜币结果可能面向上或背向上两种,结果,如果,连续掷两次,铜币,则,两次试验的联合结果形成样本空间为:,S,(,面,面,),,,(,面,背,),,,(,背,面,),,,(,背,背,),6,(本科)第5章概率基础ppt课件,(二)事件,样本空间,的特定子集,A,称为,事件,。在一个试验中,我们首先关心的是它所有可能出现的基本结果,它们是试验中最简单的随机事件,称为,基本事件,。基本事件是指对应样本空间,S,中一个样本点的事件,它是不可再分的。例如数字抽取的例子中的,A,4,和连续两次抛硬币中的,B,(面,面)都是基本事件,因为它们都是所属样本空间的一个样本点,不可再分了。而,复合事件,是可以由若干个基本事件结合而成的。例如定义,C,为出现偶数的情况,,C,0,,,2,,,4,,,6,,,8,,则,C,是样本空间,S,0,,,1,,,2,,,3,,,4,,,5,,,6,,,7,,,8,,,9,的一个复合事件。因为,C,是由样本点,0,、,2,、,4,、,6,、,8,点的简单事件构成的,当出现这些点时,称事件,C,发生。,7,(本科)第5章概率基础ppt课件,8,(本科)第5章概率基础ppt课件,(,5,)交,(,),A,B,=,AB,=,A,和,B,同时发生,一般地,可以将此公式推广为:,(,6,),并,(,)给定两个事件,A,和,B,构成一个新的事件,C,=,A,B,=,A,和,B,至少发生一个,,也可记为,A,B,。,同样地可以将此公式推广为:,(,7,),差,(,),A,B,=,A,发生且,B,不发生,9,(本科)第5章概率基础ppt课件,【例,5-1,】,10,(本科)第5章概率基础ppt课件,二、概率,(一)概率的定义,前面已经提到,一切随机现象都有其内存的规律性,一切事件的发生都有其可能性,而我们就用,概率,这个概念来衡量一个事件发生的可能性的大小。在公理化结构中,,概率,是针对事件定义的,即对应于事件域,F,中的每一个元素,A,有一个实数,P,(,A,),与之对应,一般把这种从集合到实数的映射称为集合函数。因此,概率是定义在事件域,F,上的一个集合函数。,11,(本科)第5章概率基础ppt课件,定义,5.1,定义在事件域,F,上的一个集合函数,P,称为,概率,,如果它满足如下三个条件:,(),P,(,A,),,对一切,A,F,;,(),P,(,)=1,;,()若,A,i,F,,,i,=1,2,且两两不相容,则,(,5.1,),这就是概率的,可列可加性,或,完全可加性,。,12,(本科)第5章概率基础ppt课件,利用概率的基本性质可以推出概率的另外一些重要性质。,性质,1,不可能事件的概率为,0,,即,P,(,)=0,(5.2),性质,2,必然事件的概率为,1,,即,P,(,)=1,(5.3),性质,3,概率具有有限可加性。,即若,A,i,A,j,=,(,i,j,),,,(,5.4),13,(本科)第5章概率基础ppt课件,(二,)概率,的基本运算,14,(本科)第5章概率基础ppt课件,【例,5-2,】,15,(本科)第5章概率基础ppt课件,(三)古典概型与几何概型,1.,古典概型,在我们所研究的随机现象中有一类最简单的随机现象,这种随机现象的全部可能结果只有有限个,这些事件是两两互不相容的,而且它们发生的概率都相等,我们就把这类随机现象的数学模型称为古典概型。,记这些事件为,,若事件,包含的样本点的个数为,个,则其概率为,(5.10),【,例,5-3,】,设袋中有,a,个白球和,b,个红球,现按无放回抽样,依次把球一个个取出来,求第,k,次取出的球是红球的概率,。,16,(本科)第5章概率基础ppt课件,解:该实验是从,a+b,个球中,无放回地把球一个个取出来,相当于排队,求第,k,个位置排的是红球的概率。因为,a+b,个球共有,(a+b)!,种排法,故样本点总数,n=(a+b)!,。设,A,第,k,次取出的球是红球,,则对事件,A,包含的样本点的个数为:先从,b,个红球中任取一个放在第,k,个位置,然后把其余,a+b-1,个球排在剩下的位置上,总共有,。,所以,可以看到,最终得到的结果与,k,无关,这个实际上就是“抽签原理”,也就是抽签与顺序无关。,17,(本科)第5章概率基础ppt课件,2.,几何概型,古典概型所能计算的只是有限场合的情况,无限多结果的场合又如何呢?下面我们用几何方法来解决这个问题。,(,1,)开往某市的汽车开车时间为每个正点一趟,某人到车站乘车,求他等车短于,10,分钟的概率;,(,2,)一片面积为,S,的树林中有一块面积为,的空地,由空中向空地投掷物品,求投中的概率。,(,3,)在,10,毫升的自来水中有,1,个大肠杆菌,现在从中随机取出,2,毫升自来水在显微镜下观察,试求大肠杆菌的概率。,在上述问题中,样本空间分别是一、二、三维,分别用长度、面积和体积来衡量。则事件,A,的概率,P(A),与,A,的位置与形状均无关,而与其长度(或面积、体积)成正比,,18,(本科)第5章概率基础ppt课件,也就是,其中,m(,),表示长度(或面积、体积)。,【,例,5-4,】,两人相约于,8,时至,9,时之间在某地相见,并给定先到者等候另一人,30,分钟后就可离开,求两人能会面的概率。,解:设,x,y,分别表示两人到达某地的时刻,因为两人到达的时间是随机的,故,x,y,都分别等可能地在,0,60,上取值,那么点,(x,y),就是平面区域,等可能的样本点。记事件,A,为“两人能见面”,其区域为,其面积为,而,的面积为 ,于是两人能会面的概率为,(,5.11,),19,(本科)第5章概率基础ppt课件,(三)事件的独立性与条件概率,1,事件的独立性,若两个随机事件,A,、,B,的发生与否不会相互影响,则称它们,相互独立,,其定义如下:,定义,5.2,对于任意两个事件,A,、,B,,如果等式,P(AB)=P(A)P(B),(,5.12,),成立,则称事件,A,和,B,相互独立。,2,条件概率,条件概率,研究的是在某一事件发生的条件下,另一事件发,生是否会受到影响,影响有多大呢?这实际上也就是将原有的概率空间缩小。,20,(本科)第5章概率基础ppt课件,定义,5.3,给定一个随机试验,,是它的样本空间,对于任意两个事件,A,、,B,,其中,P(B)0,,称为在已知事件,B,发生的条件下事件,A,的条件概率。,3,两个重要公式,全概率公式,(,5.14,),贝叶斯公式,(,5.15,),(,5.13,),21,(本科)第5章概率基础ppt课件,【,例,5-5,】,设有来自三个地区的各,10,名、,15,名、,25,名考生的报名表,其中女生的报名表分别为,3,份、,7,份和,5,份。随机抽取一个地区的报名表,从中先后抽出两份。若已知后抽到的一份是男生表,求先抽到的一份是女生表的概率。,解:记,表示“报名表是第,I,区考生的”,,表示“第,j,次抽到的报名表是男生表”,则先抽到的一份是女生表的概率是:,22,(本科)第5章概率基础ppt课件,根据全概率公式(,5.1.14,),有,因此,,23,(本科)第5章概率基础ppt课件,第二节随机变量及其分布,随机变量与随机分布的概念,概率分布的类型,随机变量的数字特征,24,(本科)第5章概率基础ppt课件,第二节随机变量及其分布,一、随机变量与随机分布的概念,随机现象中有很大一部分问题与数值发生关系,例如在产品检验抽样中出现的废品数;在电话问题中关心的是某段时间中的话务量,它与呼叫次数及每次呼叫占用时间有关。,上一节中我们给出了随机试验与概率的概念,而试验的目的是为了研究随机现象的规律,了解这一随机现象中所有可能出现的结果及每个结果的概率。为了更好地描述这一问题,最直接明了的方法就是用数量来与结果对应。例如,买彩票时,用,0,表示“未中奖”,用,1,表示“中一等奖”,,2,表示“中二等奖”,,3,表示“中三等奖”。,将每个,结果对应于一个数,也就等价于在样本空间,上定义了一个“函数”,对于试验的每一个结果,,都可以用一个实数,X(,),来表示。这个量就称为,随机变量,(,random variable,),。,25,(本科)第5章概率基础ppt课件,本书中将用大写字母,X,,,Y,,,Z,来表示随机变量。正如对随机事件一样,我们所关心的不仅是试验会出现什么结果,更重要的是要知道这些结果将以怎样的概率出现,也即对随机变量,不但要知道它取什么数值,而且要知道它取这些数值的概率。这样,了解随机现象的规律就变成了解随机变量的所有可能取值及随机变量取值的概率。而这两个特征就可以通过随机变量分布来表现出来。,26,(本科)第5章概率基础ppt课件,二、概率分布的类型,从随机变量的可能出现的结果来看,随机变量至少有两种不同的类型。一种是试验结果,X,所可能取的值为有限个或至多可列个,能够一一列举出来,这种类型的随机变量称为,离散型随机变量,。在日常生活中经常碰到离散型随机变量,例如废品数、电话呼叫数、人口调查等等。其随机变量分布就称为,离散型随机变量分布,。,如果随机变量,X,的取值可以一一列出,记为,而相对于,所取的概率为 ,即,称为随机变量,X,的,概率分布,,它应满足下面关系:,(,5.16,),(,5.17,),27,(本科)第5章概率基础ppt课件,则当,和,已知时,这两组值就完全描述了随机变量的规律,此时把如下的表示方法称为该随机变量的分布列:,(,5.18,),对于集合 中任何一个子集,A,,事件“,X,在,A,中取值”即“,X,A,”的概率为,前面提到的抽数字的例子,就是一个离散型随机变量的例子,其样本点的取值就是,0,9,这,10,个数字,而取到每个,(,5.19,),28,(本科)第5章概率基础ppt课件,数字的概率都相等,也就是,10%,,它的概率分布可表示为:,或者用如下的分布列来表示:,与离散型随机变量有所不同,一些随机现象所出现的试验结果的取值不可列。例如测量误差、分子运动速度、候车时的等待时间、降水量、风速、洪峰值等等皆是。这时用来描述,试验结果的随机变量还是样本点,的函数:严格写应是,X(,),,其中,。但是这个随机变量能取某个区间,c,d,或,(-,+,),的一切取值。,29,(本科)第5章概率基础ppt课件,假如想用描述离散型随机变量的方法(简单地罗列所取的值及相应的概率)来描述这后一类随机变量,则会碰到很大的困难。一来是这类随机变量所取值不能一一列出;二来是我们下面将会看到,取连续值的随机变量,它取某个特定值的概率常常是,0,,因此用这种描述方法根本不行。,对于取连续值的随机变量我们所关心的也并不是它取某个特定值的概率。例如在测量误差中,我们感兴趣的是测量误差小于某个数的概率;在降雨问题中,我们重视的是雨量在某一个量级,例如在,100,毫米到,120,毫米之间的概率。总之,对于取连续值的随机变量,X(,),,我们感兴趣的是,X(,),取值于某个区间(,a,b,)的概率,或取值于若干个这,种区间的概率,。,30,(本科)第5章概率基础ppt课件,因此应当要求,a,X(,)b,或,X(,)b,或一般地,X(,),A,(其中,A,是由区间经并、交等运算而得到的直线上的某一个点集)有概率可言,既然只对概率空间(,,,F,,,P,)的事件域,F,中的集合才定义概率,因此我们自然要求上述集合属于,F,,即都是事件,。为此引进如下定义:,定义,5.4,X(,),是定义于概率空间(,,,F,,,P,)上的单值实函数,如果对于直线上任一点集,B,,有,:,X(,),B,F,则称,X(,),为随机变量,而,P,:,X(,),B,称为随机变量,X(,),的概率分布。,31,(本科)第5章概率基础ppt课件,定义,5.5,对于随机变量,,如果存在一个非负可积函数,(x),,,-,X,,使对于任意两个实数,a,,,b(ab),都有,则称,X,为连续型随机变量,,(x),就称为随机变量,X,的密度函数,满足性质:,(,1,),(x),0,x,(-,+,),(,5.20,),(,2,),(,5.21,),【,例,5-6,】,已知连续型随机变量,X,密度函数为,且,P,1X1.5,32,(本科)第5章概率基础ppt课件,解:,由概率密度的性质及其定义,有,即得到联立方程为,得到,33,(本科)第5章概率基础ppt课件,从而,那么,(三)一般场合的分布函数,随机变量是样本点的函数,因此在试验前我们只能知道它可能取哪些值,而不能确切知道它将取何值,这就是,随机性,。但是到了试验之后,它的取值也就明确了。为了计算概率,必须要求随机变量具有,可测性,,而分布函数则把对于随机变量的概率计算化为对分布函数的数值运算。这样一来,我们已经给随机变量予严格的定义,同时又为对它的研究准备了方便的分析工具。,34,(本科)第5章概率基础ppt课件,但是,除了前面得到的离散型和连续型的随机变量外,还存在其他类型的随机变量,就不能用离散型随机变量的分布列或者连续型随机变量的密度函数来描述,于是引入分布函数的概念。这是概率论中重要的研究工具,可以用于描述包括离散型和连续型在内的一切类型随机变量。,定义,5.6,设,x,是一个随机变量,,(x),是它的分布密度函数,则称函数,(,5.22,),为随机变量,X,的分布函数。,根据定义,,F(X),具有如下性质:,1.,(,5.23,),35,(本科)第5章概率基础ppt课件,针对连续型的随机变量有,2.,,,3.,F(X),是关于,x,的单调非减函数,4.,(,5.24,),5.,左连续性:,6.,(,5.25,),36,(本科)第5章概率基础ppt课件,【,例,5-7,】,已知随机变量,的密度函数为,求相应的分布函数,F(X),。,解:根据分布函数的定义知,,所以当 时,,当,时,,当,时,,37,(本科)第5章概率基础ppt课件,当,时,,综上可得随机变量,X,的分布函数为,38,(本科)第5章概率基础ppt课件,三、随机变量的数字特征,一个随机变量的分布包括了关于这个随机变量的全部信息,是对此随机变量最完整的刻画。但它并没有使我们对随机变量有一种概括性的认识。在很多情况下,为了突出随机变量在某个侧面的重点,我们常用由这个随机变量的分布所决定的一些常数,对该随机变量给出简单明了的特征刻画,这些常数被称为随机变量的“数字特征”。随机变量的数字特征是指能集中反映随机变量概率分布基本特点的数字。常用的随机变量数字特征有数学期望和方差两种。,39,(本科)第5章概率基础ppt课件,(一)数学期望,1.,离散型场合,现有,A,、,B,两个选手比赛投篮,他们的投球技术用下表表出:,A,选手,B,选手,试问哪一个选手的投篮技术较好?,这个问题的答案不是一眼看的出来。这说明分布列虽然完整地描述了随机变量,但是却不够“集中”地反映出它的变化情况。因此我们有必要找出一个新的指标来更集中、更概括地描述随机变量,这就是数学期望。,投中分数,1,2,3,投中分数,1,2,3,概率,0.3,0.3,0.4,概率,0.2,0.5,0.3,40,(本科)第5章概率基础ppt课件,那么要如何来计算数学期望呢?,求平均值是大家都很熟悉的一种运算。例如,一堆西瓜中有,2,个,4,公斤重,,3,个,2,公斤重,,4,个,6,公斤重,那这些西瓜的平均重量为,(,公斤,),注意到上式的计算公式是:瓜的各种重量乘以其所占的百分比然后求和。,同样以随机变量的各个取值为权数计算加权平均数作为该变量的数学期望。,41,(本科)第5章概率基础ppt课件,定义,5.7,设离散型随机变量,X,的分布为,记,X,的数学期望为,E(X),,则,(,5.26,),就如在上面的问题中,若使两个选手各投,N,次,则他们投中分数的期望值大约是:,甲:,1,0.3N+2,0.3N+3,0.4N=2.1N,乙:,1,0.2N+2,0.5N+3,0.3N=2.1N,平均起来甲每球投中,2.1,分,乙投中,2.1,分,这就看出,虽然选手,A,和,B,。投中各个分数的球的概率不相同,但最后两者的平均水平却是一样的。,42,(本科)第5章概率基础ppt课件,那当变量取值为可列个时,其数学期望定义如下:,定义,5.8,设离散型随机变量,X,的分布为,若级数,绝对收敛,则将其称为,X,的,数学期望,,简称,为期望或,均值,,记为,E(X),。,【,例,5-8,】,(彩票问题)彩票的中奖额巨大,对于购买者而言,实质,收益,如何呢?请看一则实例:发行彩票,10,万张,每张,1,元。设头奖,1,个,奖金,1,万元;二等奖,2,个,奖金各,5,仟元;三等奖,10,个,奖金各,1,仟元;四等奖,100,个,奖金各,1,佰元;五等奖,1000,个,奖金各,10,元。,43,(本科)第5章概率基础ppt课件,解:这里的分布列为,由此可以算出其获奖金额的期望值为,即平均来看,购买彩票这大约只能能收回一半的购彩票款。,44,(本科)第5章概率基础ppt课件,【,例,5-9】,(投资之决策)投资总具有一定风险,因此在选择投资方向时,计算其期望收益常是可代考虑的决策方法之一。现某人有,10,万元现金,想投资于某项目,预估,成功的机会为,30%,,可得利润,8,万元,失败的机会为,70%,,将损失,2,万元。若存入银行,同期间的利率为,5%,,问是否应作此项投资?,以,X,记投资利润,则,E(X)=8,0.3-2,0.7=1,(万元),而存入银行的利息为,10 5%,0.5,(万元),因此从期望收益的角度看,应选择投资,当然这里要冒一定的风险。,定义,5.9,设连续型随机变量,X,的密度函数为,(x),,当积分,绝对收敛时,就称它为,X,的数学期望(或均值),记作,E(X),,即,(,5.27),45,(本科)第5章概率基础ppt课件,【,例,5-10】,已知连续型随机变量,X,的密度函数为,求,随机变量,X,的数学期望。,解:根据数学期望的定义,可以得到,令,,,则,46,(本科)第5章概率基础ppt课件,3.,数学期望的基本性质,设如下各变量的数学期望存在,,c,为常数,可以得到关于数学期望的性质:,(,1,),(,5.28,),(,2,),(,5.29,),(,3,),(,5.30,),(,4,)若,相互独立,则,(,5.31,),47,(本科)第5章概率基础ppt课件,(二)方差,前面我们所讨论的数学期望是随机变量的一个重要数学特征,它表示了随机变量取值的平均水平,但是有些情况下,两个变量虽然具有相同的期望值,但实际上却有着很大的差别。就以前面投球的例子来说,两个选手的技术从各个分数的投中率来说是不一样的,但是他们的平均分数是相同的,那要怎么样才能区分这两位选手的技术水平呢?这就用了方差这个概念,它描述的是随机变量的取值,48,(本科)第5章概率基础ppt课件,相对于它的期望的平均偏离程度。,定义,5.10,设随机变量,X,的数学期望为,E(X),,称,为,X,的方差,记作,D(X),,即,(,5.32,),称,为,X,的标准差(或标准偏差)。,根据期望的性质,可以得到方差的另一个定义式。,(,5.33,),49,(本科)第5章概率基础ppt课件,因此也可以得到方差的几个基本性质:,(,1,),其中,c,为常数(,5.34,),(,2,),(,5.35,),(,3,),(,5.36,),(,4,),n,个独立随机变量平均值的方差等于各个变量方差平均值的,1/n,,即,(,5.37,),采用这个计算公式,我们可以看到,上面那个问题中,选手,A,射中分数的方差为,50,(本科)第5章概率基础ppt课件,同理,可以算出选手,B,投中分数的方差为,0.49,,比选手,A,的方差小,可以看出,A,的投中分数分散度较大,可见技术不如,B,来得稳定。这样就把两者的技术区分开来了。,解:依题意,十只元件中有两只废品,所以,X,的可能取值为,0,,,1,,,2,。,X=0,表示“第一次抽到的就是正品”,X=1,表示“第一次取到的是废品,第二次取到的是正品”,X=2,表示“第一次和第二次抽到的都是废品,而第三次取到的是正品”,于是可以计算,51,(本科)第5章概率基础ppt课件,那么得到,X,的概率分布为,所以,则,52,(本科)第5章概率基础ppt课件,(三)协方差与相关系数,前面我们所讨论的都是一个随机变量的数字特征,下面就要转到多维随机变量之间的关系来了。两个随机变量的相关性是概率论和数理统计的重要概念,是统计相关性最简单的形式之一,在二维随机变量之间一个重要的特征就是相关系数。随机变量相关性的分析,也就是相关分析,在经济问题中有重要的应用。,定义,5.11,设两个随机变量,X,和,Y,的期望和方差都存在,则称,(,5.38,),为,X,和,Y,的,协方差,。,下面是协方差的一些性质(假设下面各随机变量的协方差存在,且为常数),53,(本科)第5章概率基础ppt课件,(,1,),cov(X,Y),与,X,,,Y,的顺序无关,即,cov(X,Y)=cov(Y,X),(,2,)若,X,和,Y,独立,则,cov(X,Y)=0,证明:由于,如果,X,和,Y,独立,,则,于是有,cov(X,Y)=0,(,3,),(,4,),(,5,),54,(本科)第5章概率基础ppt课件,定义,5.12,设随机变量,X,和,Y,的方差都存在,且都不为,0,,则称,(,5.39,),为,X,和,Y,的,相关系数,。,同样我们可以列出相关系数的一些性质:,(,1,),(,2,),的充要条件是,为常数。,关于相关系数的内容,我们在后面的章节中还要详细介绍。,55,(本科)第5章概率基础ppt课件,第三节,几种常见的概率分布,离散型分布,连续型分布,56,(本科)第5章概率基础ppt课件,第三节,几种常见的概率分布,一、离散型分布,下面介绍几个常用的离散型随机变量及其概率分布。,(一)两点分布,在生活中有一些简单的试验,其结果只有两个,例如,掷一枚硬币(正面与反面)、检查一个产品(合格与不合格)、买一张彩票(中与不中)等等。我们就把这样的试验称为,伯努利试验,。,在一次试验中,事件,A,出现的概率为,P,,不出现的概率为,q=1-p,,若以,X,记事件,A,出现的次数,则,X,仅取,0,,,1,两个值,相应的概率分布为 ,这个分布称为两点分布,也称为伯努利分布。,57,(本科)第5章概率基础ppt课件,两点分布的数学期望为,(,5.40,),由于,则其方差为,(,5.41,),58,(本科)第5章概率基础ppt课件,(二)二项分布,二项分布是离散型分布中较为重要的一种,是上述伯努利试验重复进行的结果。在,重独立的伯努利试验中,重复进行,n,次试验,若记事件,A,为“试验成功”,其概率为,p,,以,X,记事件,A,出现的次数,则它是一个随机变量,,X,可能取的值为,0,1,2,n,,其对应的二项分布给出:,(,5.42,),简记作,。,59,(本科)第5章概率基础ppt课件,可以看出,前面所提到的伯努利分布就是,n=1,情况下的二项分布,也就相当于一次实验的结果。,利用二项式的展开式及方差的性质可以计算出分布的期望值及方差如下:,令,则上式可以化为,60,(本科)第5章概率基础ppt课件,这样可知,由于,61,(本科)第5章概率基础ppt课件,从而,【,例,5-12,】,一名射手打靶,命中率为,0.9,。在,6,次打靶中他命中靶的次数,X,是一个服从二项分布,B(6,,,0.9),的随机变量。求该射手至少命中,5,次的概率。,解:依题意得,,X,的概率分布为,则该射手至少命中,5,次的概率为,62,(本科)第5章概率基础ppt课件,(三)超几何分布,在统计检验中常常用到的方法就是抽样,例如产品的抽样检查就是经常遇到的一类实际问题,要对,N,件产品进行无放回抽样检查,若这批产品中有,M,件次品,现从整批产品中随机抽出,n,件产品,则在这,n,件产品中出现的次品数,X,是随机变量,它取值,0,1,2,n,,其概率分布为超几何分布。,这种抽样的方法就相当于抽样检查中的无放回抽样,而当我们采取有放回抽样时,就等价于,n,重伯努利试验,即,n,件,(,5.43,),63,(本科)第5章概率基础ppt课件,被检查产品中不合格品数 ,其中,。可以得到如下几何分布与二项分布的关系:,对于固定的,n,,当,时 ,有,在实际应用中,只要,N,10n,,就可以用二项分布近似地 描述产品抽样的不合格品数。,【,例,5-13,】,从积累的资料看,某工厂生产的产品中,一级品率为,85%,,现在从某天生产的,1000,件产品中,随机地抽取,20,件作检验,试求:,(,5.44,),64,(本科)第5章概率基础ppt课件,恰有,18,件一级品的概率,一级品不超过,18,件的概率,解:设,X,表示“,1000,件产品中一级品的个数”,由于,,1000,1020,,,因此可以近似地认为,则,而,65,(本科)第5章概率基础ppt课件,(四)泊松分布,泊松实验具有两个重要的特征:,第一,所考察的事件在任意两个长度相等的区间里发生一次的机会均等。,第二,所考察的事件在任何一个区间里发生与否和在其他区间里发生与否没有相互影响,即是独立的。,针对任何符合上述条件的泊松试验,可以定义一个只取非负整数的随机变量,X,,它表示“一定时间段或一定空间区域或其他特定单位内某一事件出现的次数”。如一定时间段内,某个航空公司接到的订票电话数;一匹布上发现的疵点数;一定页数的书刊上出现的错别字个数等等。诸如这样只取非负整数的随机变量服从的概率分布为,泊松分布,。,66,(本科)第5章概率基础ppt课件,定义,5.13,若随机变量,可取一切非负整数值,且,其中,,则称,X,服从泊松分布。简记作,。,可以证明,,是一定区间单位内随机变量,X,的数学期望或均值,e=2.71828,。,(,5.45,),67,(本科)第5章概率基础ppt课件,【例,5-14,】,实验器皿中产生,A,、,B,两类细菌的机会是相等的,且产生的细菌,X,服从参数为,的泊松分布。试求产生了,B,类细菌但没有产生,A,类细菌的概率。,解:依题意知,X,的分布律为,而这,k,个细菌全是,B,类细菌的概率为,,所以所求的概率为:,68,(本科)第5章概率基础ppt课件,二、连续型分布,由于密度函数刻画了一个连续型随机变量取值的统计规律性,因此随机变量按其密度不同可以是多种多样的。下面举一些常见的连续型分布的例子。,(一)均匀分布,对于只在区间,a,b,内取值的随机变量,其密度函数常用均匀分布来描述。,定义,5.14,如果随机变量,X,具有如下的密度函数:,则称,X,服从区间,a,b,上的均匀分布,记为,X,U,a,b,。,(,5.46,),69,(本科)第5章概率基础ppt课件,【例,5-15,】,已知随机变量,服从,0,b,上的均匀分布,且,试确定常数,b,及求出概率,。,解:依题意得,,X,的密度函数为,根据密度函数的定义,可以得:,70,(本科)第5章概率基础ppt课件,所以,于是,则该分布的期望及方差如下:,71,(本科)第5章概率基础ppt课件,(二)正态分布,正态分布是连续型分布中十分重要的一个。大量实践经验和理论分析表明,测量误差及很多产品的物理指标,如某种产品的长度、强度、强力等,都可以看作服从或近似服从正态分布,因此正态分布在概率论与数理统计乃至随机过程的理论及应用中,都占有特别重要的地位。下面我们就来看看它的定义。,定义,5.15,若随机变量,X,的密度函数为:,其中,0,,,与,均为常数,称随机变量,X,服从参数为,的,正态分布,(,normal distribution,)简记为,。,(,5.47,),72,(本科)第5章概率基础ppt课件,我们在例,5-10,给出来关于正态分布的期望,即,。正态分布的方差为,(,5.48,),这样我们知道,随机变量,,其随机变量的标准差为,。,73,(本科)第5章概率基础ppt课件,由上述的理论可以看出,不同的,值和不同的,值,,对应不同的正态分布。正态分布密度函数的图形如图,5-1,所示。,(,1,)正态曲线的图形是关于,x=,的对称钟形曲线,且峰值在,x=,处。,(,2,)正态分布的两个参数均值,和标准差,一旦确定,正态分布的具体形式也就惟一确定,不同参数取值的正态分布构成一个完整的正态分布族。,74,(本科)第5章概率基础ppt课件,(,3,)正态分布的均值,可以是实数轴上的任意数值,它决定正态曲线的具体位置,标准差,相同而均值不同的正态曲线在坐标轴上体现为水平位置。,(,4,)正态分布的标准差,为大于零的实数,它决定正态曲线的“陡峭”或“扁平”程度。,越大,正态曲线越扁平;,越小,正态曲线越陡峭。,(,5,)当,X,的取值向横轴左右无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相交。,(,6,)与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于,1,。,75,(本科)第5章概率基础ppt课件,特别地,当,=0,=1,时,分布称为标准正态分布,记为,N(0,1),,相应的密度函数和分布函数分别记为,(x),和,(x),。,服从标准正态分布的随机变量在某一区间上取值的概率可以通过书后所附的标准正态分布概率表查得。,有了标准正态分布后,就可以将任意一个服从一般正态分布的随机变量,X,N(,),转化成标准正态分布,N(0,1),,转换公式为,Z是一个标准正态分布的随机变量,即 Z,N(0,1),。,(,5.49,),(,5.50,),(,5.51,),76,(本科)第5章概率基础ppt课件,一般地,对于服从标准正态分布的随机变量,Z,,其变量在任何一个区间上的概率可以表示为,对于负的,Z,,可以由下式得到:,同样,对于服从一般正态分布的随机变量,X,,取值在某一个区间上的概率都可以通过标准正态分布求得。,(,5.52,),(,5.53,),(,5.55,),(,5.56,),77,(本科)第5章概率基础ppt课件,【,例,5-16,】,设 ,求以下概率。,(1)(2),(3)(4),(1),(2),(3),(4),78,(本科)第5章概率基础ppt课件,【,例,5-17,】,设,,求以下概率。,(1)(2),解:由于,,那么,(1),(2),79,(本科)第5章概率基础ppt课件,【,例,5-18,】,某种零件的长度服从正态分布,平均长度为,10,毫米,标准差为,0.2,毫米。试问,(,1,)这从该批零件中随机抽取一件,其长度不到,9.4,毫米的概率;,(,2,)为了保证产品质量,要求以,95,的概率保证该零件的长度在,9.5 10.5毫米之间,这一要求能否得到保证?,解:已知,(,1,),(,2,),即可以用,98.76%,的概率保证该批零件的长度在,9.5 10.5毫米之间,也就是,说该批零件的质量要求可以得到保证。,80,(本科)第5章概率基础ppt课件,第四节大数定律与中心极限定理,大数定律,中心极限定理,81,(本科)第5章概率基础ppt课件,第四节大数定律与中心极限定理,一、大数定律,人们在长期实践中发现,事件发生的频率具有稳定性,也就是说,随着试验次数的增多,事件发生的频率将稳定于一个确定的常数。另外,人们还从实践中认识到大量测量值的算术平均值也具有稳定性,即平均结果的稳定性。它表明无论随机现象的个别结果如何,或者它们在进行过程中的个别特征如何,大量随机现象的平均结果实际上不受随机现象个别结果的影响,并且几乎不再是随机的,大数定律以数学形式表达并证明了,在一定条件下的、大量重复出现的随机现象的统计规律性,即频率的稳定性与平均结果的稳定性,这就是大数定律的意义。,82,(本科)第5章概率基础ppt课件,大数定律,:设,为独立同分布的随机变量,其期望为,,方差为,,即,。则对任意的正数,0,,有,大数定律说明,当,n,充分大时,独立同分布的一系列随机变量,其平均数与它们共同的期望值之间的偏差,可以有很大的把握被控制在任意给定的范围之内。这里需要特别强调的是,由于从总体中抽出的样本是独立且与总体同分布的,因此,当样本容量,n,很大时,样本平均数与总体平均数之间的误差可以有很大的把握被控制在任意给定的要求之内,这就是人们用样本平均估计总体平均的理论依据。,(,5.57,),83,(本科)第5章概率基础ppt课件,如果我们对一个随机变量重复独立地观测,n,次(例如对某个物体的未知重量作,n,次测量),则其频率的稳定也可以由大数定律来描述,即设,m,是,n,次伯努利试验中事件,A,出现的次数,而,p,是事件,A,在每次试验中出现的概率,则对任意,0,,都有,该结论称为,伯努利大数定律,,它提供了用频率代替概率的理论依据。这里可以明确大数定律的重要意义。在随机试验中,观察现象是连同一切个别的特性来观察的,这些个别的特性往往蒙蔽了事物的规律性。但是大量的观察中个别因素的影响将相互抵消而使总体稳定。这种规律性正是通过大数来表现出来的。,(,5.58,),84,(本科)第5章概率基础ppt课件,同时,在现实生活中,人们所累积的经验表明,概率很接近于,1,的事件在一次实验中几乎一定要发生,而概率接近于,0,的事件几乎不可能发生。因此这类事件具有很重要的意义。大数定律就是要建立关于这类事件,尤其是大量独立试验中的事件发生之概率的规律性。伯努利大数定律就是建立了其概率的稳定性,从而使概率的概念有了客观的意义。而且可以通过这一定律做试验确定某事件发生的
展开阅读全文