1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十一章 概率与统计,【,复习目标,】,1.,了解,随机变量,离散型随机变量的,意义,会求,出某些简单的离散型变量的,分布列,.,2.,了解,离散型随机变量的期望、方差的,意义,,,会根据,离散型随机变量的,分布列求出期望和方差,.,3.,会用,简单随机抽样,、,系统抽样,、,分层抽样,方法从总体中抽取样本,.,4.,会,用样本,频率分布,估计总体,分布,.,5.,了解正态分布的,意义,及,主要性质,.,*,6.,了解线性回归的,方法,和,简单应用,.,1.,随机变量概念,如果随机试验的,_,可以用一个,_
2、来表示,那么这样的变量叫做,随机变量,.,随机变量常用希腊字母 等表示,.,(2),离散型随机变量,对于随机变量可能取的值,可以按,_,,这样的随机变量叫做,-.,随机变量可取,_,,这样的变量叫做,连续型随机变量,.,(3),连续型随机变量,11.1,离散型随机变量的分布列,2.,离散型随机变量的分布列:,为随机变量 的分布列,.,p,(1),设离散型随机变量,_,为,取每一个值,x,i,的,_,为 ,则称,(2),离散型随机变量 的分布列具有两个,性,质:,记作,_,,其中,n,,,p,为参数,,3.,常见特殊的离散随机变量分布列:,在,_,中,事件,A,发生的次数,是一个随机变量,其所
3、有可能取的值为,0,1,2,3,n,并且,(,其中,k,=0,1,2,n,,,q,=1-,p),(1),二项分布:,0,1,k,n,p,于是得到,的概率分布列如下:,我们称这样的随机变量,服从二项分布,,离散型分布列性质当然成立,(2),几何分布,在,n,项独立重复试验中,某事件,_,时所作的试验的次数,.,“,=,k,”,表示在,_,独立重复试验时事件,_,且,P(,=k)=,q,k,-1,p,(,其中,p,+,q,=1,k,=1,2,3,),则称,服从几何分布,,记作,服从几何分布,并记,1,2,3 k,P p,qp,q,2,p,q,k-1,p,4.,求离散型随机变量的概率分布的步骤:,(
4、1),找出随机变量,的,_,x,i,(i=1,2,3),(2),求出各取值的概率,P(,=x,i,)=P,i,(3)_,(1),若离散型随机变量,的分布列为,:,1.,期望,p,n,p,3,p,2,p,1,P,x,n,x,3,x,2,x,1,则称,E,=_,为,的,数学期望,简称期望,.(,或,平均数、均值,),(2),离散型随机变量的期望反映了离散型随机变量,取值的,_,.,(3),数学期望的性质:,E(c,)=_,E(,a,+,b,)=_,(,a,b,c,为常数,),11.2,离散型随机变量的期望和方差,(1),若离散型随机变量,的分布列为,:,2.,期望,p,n,p,3,p,2,p,1,
5、P,x,n,x,3,x,2,x,1,(2),离,散型随机变量的方差反映了,取值的,_,.,(3),方,差的性质,:,设,a,b,为常数,则,D(,a,+,b,)=_,;,D(,a,)=_,标准差,:,标准差用来描述,的分散程度,.,称为随机变量,的方差。,D,=,3.,二项分布、几何分布的期望与方差,(1),若,B(,n,p,),,则,E,=_,,,D,=_,(2),若,服从几何分布,则,(,其中,p,+,q,=1),4.,离散型随机变量的分布列、期望、方差之间联系,(1),计算顺序:,_,(2),概念的联系:期望和方差是从整体和全局的层面分别描述随机变量取值的平均水平和平均偏离程度,它们却离
6、不开概率的思想,.,_,1.,简单随机抽样,一般地,设一个总体的个体数为,N,如果通过,_,抽取的方法从中抽取一个样本,且,_,时各个个体被抽到的概率相等,就称这样的抽样为,简单随机抽样。,(1),简单随机抽样的概念,:,(2),简单随机抽样的方法:,_,(3),用随机数表进行抽样的三个步骤:,第一步,:,将总体中的个体,_,;,第二步,:_,;,第三步,:,获取样本号码,.,一、随机抽样、系统抽样和分层抽样,11.3,抽样方法、总体分布的估计,2,,系统抽样,当总体中的个体数,_,时,将总体,分成均衡,的几个部分,然后按照预先定出的规则,从每一部分抽取,_,得到所需要的样本,这种抽样叫做,系
7、统抽样,.,(1),系统抽样的概念,:,(2),系统抽样的步骤可概括为:,采用随机的方式将总体中的个体,_,。,将整个的编号进行,_,。,在第,1,段用,_,确定起始的个体编号,l.,按照事先确定的规则抽取样本。,通常是将,l,加上间隔,k,,再加间隔,k,直到取够样本。,3.,分层抽样,当已知总体由,_,的几部分组成时,为了使样本更充分地反映总体的情况,常将总体,_,然后按照各部分所占的,_,进行抽样,这种抽样叫做,分层抽样,其中所分成的各部分叫做,层,4.,分层抽样,与,简单随机抽样,系统抽样,的联系在于:,将总体分成几个层后进行抽样时,采用的是简单随机抽样或系统抽样,(1),分层抽样的概
8、念,:,(2),分,层抽样的抽取步骤:,根据总,体与样本容量确定,_,。,确,定各层抽取的,_,。,各层中采用,_,或,_,的方法抽取。,类别,共同点,各自特点,相互关系,适用范围,简单随机抽样,系统抽样,分层抽样,5.,三种抽样方法的比较,抽样过程中每个个体被抽到的概率相等,从总体中逐个抽取,将总体均分几部分,按事先确定的规则在各部分抽取,1,个,将总体分成几层,分层进行抽取,在起始部分抽样时采用简单抽取,各层抽样时采用简单随机抽样或系统抽样,二、利用样本频率估计总体分布,频率分布表,:,由所取的样本的,_,及相应的,_,表示,其几何表示就是相应的条形图,.,由于总体分布通常不易知道,我们往
9、往是用,_,分布去估计,_.,一般地,_,越大,估计就越精确,.,数出落在各小组内的数据的个数,即频数,,每小组的频数与样本容量的比值叫做这一小组的频率,,算出各小组的频率,填入表中,这个表叫做频率分布表,.,(2),求一组数据的频率分布,分三步进行:,(1),频率分布条形图:,适用,:,当总体中的个体取不同数值很少时,.,结果,正面向上,0,反面向上,1,频数,36124,35964,频率,0.5011,0.4989,图,1-1,频率分布表或频率分布条形图,抽取的容量为,72088,频率分布条形图,XX,条形图,横轴表示事件,D,A,B,C,阴影面积没有意义,纵轴表示事件的某项,(xx),水
10、平,为了将频率分布表中的结果直观形象地表示出来,常画出频率分布直方图,画图时,应以,横轴表示,_,,,纵轴表示,_,的比值,,,以每个组距为,_,,,以各频率除以组距的商为,_,分别画成矩形,,这样得到的直方图就是频率分布直方图,.,图中每矩形的面积等于相应组的频率,即,组距,=,频率,,各组频率的和等于,_,,因此,各小矩形的面积的和等于,1.,(3),频率分布直方图:,4,6,横轴表示,_,变量,阴影面积表示,_,纵轴表示,_,直方图,例:已知,100,件零件的尺寸统计如下:,画频率分布直方图的步骤:,2.,计算最大值与最小值的差,:,25.56-25.24=0.32(,极差,),3.,决
11、定组距与组数,:,4.,列出频率分布表,5.,画出频率分布图,P27,当数据在,100,个以内时,按数据多少常分,5-12,组。,分,11,个组,,1,决定数据的分点,使分点比数据多,1,位小数,并且把第一组的起点稍微减少一点,(,通常是取半,),后面新分点加组距得到,.,4,6,以,25.355,,,25.385,)为例,从实际意义看;,长,宽,=,面积,对一组数据进行整理,可以得到它的频率分布,如果这组数据是从一个总体中抽取的一个样本,那么这个频率分布又称为,_.,通常可以根据,样本的频率分布估计总体分布,当样本容量无限增大,频率分布直方图就会趋近于一条光滑曲线,即总体分布的概率密度曲线,
12、4),用样本频率分布估计总体分布,图,1,2,表明,:,总体越大,设想样本容量无限增大,分组组距无限缩小,,则直方图无限接近一条光滑曲线,-,总体密度曲线,频率越接近概率,需要样本容量越大,分组越多,4,6,总体密度曲线:反映了各个范围内取值的概率;面积,=1,离散型通过分布列反映总体;,连续型通过密度曲线反映总体;,样本容量越大,所分组数越多,各组的频率就越接近于各组取值的概率设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做,总体密度曲线,离散型随机变量的概率分布是通过,_,反映的。,连续型随机变量的概率分布是通过,_,反映的。,总体
13、密度曲线,O,x,y,频率,组距,11.4,正态分布,中间高,两头低,左右对称,总体密度曲线一般可用下面函数近似表示:,这是生活中许多随机现象都服从或近似服从的分布,-,正态分布,式中的实数,、,(,0),是参数,分别表示,总体平均数,与,标准差,,,其中,是圆周率;,e,2.71828,是自然对数的底;,x,是随机变量的取值;,正态分布由参数,、,唯一确定,正态分布常记作,N(,、,2,),。,函数,f(x,),称为,正态函数,,,f,(,x,),的图象称为,正态曲线,这个总体是有无限容量的抽象总体,其分布叫做,正态分布,。,(2)=0,=1,时,(3),=1,=2,时,(1),=,-,1,
14、0.5,时,例,1:,根据给出的均值,和标准差,写出正态总体的函数表达式。,(1),=,-,1,=0.5,时,(2)=0,=1,时,(3),=1,=2,时,(1),曲线在,x,轴的,上方,,与,x,轴,不相交,(2),曲线关于直线,x,=,对称,(3),当,x,=,时,曲线位于,最高点,(4),当,x,时,曲线下降,(,减,函数,),并且当曲线向左、右两边无限延伸时,以,x,轴为,渐近线。,(5),一定时,曲线的形状由,确定,越大,,曲线越“,矮胖,”,总体分布,越分散,;,越小,,曲线越“,瘦高,”,总体分布,越集中。,正态曲线的性质:,其相应的曲线称为,标准正态曲线。,标准正态曲线,:,
15、当,=0,、,=l,时,正态总体称为,标准正态总体,,其相应的函数表示式是:,小结:,标准正态总体,N(0,,,1),在正态总体的研究中占有重要的地位,.,任何正态分布的概率问题,均可转化成标准正态分布,的概率问题。,专门制作了“标准正态分布表”,P65,。,例:在标准正态总体,N(0,,,1),中,(x,0,),指总体取值小于,x,0,的概率,即,0.9788,怎样查表?,由于标准正态曲线关于,y,轴对称,,(3),任意区间,(x,1,x,2,),内取值的概率?,怎样查表?,练习:,P37,练习题,1,1,利用正态分布表,求,标准正态总体,在下面区间的概率。,一般的正态总体,N(,2,),均
16、可以化成标准正态总体,N(0,1),来进行研究,.,例:对于正态总体,N(1,4),,取小于,3,的概率,?,练习:,P37,练习题,2,2.,利用标准正态分布表,求正态总体,N(2,2,2,),在下面区间的概率,例,3.,若,x,N(0,1),求,(1)P(,2.32x1.2),(2)P(x,2).,例,4.,服从正态分布,N(1,4),,试求,P(2,0),是参数,分别表示,总体平均数,与,标准差,,,其中,是圆周率;,e,2.71828,是自然对数的底;,x,是随机变量的取值;,正态分布由参数,、,唯一确定,正态分布常记作,N(,、,2,),。,函数,f(x,),称为,正态函数,,,f,
17、x,),的图象称为,正态曲线,这个总体是有无限容量的抽象总体,其分布叫做,正态分布,。,(2)=0,=1,时,(3),=1,=2,时,(1),=,-,1,=0.5,时,例,1:,根据给出的均值,和标准差,写出正态总体的函数表达式。,(1),=,-,1,=0.5,时,(2)=0,=1,时,(3),=1,=2,时,(1),曲线在,x,轴的,上方,,与,x,轴,不相交,(2),曲线关于直线,x,=,对称,(3),当,x,=,时,曲线位于,最高点,(4),当,x,时,曲线下降,(,减,函数,),并且当曲线向左、右两边无限延伸时,以,x,轴为,渐近线。,(5),一定时,曲线的形状由,确定,越大,,曲
18、线越“,矮胖,”,总体分布,越分散,;,越小,,曲线越“,瘦高,”,总体分布,越集中。,正态曲线的性质:,其相应的曲线称为,标准正态曲线。,标准正态曲线,:,当,=0,、,=l,时,正态总体称为,标准正态总体,,其相应的函数表示式是:,小结:,标准正态总体,N(0,,,1),在正态总体的研究中占有重要的地位,.,任何正态分布的概率问题,均可转化成标准正态分布,的概率问题。,专门制作了“标准正态分布表”,P65,。,例:在标准正态总体,N(0,,,1),中,(x,0,),指总体取值小于,x,0,的概率,即,0.9788,怎样查表?,由于标准正态曲线关于,y,轴对称,,(3),任意区间,(x,1,
19、x,2,),内取值的概率?,0.0080,=0.8185,怎样查表?,练习:,P37,练习题,1,1,利用正态分布表,求,标准正态总体,在下面区间的概率。,一般的正态总体,N(,2,),均可以化成标准正态总体,N(0,1),来进行研究,.,例:对于正态总体,N(1,4),,取小于,3,的概率,?,练习:,P37,练习题,2,2.,利用标准正态分布表,求正态总体,N(2,2,2,),在下面区间的概率,=,l,0.9772=0.0228,.,例,3.,若,x,N(0,1),求,(1)P(,2.32x1.2),(2)P(x,2).,解:,(1)P(,2.32x1.2)=,(1.2),(,2.32),=,(1.2),1,(2.32),=0.8849,(1,0.9898)=0.8747,(2)P(x,2)=1,P(x2),=1,(2),例,4.,服从正态分布,N(1,4),,试求,P(2,5),=,0.97720.6915=0.2857,=,(2)(0.5),巩固练习,






