资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第五章 统计推断的理论基础,统计推断就是根据样本所提供的信息,运用概率的理论,在一定的可靠程度上对总体的分布特征进行估计和推测的方法。,第一节 统计推断的基本问题,许多实际问题都可以抽象为对总体参数的求取或验证,都可以抽选适当的样本作为总体的代表,并以样本的数据信息去推断总体的统计特征。,例如,验血;汽车产品碰撞性试验;多媒体辅助教学效果等。,统计推断的目标要求,目标,通过选取适当的样本作为总体的代表,去推断总体的统计特征。,要求,样本要对总体有良好的代表性。,关键,找到样本与总体的特定关系,并用数学语言表达出来,也就是要建立数学模型。,一、随机现象与随机事件,随机现象是指,当一定条件具备时,某种结果,可能出现也可能不出现的现象。例如,小麦种子在播种后可能发芽也可能不发芽。,随机现象的每一个可能结果称为随机事件。随机事件一般用大写字母,A,,,B,,,C,,,表示。,例如:,A,到十字路口恰好遇到红灯;,B,恰好抽到一张草花,C,考试分数在,90,到,100,之间,例题:,抛掷三枚硬币试验,随机事件,A,出现三个正面,B,出现二正一反,C,出现一正二反,D,出现三个反面,博弈规则,A,、,D,为甲组,,B,、,C,为乙组,,任意选一组。,抛掷三枚硬币,出现哪一个组的结果(事件),押中者为赢。,问题与思考,随机事件虽然带有偶然性,但出现的可能性大小是不一样的。有些事件比较容易发生,有些结果却很难出现。怎样才能描述这种随机现象的规律呢?,二、概率,(probability),(一)概率的定义,随机事件发生的可能性大小称为概率。,某一事件,A,发生的次数,m,与总次数,n,之比被定义为该事件,A,发生的概率。,记为:,P(A)=m/n,(二)概率的性质,概率,P,(,A,),的取值范围:,0,,,1,P,(,A,),=1,,表示必然事件;,P,(,A,),=0,,表示不可能事件;,P,(,A,),0,,表示小概率事件。(“小概率原理”),(三),概率的加法和乘法,概率的加法定理两个互不相容事件,A,、,B,之和的概率,等于两个事件概率的和。即,P,(,A,B,),P,(,A,),P,(,B,),概率的乘法原理两个独立事件同时出现的概率等于这两事件概率的乘积。即:,P,(,AB,),P,(,A,),P,(,B,),三、随机变量,用以记录各种随机事件的变量称为随机变量,通常用,X,、,Y,来表示。,例如:种子发芽数,X,;考试分数,Y,;三枚硬币出现的结果,Z,。,(一)离散型随机变量,若随机变量,X,只可能在有限个点上取值,则称,X,为离散型随机变量。,(二)连续型随机变量,若随机变量,X,在一个实数区间上可以连续取值,且存在一个实函数 ,使得对任一区间,(a,,,b),,有,则称,X,为连续型随机变量,称为,X,的概率密度函数。,四、概率分布,要掌握随机变量的变化规律,首先要了解它可能取什么值,其次,还要知道取这些值的概率大小。,概率分布就是描述随机变量统计规律的重要工具。,一个赌博实例,口袋中有,8,黑,8,白共,16,个玻璃球,从中随机抽取,8,个玻璃球,如果刚好抽到,4,黑,4,白,庄家赢,其他任何情况,庄家都会不同程度的输。,经过计算,找规律,X,w,8,w,7,b,w,6,b,2,w,5,b,3,w,4,b,4,w,3,b,5,w,2,b,6,wb,7,b,8,P,(,X,),1/12870,0.5%,6%,24%,38%,24%,6%,0.5%,0.0078%,概率分布的类型,概率分布是针对着随机变量而言的。,一个离散型随机变量的概率分布是指这个随机变量所有取值点的概率的分布情况。,一个连续型随机变量的概率分布是指这个随机变量,在定义域上的各个区间内取值的概率分布情况。,离散变量的概率分布,离散型随机变量的概率分布列,变量,y,i,y,1,y,2,y,3,y,n,概率,p,(,y,),P,1,P,2,P,3,P,n,二项分布,二项分布是一种典型的离散型随机变量的概率分布,实际应用不多,留作大家看书自学。,连续变量的概率分布,若已知连续型随机变量的密度函数,f(x),,则通过定积分可求得连续型随机变量在某一区间的概率。,连续变量的概率分布示例,X,P,80,85,75,80,70,75,65,70,60,65,55,60,0.03,0.12,0.25,0.38,0.17,0.05,合计,1.00,第三节 正态分布及其应用,正态分布最初由高斯在研究误差理论时发现,其特点是随机变量在变化范围的中部取值的概率最大,从中部到两侧取值的概率逐渐下降,并趋于零。,例如:考试分数、身高、智商等,正态分布的密度函数,一般正态分布,其密度函数可写成以下形式:,式中:,X,为连续性随机变量;,e,是自然对数的底;,是圆周率;,为这个分布的平均数;,为这个分布的标准差。由此可见,正态分布是由它的平均数和标准差惟一决定的,因此我们也常记一个正态分布为,N(,,,),。,正态分布曲线,正态分布的特点,正态分布的图形和密度函数,可以分析出以下几个特点,:,1.,正态分布曲线图,形若“古钟”。,2.,正态分布图左右对称。,3.,决定曲线在坐标轴上的位置,决定图形的形状,大曲线扁平,小曲线尖峭。,正态分布曲线位置的变化,正态分布曲线形态的变化,标准正态分布,将一般正态分布作转换:,得到标准正态分布。,标准正态分布图,-3 2 1 0 1 2 3,标准正态分布表的使用,本书附表,1,就是标准正态分布表。表头中,Z,是标准分数的取值,表中的数据是正态分布图中阴影部分的面积,也就是随机变量取值从零到所查,Z,值之间的概率。,标准正态分布表,P,值示意图,例题,1,(,1,),P,(,0,Z,1.15,),=0.37493,(,2,),P,(,-0.54,Z,0.82,),=,P,(,0,Z,0.54,),+,P,(,0,Z,0.82,),=0.20540+0.29389,=0.49929,(,3,),P,(,0.25,Z,0.97,),=,P,(,0,Z,0.97,),P,(,0,Z,0.25,),=0.33398+0.09871,=0.23527,正态分布的一个重要性质,如果,X,N(,),则,P(-X +)=68,P(-1.96 X+1.96)=95,P(-2.58 X+2.58)=99,正态分布图,正态分布的应用,(,一,),求正态分布中一定区间的个体数量,(,二,),求正态分布中一定数量个体所占有的区间,例题,2,已知一项考试的成绩服从平均数,82,标准差为,8,的正态分布,问成绩落在,80,90,分之间考生占多大比例?,解:此题实质上求成绩落在,80,分和,90,分之间的概率。必须先把原始分转化成标准分:,Z,1,=-0.25,,,Z,2,=1,通过画示意图,可以发现我们所求的是两块可查表面积的和:,P,(,Z,1,Z,Z,2,),=,P,(,-0.25,Z,1,),=,P,(,0,Z,0.25,),+,(,0Z30,),,T,分布与标准正态分布近似。,所以,T,分布常常用于样本容量小于,30,的小样本,故也称,T,分布理论为小样本理论。,T,分布图,T,分布概率表(附表,2,),查,T,分布概率表时,按自由度及相应的概率去找到对应的,t,值。例如,T,0.05,(8),的查表方法就是,在第一列找到自由度,8,这一行,在第一行中找到概率,0.05,这一列,行列的交叉处即是,2.306,。,(二)卡方(,2,)分布,若,n,个相互独立的随机变量,1,,,2,,,,,n,,均服从标准正态分布,则这,n,个服从标准正态分布的随机变量的平方和,2,i,构成一新的随机变量,其分布规律称为,2,(n),分布,其中参数,n,称为自由度,自由度不同就是另一个,2,分布。,2,分布在一象限内,呈正偏态,随着参数,n,的增大,,2,分布趋近于正态分布。,卡方(,2,)分布图,2,分布表(附表,12,),查,2,分布概率表时,按自由度及相应的概率去找到对应的,2,值。如图所示的单侧概率,2,0.05,(7)=14.1,的查表方法就是,在第一列找到自由度,7,这一行,在第一行中找到概率,0.05,这一列,行列的交叉处即是,14.1,。,(三)分布,F,分布是由两个卡方分布构造而成的一个新的分布。若随机变量,,F=S,1,2,/S,2,2,,则,F,函数的分布规律称为,F(n,1,n,2,),分布,其中参数,n,1,、,n,2,是两个自由度,任意一个自由度不同就是另一个,F,分布。,F,分布在一象限内,呈正偏态,随着两个自由度的增大,趋近于正态分布。,分布图,F,分布概率表(附表,3,),附表,3,是,F,分布的双侧概率表,只给出了两个概率值(这里用,表示),,0.05,和,0.01,,编表规则如图所示:,一般要求分子的方差大于分母的方差。,思考与练习,什么是统计推断,什么是概率分布,正态分布有哪些特点,中心极限定理有什么意义,
展开阅读全文