资源描述
,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四章 正态总体的抽样分布,正态分布,(normal distribution),由,C.F.,高斯,(,Carl Friedrich Gauss,,,1777,1855,),作为描述误差相对频数分布的模型而提出,描述连续型随机变量的最重要的分布,许多现象都可以由正态分布来描述,可用于近似离散型随机变量的分布,例如:二项分布,经典统计推断的基础,x,f,(,x,),概率密度函数,f,(,x,)=,随机变量,X,的频数,=,正态随机变量,X,的均值,=,正态随机变量,X,的方差,=3.1415926,;e=,2.71828,x,=,随机变量的取值,(-,x,+,),正态分布函数的性质,图形是关于,x,=,对称钟形曲线,且峰值在,x,=,处,均值,和标准差,一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”,均值,可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的,“,陡峭,”,或,“,扁平,”,程度,。,越大,正态曲线扁平;,越小,正态曲线越高陡峭,当,X,的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于,1,和,对,正态曲线的影响,x,f,(,x,),C,A,B,=1/2,1,2,=1,一,样本均值的抽样分布,第一节 抽样分布的概念,在重复选取容量为,n,的样本时,由样本均值的所有可能取值形成的相对频数分布,一种理论概率分布,推断总体均值,的理论基础,样本均值的抽样分布,样本均值的抽样分布,(,例题分析,),【,例,】,设一个总体,,含有,4,个元素,(,个体,),,即总体单位数,N,=,4,。,4,个个体分别为,x,1,=1,,,x,2,=2,,,x,3,=3,,,x,4,=4,。,总体的均值、方差及分布如下,总体分布,1,4,2,3,0,.1,.2,.3,均值和方差,样本均值的抽样分布,(,例题分析,),现从总体中抽取,n,2,的简单随机样本,在重复抽样条件下,共有,4,2,=16,个样本。所有样本的结果为,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二个观察值,第一个,观察值,所有可能的,n,=2,的样本(共,16,个),样本均值的抽样分布,(,例题分析,),计算出各样本的均值,如下表。并给出样本均值的抽样分布,3.5,3.0,2.5,2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个,观察值,16,个样本的均值(,x,),x,样本均值的抽样分布,1.0,0,0.1,0.2,0.3,P,(,x,),1.5,3.0,4.0,3.5,2.0,2.5,样本均值的分布与总体分布的比较,(,例题分析,),=2.5,2,=1.25,总体分布,1,4,2,3,0,.1,.2,.3,抽样分布,P,(,x,),1.0,0,.1,.2,.3,1.5,3.0,4.0,3.5,2.0,2.5,x,样本均值的抽样分布与中心极限定理,=50,=10,X,总体分布,n,=4,抽样分布,x,n,=16,当总体服从正态分布,N,(,2,),时,来自该总体的所有容量为,n,的样本的均值,x,也服从正态分布,,x,的期望值为,,,方差为,2,/,n,。,即,x,N,(,2,/,n,),中心极限定理,(,central limit theorem,),当样本容量足够大时,(,n,30),,,样本均值的抽样分布逐渐趋于正态分布,从均值为,,,方差为,2,的一个任意总体中抽取容量为,n,的样本,当,n,充分大时,样本均值的抽样分布近似服从均值为,、,方差为,2,/,n,的正态分布,一个任意分布的总体,x,中心极限定理,(,central limit theorem,),x,的分布趋于正态分布的过程,在重复选取容量为,n,的样本时,由样本比例的所有可能取值形成的相对频数分布,一种理论概率分布,当样本容量很大时,样本比例的抽样分布可用正态分布近似,即,二、样本比例的抽样分布,第二节,正态分布及其三大统计量抽样分布,样本,统计量,抽样分布,包含了各种有用信息,集中、提炼数据中包含的有用信息,它们是随机变量,必须确定其分布,称为抽样分布,来自标准正态总体的抽样分布,主要讨论:,来自一般正态总体的抽样分布,分布 分布 分布,五个抽样分布定理,随着自由度的增加曲线重心向右下方移动,(一),-分布,是来自总体,设,的样本,令,称 服从,自由度,为 的,分布,,记为,分布的密度函数及图形,伽马函数,分布的可加性,且 相互独立,则,设,推广:,且,设,相互独立,则,于是,理解为可独立变化的,r.v,个数,则,设,取,个独立同分布 的,则 与,同分布,分布的数学期望与方差,随着自由度的增加曲线越来越趋近,(二),分布,且,设,相互独立,令,称 服从,自由度,为 的,分布,,记为,分布的密度函数及图形,易知:,利用伽马函数的斯特林公式,即,故当 较大时,可认为,英国统计学家兼化学家戈塞特,(,Gosset,W S 1876-1937,),于,1908,年,用笔名,Student,发表了关于,t,分布的论文,这是一篇在统计学发展史上划时代的文章,它创立了小样本代替大样本的方法,开创了现代统计学的新纪元,.,Gosset,Student,的最后一个字母都是,t,故取名为“,t,分布”,又称为“学生氏分布”,.,-分布是怎样产生的,(三),分布,且,设,相互独立,令,称 服从,自由度,为 的,分布,,记为,分布的密度函数及图形,分布的重要性质,若,则,分布是为了纪念著名统计学家,费歇耳,(,R.A.Fisher,1890-1962,),而命名,(四),抽样分布定理,最重要的总体:,问题,question,如何由样本 推断,分析:,对 的推断是通过构造统计量实现的,如何构造,“,好,”,的统计量,服从什么分布?,统计推断中最重要的结论:,五个抽样分布定理,仍服从正态分布,且,定理一,的样,设,是来自总体,本,则,独立同分布,由正态分布的性质知,线性组合,定理二,的样本,,设,是总体,分别为样本均值和样本方差,则有,相互独立,分析,(证略),定理三,的样本,,设,是总体,分别为样本均值和样本方差,则有,由定理一、定理二有,且 与 独立,,由 分布的定义有,结果分析,即“平均”说来 与 的差别不大,故可用 “代替”,两个未知参数,一个未知参数,定理四,的样本;,设,是总体,的样本,且两样本相互独立,是总体,两样本均值和样本方差分别为,则,由定理二,有,因两样本独立,故 独立,定理五,的样本;,设,是总体,的样本,且两样本相互独立,是总体,两样本均值和样本方差分别为,则,其中,且 相互独立,又,由 的独立性及 分布的可加性有,由两样本的独立性及 分布的定义有,面积为,则称 为分布密度 的,上 分位点,上 分位点,设,若,存在常数 满足,的上 分位点记为,则称 为分布密度 的,上 分位点,设,若,存在常数 满足,的上 分位点记为,查标准正态分布表,可求得,上 分位点,则称 为分布密度 的,上 分位点,设,若,存在常数 满足,的上 分位点记为,查,t,分布表,可求得,上 分位点,则称 为分布密度 的,上 分位点,设,若,存在常数 满足,的上 分位点记为,查,分布表,可求得,Fisher,曾证明,:,当,n,充分大时有,上 分位点,则称 为分布密度 的,上 分位点,设,若,存在常数 满足,的上 分位点记为,查,分布表,可求得,若 则,故,三反公式,上 分位点,
展开阅读全文