资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,解,(,1,),样本的,似然函数,为,当,0,x,i,0,X,1,X,2,X,n,是取自总体,X,的一组样本,求,的极大似然估计量与矩估计量,.,其中,0,为未知参数,例,设总体,X,的密度为,故有,对数似然函数,:,对,求导并令其为,0,可得,似然方程,:,=,0,解得,极大似然估计量,:,令,(,2,),解得矩估计量:,而区间估计正好弥补了点估计的这个缺陷,.,无偏性,有效性,一致性,估计量的期望值等于未知参数的真值,.,为了使估计的结论更可信,需要引入区间估计,.,评选标准,方差更小的无偏估计量,.,样本,k,阶原点矩,是,总体,k,阶原点矩,的无偏估计量,;,样本方差,S,2,是总体方差,2,的无偏估计量,;,无偏估计量的函数未必是无偏估计量,在,的所有线性无偏估计量中,样本均值,X,是最有效的,.,参数的点估计是用样本算得的一个值去估计未知参数,.,使用起来把握不大,.,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,.,若我们根据一个实际样本得到鱼数,N,的极大似然估计为,1000,条,.,一个可以想到的估计办法是:若我们能给,出一个区间,并告诉人们该区间包含未知参数,N,的可靠度,(,也称置信系数,).,但实际上,N,的真值可能大于,1000,条,也可能小于,1000,条,.,7.3,单个正态总体均值与方差的置信区间,也就是说,给出一个区间,使我们能以一定的可靠度相信区间包含参数,。,湖中鱼数的真值,这里所说的,“,可靠程度,”,是用概率来度量的,称为,置信概率,,,置信度,或,置信水平,.,习惯上把置信水平记作,1,-,这里,是一个很小的正数,.,譬如,在估计湖中鱼数的问题中,根据置信水平,1,-,可以找到一个正数,例如,通常可取置信水平,=0.95,或,0.9,等等,.,根据一个实际样本,由给定的置信水平,1,-,我们求出一个的区间,使,置信水平的大小是根据实际需要选定的,.,如何寻找这种区间?,使得,我们选取未知参数的某个估计量,只要知道,的概率分布就可以确定,.,下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法,.,由不等式,可以解出,:,这个不等式就是我们所求的,置信区间,代入样本值所得的普通区间称为,置信区间的实现,.,1,)为两个统计量(由样本完全确定的已知函数);,X,1,X,2,X,n,是取自总体,X,的样本,对给定值,0,1,满足,定义,4,设,是总体,X,的待估参数,分别称为,置信下限,和,置信上限,.,一、置信区间的概念,则称随机区间,为,的,置信水平为,1,-,的双侧置信区间,.,若统计量,和,置信度 置信概率,2,)是随机区间,并非一个实现以,1,-,的概率覆盖了,要求置信区间的长度尽可能短,.,估计的可靠度:,即,P,(,),=,1,-,要尽可能大,.,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度,.,估计的精度:,即要求区间置信的长度尽可能短,或能体现该要求的其它准则,.,要求,以很大的可能被包含在置信区间内,.,要求估计尽量可靠,.,置信水平的概率意义:,置信水平为,0.95,是指,100,组样本值所得置信区间的,实现,中,约有,95,个能覆盖,而不是一个,实现,以,0.95,的概率覆盖了,.,估计要尽量可靠,估计的精度要尽可能的高:,只要知道,的概率分布,就可以确定,.,如何根据实际样本,由给定的置信水平,1,-,求出一个区间,使,根据置信水平,1,-,可以找到一个正数,二、置信区间的求法,(,一,),单个正态总体,1.,均值,(,1,),已知方差,2,1.,均值,1,-,2,(,1,),已知方差,1,2,2,2,(,二,),两,个正态总体,2.,方差,2,(,2,),未知方差,2,使得,我们选取未知参数的某个估计量,由不等式,可以解出,:,这个不等式就是我们所求的置信区间,分布的分位数,(,1,),已知均值,(,2,),未知均值,(,2,),未知方差,1,2,2,2,2.,方差,1,2,/,2,2,(,1,),已知均值,1,2,(,2,),未知均值,1,2,但相等,!,对于给定的置信水平,根据估计量,U,的分布,确定,一个区间,使得,U,取值于该区间的概率为置信水平,.,X,S,2,分别是其样本均值和样本方差,X,N,(,2,/,n,),求参数,、,2,的置信水平为,1,-,的置信区间,.,设,X,1,X,n,是总体,X,N,(,2,),的样本,确定未知参数的,估计量及其函数的分布,是,的无偏估计量,由分布求分位数,即得置信区间,(,一,),单个正态总体,置信区间的求法,(,1,),已知,方差,2,时,故可用,X,作为,EX,的一个估计量,N,(,0,1,),对给定的置信度,1,-,按标准正态分布的双侧,分位数的定义,查正态分布表可得,u,/,2,由,u,/,2,确,定置信区间,有了分布就可求出,U,取值于任意区间的概率,简记为,由抽样分布定理知,1.,均值,的置信区间,是求什么参数的置信区间,?,置信水平,1,-,是多少,?,1.,寻找未知参数,的一个良好的点估计量,(,X,1,X,2,X,n,),;,确定待估参数估计量,函数,U,(,),的分布,;,求置信区间首先要明确问题:,2,.,对于给定的置信水平,1,-,由概率,(,),就是,的,100,(,1,-,),的置信区间,.,一般步骤如下,:,3.,由分位数,|,U,|,x,确,定置信区间,(,),.,查表求出分布的分位数,x,总体分布的形式是否已知,是怎样的类型,至关重要,.,某乡农民在联产承包责任制前人均纯收入,X,(,单位,:,元,),求,的置信水平为,0.95,的置信区间,.,推行联产承包责任制后,在该乡抽得,n,=16,的样本,且,X,N,(,25,2,).,解,由于,=0.05,查正态分布表得,例,1,得,x,=325,元,假设,2,=,25,2,没有变化,即得置信区间,(,312.,75,337.,25,),.,同一置信水平下的置信区间不唯一,如在上例中取,=,0.,01,+0.,04,由正态分布上侧分位数定义知,查表知,u,0.025,=,1.,96,当然区间长度越短的估计,精度就越高,.,其长度也不相等,.,区间长度为,24.,25,长度为,25.,5,谁是精度最高的?,由于标准正态分布密度函数的图形是单峰且对称的,在保持面积不变的条件下,以对称区间的长度为最短,!,但,的长度是最短的,l,与,n,的关系:,可知,置信区间的长度,l,为,:,由置信区间公式,l,随着,的减小而增大,;,2,0,若给定,l,随着,n,的增大而减小,;,同一置信水平下的置信区间不唯一,.,其长度也不相等,.,故我们总取它作为置信水平为,1,-,的置信区间,.,若给定,n,且由于,l,与 成反比,减小的速度并不快,例如,n,由,100,增至,400,时,l,才能减小一半,.,则,u,/,2,越大,l,就越大,这时,就越小,.,1,0,(,u,/,2,),就越大,一般地,在概率密度为单峰且对称的情形下,a,=,-,b,对应的,置信区间的长度为最短,.,例,2:,某厂生产的零件长度,X,服从,N,(,0.04,),现从该厂生产的零件中随机抽取,6,个,长度测量值如下,(,单位,:,毫米,):,14.6,15.l,14.9,14.8,15.2,15.1.,求,:,的置信系数为,0.95,的区间估计。,解:,n,=6,,,=0.05,,,z,/2,=z,0.025,=1.96,,,2,=0.2,2,.,所求置信区间为,故不能采用已知方差的均值估计方法,由于 与,有关,但其解决的思路一致,.,由于,S,2,是,2,的无偏估计量,查,t,分布表确定上侧,/,2,分位数,令,T,=,(,2,),未知方差,用 分布的分位数求,的置信区间,.,故可用,S,替代,的估计量,:,S,t,(,n,-,1,),即为,的置信度为,1,-,的区间估计,.,2,时,由抽样分布定理知,实用价值更大,!,t,/,2,(,n,-,1,),测定总体服从正态分布,求总体均值,的置信水平为,0.95,的置信区间,.,解,由于,/,2,=0.,025,查,t,分布表得,例,3,为确定某种溶液中甲醛浓度,且其,4,个独立测量值的平均值,x,=,8.,34,%,样本标准差,s,=,0.,03,%,即得置信区间,自由度,n,-,1=,3,t,0.025,=,3.,182,将,x,=,8.,34,%,代入 得,(,2,),未知时,所以,2,的置信水平为,1,-,的区间估计为,因为,2,的无偏估计为,S,2,2.,方差,2,的,置信区间的求法,由抽样分布定理知,2,=,由,确定,2,分布的上侧,/2,分位数,找一个含,与,S,但不含,且分布已知的统计量,为了计算简单,在概率密度不对称的情形下,如,2,分布,F,分布,习惯上仍取,对称的分位点,来计算未知参数的置信区间,.,并不是最短的置信区间,/2,/2,测定总体服从正态分布,求总体均值,的置信水平为,0.95,的置信区间,.,解,由于,/,2,=0.,025,查,2,分布表得,例,4,为确定某种溶液中甲醛浓度,且其,4,个独立测量值的平均值,x,=,8.,34,%,样本标准差,s,=,0.,03,%,故,2,的置信区间为,自由度,n,-,1=,3,得,将,s,2,=,0.,0009,代入,求总体方差,2,和标准差,的置信水平为,0.95,的置信区间,.,故,的置信区间为,在实际应用中,经常会遇到两个正态总体的区间估计问题。,于是,评价新技术的效果问题,就归结为研究两个正态总体均值之差,1,-,2,的问题。,例如:考察一项新技术对提高产品的某项质量指标的作用,,将实施,新技术前的产品质量指标看成正态总体,N,(,1,1,2,),,实施,新技术后产品质量指标看成正态总体,N,(,2,2,2,),。,设,X,1,X,m,分别是总体,X,N,(,1,1,2,),的样本,Y,1,Y,n,分别是总体,Y,N,(,2,2,2,),的样本,X,Y,分别是总体,X,和,Y,的样本均值,求参数,1,-,2,和,1,2,/,2,2,的置信水平为,1,-,的置信区间,.,由于,X,Y,分别是,1,2,的无偏估计量,即得置信区间,(,二,),两个正态总体,(,1,),已知,方差,1,2,2,2,时,故可用,X,-,Y,作为,1,-,2,的一个估计量,N,(,0,1,),对给定的置信度,1,-,查正态分布表可得,u,/,2,由抽样分布定理知,1.,均值,1,-,2,的置信区间,S,X,2,S,Y,2,分别是总体,X,和,Y,的样本方差,置信区间的求法,设,X,1,X,m,分别是总体,X,N,(,1,1,2,),的样本,Y,1,Y,n,分别是总体,Y,N,(,2,2,2,),的样本,X,Y,分别是总体,X,和,Y,的样本均值,求参数,1,-,2,和,1,2,/,2,2,的置信水平为,1,-,的置信区间,.,即得置信区间,(,二,),两个正态总体,置信区间的求法,(,2,),未知,方差,1,2,2,2,但,1,2,=,2,2,=,2,时,仍用,X,-,Y,作为,1,-,2,的一个估计量,t,(,n,+,m,-,2,),对给定的置信度,1,-,查,t,分布表可得,由抽样分布定理知,1.,均值差,1,-,2,的置信区间,S,X,2,S,Y,2,分别是总体,X,和,Y,的样本方差,t,/,2,(,n,+,m,-,2,),例,5,:,某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积,(,单位,:,毫升,),X,N,(,1,2,),和,Y,N,(,2,2,),。现从生产线上分别抽取,X,1,X,2,X,12,和,Y,1,Y,2,Y,17,,样本均值与样本方差分别为,:,求,1,-,2,的置信系数为,0.95,的区间估计。,解:,m,=12,n,=17,=0.05,,且,查,t,分布表,,,得,t,m,+,n,-,2,(,/2,)=,t,27,(0.025)=2.05.,因此,置信度为,1-,的置信区间:,例,6,(,比较棉花品种的优劣,),:假设用甲、乙两种棉花纺出的棉纱强度分别为,X,N,(,1,2.18,2,),和,Y,N,(,2,1.76,2,),。试验者从这两种棉纱中分别抽取样本,X,1,X,2,X,200,和,Y,1,Y,2,Y,100,,样本均值分别为,:,求,1,-,2,的置信系数为,0.95,的区间估计。,解,:,1,=2.18,2,=1.76,m,=200,n,=100,=0.05,1,-,2,的置信系数为,1,-,的置信区间为,:,设同上,求参数,1,2,/,2,2,的置信水平为,1,-,的置信区间,.,即得,1,2,/,2,2,的置信区间,(,二,),两个正态总体,置信区间的求法,(,2,),未知,1,2,时,F,(,m,-,1,n,-,1,),对给定的置信度,1,-,查,F,分布表可得上侧分位数,由抽样分布定理知,2.,方差比,1,2,/,2,2,的置信区间,F,/,2,(,m,-,1,n,-,1,),F,1,-,/,2,(,m,-,1,n,-,1,),求两总体方差比,1,2,/,2,2,的,置信水平为,0.90,的置信区间,.,称重后所的样本方差分别为,s,x,2,=,0.0125,s,y,2,=,0.01,假定所装番茄酱的重量,X,与,Y,分别服从正态分布,N,(,1,1,2,),和,N,(,2,2,2,),解,由于,/,2,=0.,05,查,F,分布表得,例,7,某厂用两条流水线生产番茄酱小包装,现从两条流水线上各随机抽取样本容量分别为,m,=6,n,=7,的样本,将条件代入得,1,2,/,2,2,的置信区间为,(,0.,2847,6.,1875,).,自由度,m,-,1=5,n,-,1=,6,主要根据,抽样分布,Th,(,二,),两,个总体,由,的概率分布和置信水平,1,-,确定其相应的,分位数,x,/,2,;,小结,正态总体,置信区间的求法,(,一,),单个总体,均值,已知方差,2,均值差,1,-,2,已知方差,1,2,2,2,方差,2,未知方差,2,解得,所求的置信区间,根据未知参数的无偏估计量,确定其某个估计量,;,由不等式,已知均值,未知均值,未知方差,1,2,2,2,方差比,1,2,/,2,2,已知均值,1,2,未知均值,1,2,但相等,!,X,1,X,n,是取自,X,的样本,则称随机区间,(-,),为,的,置信水平为,1,-,的单侧置信区间,但有些实际问题,人们关心的只是参数在一个方向的界限,.,这时,可将置信上限取为,+,而只着眼于置信下限,上述置信区间中置信限都是双侧的,例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了,.,三、单侧置信区间,定义,满足,这样求得的置信区间叫,单侧置信区间,.,对给定值,0,1,满足,设,是总体,X,的待估参数,称,为,单侧置信下限,;,则称随机区间,(,+,),为,的,置信水平为,1,-,的单侧置信区间,称,为,单侧置信上限,.,若统计量,若统计量,求单侧置信区间的思路完全同于双侧的情形,记录其磨坏时所行驶路程,(,单位,:,公里,),问该种轮胎平均行驶路程至少是多少,(,=0.,05,),?,解,由于,2,未知,查,t,分布表可得满足条件 的上侧分位数,例,8,从一批汽车轮胎中随机地取,16,只作磨损试验,算得样本均值,x,=,41116,即得置信度为,0.,95,的单侧置信下限,t,0.05,(,15,),=,1.,7531,将,x,=,41116,s,=,6346,代入 得,设此样本来自正态总体,N,(,2,),均未知,t,(,n,-,1,),由抽样分布定理知,随机变量,样本标准差,s,=,6346,.,=38334,故该种轮胎平均行驶路程不少于,38334,公里,其置信概率为,0.,95.,
展开阅读全文