资源描述
授课题目: 第七章 参数估计
教学目的、要求(分掌握、熟悉、了解三个层次):
1、理解参数的点估计、估计量与估计值的概念;
2、掌握矩估计法(一阶、二阶)和最大似然估计法;
3、了解估计量的无偏性,有效性(最小方差性)和一致性(相合性)的概念,并会验证估计量的无偏性;
4、了解区间估计的概念,会求单正态总体的均值与方差的置信区间。
教学重点及难点:
矩法估计,极大似然估计;估计量的评价准则;正态总体参数的区间估计
课时安排:7课时
授课方式:理论课
教学基本内容:
7.3 区间估计
1. 区间估计的一般步骤
我们在讨论抽样分布时曾提到过区间估计。与点估计不同的是,它给出的不是参数空间的某一个点,而是一个区间(域)。按照一般的观念,似乎我们总是希望能得到参数的一个具体值,也就是说用点估计就够了,为什么还要引入区间估计呢?这是因为在使用点估计时,我们对估计量是否能“接近”真正的参数的考察是通过建立种种评价标准,然后依照这些标准进行评价,这些标准一般都是由数学特征来描绘大量重复试验时的平均效果,而对于估值的可靠度与精度却没有回答。即是说,对于类似这样的问题:“估计量在参数的邻域的概率是多大?”点估计并没有给出明确结论,但在某些应用问题中,这恰恰是人们所感兴趣的,如
例7.12 某工厂欲对出厂的一批电子器件的平均寿命进行估计,随机地抽取件产品进行试验,通过对试验的数据的加工得出该批产品是否合格的结论?并要求此结论的可信程度为95%,应该如何来加工这些数据?
对于“可信程度”如何定义,我们下面再说,但从常识可以知道,通常对于电子元器件的寿命指标往往是一个范围,而不必是一个很准确的数。因此,在对这批电子元器件的平均寿命估计时,寿命的准确值并不是最重要的,重要的是所估计的寿命是否能以很高的可信程度处在合格产品的指标范围内,这里可信程度是很重要的,它涉及到使用这些电子元器件的可靠性。因此,若采用点估计,不一定能达到应用的目的,这就需要引人区间估计。
区间估计粗略地说是用两个统计量,()所决定的区间[,]作为参数取值范围的估计。显然,一般地这样说是没有多大的意义的,首先,这个估计必须有一定的精度,即是说-不能太大,太大不能说明任何问题;第二,这个估计必须有一定的可信程度,因此-又不能太小,太小难以保证这一要求。比如从区间[1,100]去估计某人的岁数,虽然绝对可信,却不能带来任何有用的信息;反之,若用区间[30,31]去估计某人的岁数,虽然提供了关于此人年龄的信息,却很难使人相信这一结果的正确性。我们希望既能得到较高的精度,又能得到较高的可信程度,但在获得的信息一定(如样本容量固定)的情况下,这两者显然是不可能同时达到最理想的状态。通常是采取将可信程度固定在某一需要的水平上,求得精度尽可能高的估计区间。下面给出区间估计的正式的定义。
定义7. 4 对于参数,如果有两个统计量,,满足对给定的,有
则称区间[,]是的一个区间估计或置信区间(Confidence Interval),,分别称作置信下限(Confidence lower limit)、置信上限(Confidence upper limit),称为置信水平(Confidence level)。
这里的置信水平,就是对可信程度的度量。置信水平为1-,在实际上可以这样来理解:如取,就是说若对某一参数取100个容量为的样本,用相同方法做100个置信区间。[,],=1,2,…,100,那么其中有95个区间包含了真参数.因此,当我们实际上只做一次区间估计时,我们有理由认为它包含了真参数。这样判断当然也可能犯错误,但犯错误的概率只有5%.
下面我们来讨论一下区间估计的一般步骤。
1) 设欲估参数为,先取的一个点估计,它满足两点:一是它较前面提出的标准应该是一个“好的”估计量,二是它的分布形式应该已知,只依赖未知参数.
2) 所求的区间考虑为的一个邻域,,(或者等等),使得对于
=1-
且一般要求尽可能小。为确定,须用解不等式的方法将(6.22)式中的随机事件变成类似于下述等价形式:
其中,为可逆的的已知函数,的分布与无关且已知,一般其分位点应有表可查,这是关键的一步。于是就可得出,为某个分位点,如,.
3) 从,的表达式中解出即可。区间估计涉及到抽样分布,如节5.4.5中所述,对于一般分布的总体,其抽样分布的计算通常有些困难,因此,我们将主要研究正态总体参数的区间估计问题。
2. 单个正态总体参数的区间估计
设为的样本,对给定的置信水平,,我们来分别研究参数与的区间估计。
例7.13 在上述前提下,求的置信水平为的区间估计。
解; 考虑的点估计为,确定使
且使区间长尽可能小。下面分两种情况
1) 已知,变换事件,使表成式:
这里。为使,又要尽量使最小,亦即使最小,如图7-1,从密度函数的特点来看(对称、原点附近密度最大,往两边密度减小),只有取,即,从而所求的区间是
图7-1
2) 未知,将事件变换成式:
其中由例7.14知,,为使,且区间尽量短。与情形一样,只有取因此所求区间为
例7.14 在上述前提下求的置信水平为1-的区间估计。
解; 的点估计量为,注意到,考虑,及的邻域[,],使
变换事件
由定理5.3(ii)知,,故为使,通常取
于是,所求区间为
这里要使区间最短,计算太麻烦,因此,在取分位点时采用类似主对称型分布的取法,使密度函数图形两端的尾部面积均为(如图7-2)。
图7-2
例7.15 一批零件尺寸服从,对进行区间估计(未知),要求估计精度不低于2,置信水平保持为,问至少要抽取多少件产品作为样本?
解; 显然,此处要求
由例7.24,,故
7.5
式(7.5)不是的显式,但对于具体数值,可采取“试算法”来确定.一般是先对作个大致估计(可以由以往的经验确定),然后用试算的方式确定适合方程7.5的.例如若估计出200,又已知,来试算:
显然,如果任正整数不可能严格满足方程(7。5)的话,则应取使式(7.5)左边大于右边的最小的,因此应该取=11.
参考书目:
1.吴赣昌,大学数学立体化教材:概率论与数理统计(经济类),中国人民大学出版社,2006年3月。
2.盛 骤,谢式千等,概率论与数理统计(第三版),高等教育出版社,2003年2月。
作业和思考题:
作业:P127 1 4-7 9-11
课后小结:
本章中介绍了参数估计的基本方法。
参数的估计有点估计、贝叶斯估计和区间估计。矩估计法和极大似然估计法是求参数的点估计量的两种最基本的方法,务必牢固掌握。衡量估计量好坏的标准有无偏性,最小方差无偏估计,有效性和相合性(一致性)等,要学会验证一个估计量是符合哪种标准的估计量,这对了解估计量的特性是非常重要的。
要正确理解区间估计的概念,学会求单个正态总体的均值和方差的置信区间。
展开阅读全文