资源描述
第六章参数估计
第六章 参数估计
Ⅰ.学习目的
本章介绍有关抽样分布的基础知识,阐述参数估计的理论与方法。通过学习,要求:1. 理解抽样的基本概念和不同抽样方式对抽样分布的影响;2。理解总体参数估计量的优良评价标准及点估计公式;3. 掌握总体均值与成数指标的区间估计方法、样本容量的确定方法;4. 应用:学会总体参数的置信区间的估计、样本容量的计算。
Ⅱ.课程内容
第一节 抽样分布
一、抽样分布的基本概念
(一)样本容量与样本个数
样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用表示,它表示一个样本中所包含的单位数。样本个数又称为样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。
(二)总体参数与样本统计量
总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总体参数有,总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。
样本统计量是样本的一个函数,因此,它是随机变量。我们利用统计量来估计和推断总体的有关参数。常见的统计量有:
样本均值
样本成数
样本方差
样本标准差
(三)回置抽样与无回置抽样
回置抽样是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮单位的抽取。
无回置抽样是指从总体抽出一个单位,登记后不放回原总体,即不参加下一轮抽样,下一次继续从总体中余下的单位抽取样本。
二、抽样分布
(一)样本平均数的抽样分布
样本平均数的期望值与方差分别为:
抽样平均误差(即样本平均数的标准差):
在无回置抽样的情形下, ,
抽样平均误差(即样本平均数的标准差):
(二)样本成数的抽样分布
总体成数是指具有某种特征的单位在总体中的比重。现在从总体中抽出个单位,如果其中有相应特征的单位数是,则样本成数是
(三)样本方差的抽样分布
~
第二节 估计量的评价标准
一、点估计
点估计就是设总体随机变量的分布函数形式为已知,但它的一个和多个参数未知,若从体中抽取一组样本。用该组数据来估计总体的参数,称参数的点估计。
点估计的方法有矩估计、顺序统计量法、最大似然法、最小二乘法等。
(一)矩估计法
在统计学中,矩是指以期望为基础而定义的数字特征。例如数学期望、方差、协方差等。矩可以分为原点矩和中心矩两种。
阶原点矩记为 ,当时,为数学期望。
阶中心矩记为 ,当时,为方差。
(二)顺序统计量法
所谓顺序统计量法,即用样本中位数,或样本极差来估计总体的数学期望或总体的均方差的方法。
在总体为连续型随机变量,且概率密度函数为对称时,常用样本中位数来估计总体数学期望,即 ;样本极差本身就是衡量总体离散程度的一个尺度,由于其计算很简单,所以在需要估计正态总体均方差时,可使用样本极差来估计,和有下列关系:。
二、估计量的优良标准
1、无偏性。。
2、有效性。设、为的两个无偏估计量,若的方差小于的方差,即 , 则称是较有效的估计量。
3、一致性。设未知参数的估计量,当时,要求按概率收敛于。即 (为任意小正数),则称为的满足一致性标准要求的估计量。一致性标准说明:当样本单位数(或样本容量)越来越大时,估计量接近于被估计量的概率也越来越大。
第三节 简单随机抽样的参数估计
所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。设和分别为总体参数区间估计的下限和上限,则要求有
,式中是区间估计的显著性水平,其取值大小由实际问题确定,通常人们取1%、5%和10%,称为置信度,是置信度为的的置信区间。置信区间表达了区间估计的准确性(或精确性),置信度表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠概率。
一、总体均值的置信区间
(一)已知时总体均值的置信区间
在给定显著性水平下,总体均值在的置信水平下的置信区间为:
其中,临界值可以查正态分布表得到。
(二)未知时总体均值的置信区间
当总体服从正态分布,但总体方差未知时,要用样本方差代替来建立置信区间。这时,新的统计量不服从标准正态分布,而是服从自由度为的分布,此时,总体均值的置信区间为:
统计量的临界值,在给定显著性水平及自由度时,可查分布表获得。
二、总体成数的置信区间
在大样本下,若,,则可以把二项分布问题转化为正态分布问题近似地去求解,在的置信水平下,总体成数的置信区间为
三、两个总体均值及两个总体成数之差的置信区间
(一)两个总体均值之差的置信区间
1、两个总体的方差、已知情况下的估计。
在置信水平下的置信区间为:
2、两个总体的方差、未知情况下的估计。
(1)两个总体均服从正态分布,且=。当、均未知时,
两个总体均值之差的置信水平的置信区间为:
其中,
(2)两个总体均服从正态分布,且。当、未知且不相等时,的置信度为的近似区间估计为
(二)两个总体成数之差的置信区间
可以证明,当和都很大,而且总体成数不太接近0或1时,的抽样分布近似服从正态分布,而的置信度为的置信区间为:
四、样本容量的确定
(一)估计总体均值时,样本容量的确定
在已知可靠性系数和总体标准差,当给出了允许误差后,必要样本容量可由下式给出:
(二)估计总体成数时,样本容量的确定
估计总体成数时,必要样本容量为:
其中,
第四节 复杂随机抽样的参数估计
一、 分层抽样的估计
分层抽样也称为类型抽样,它是按一定标志对总体各单位进行分类,然后分别从每一类中按随机原则抽取一定的单位构成样本。
设总体由个单位组成,按对总体的认识,把总体分为组,使得
然后相应从各组中分别按简单随机抽取个单位组成样本。设样本容量为,它满足
采用比例抽样方式,我们从每一类抽取时要求两者间保持合适的比例,即
所以各组的样本单位数应为
设是第组的组内标准差,记。
回置抽样下样本平均数的抽样平均误差为:
在不回置抽样下的抽样平均误差为:
二、 等距抽样的估计
等距抽样又称为机械抽样或系统抽样,它是将总体各单位按某标志进行排序,然后按固定的间隔来抽取样本单位的抽样组织形式。
根据需要抽取的样本单位数和总体的单位数,可以计算出等距抽样的间隔大小为:,先从排序后顺序是的第一部分中随机抽出第个单位,然后在顺序是的第二部分中抽取第个单位,再从顺序是的第三部分中抽取第个单位,依此类推,最后从顺序是的第部分中抽取第个单位,一共个单位构成样本。
为了方便起见,可以采用简单随机抽样的平均误差代替等距抽样平均误差:
等距抽样一般都是不回置抽样。总体方差未知时,常用样本方差代替。
三、 整群抽样的估计
整群抽样就是将总体各单位分成若干群,然后从其中随机抽取部分群,对中选的群进行全面调查的抽样组织方式。
设总体的全部个单位被划分为群,每群含有个单位。现在从总体群中随机抽出群组成样本,对中选的群中的所有单位进行全面调查。记群间方差为:
或者由样本数据估计是
因此,样本平均数的抽样平均误差是:
上式中出现修正系数,这是因为整群抽样一般都采用不回置抽样。
四、 多阶段抽样的估计
所谓多阶段抽样,就是先从总体中抽出较大的范围的单位,再从选的大单位中抽较小范围的单位,依次类推,最后从更小的范围抽出样本单位。
两阶段抽样在组织技术上可以看出是整群抽样和分层抽样的结合。设总体分成组,每组各单位。两阶段抽样就是:第一阶段采用整群抽样方式从总体的全部群中,随机抽取群;第二阶段用分层抽样方式从每个中选群中抽出个样本单位。
样本平均数的抽样平均误差为:
其中,为组间方差;为组内方差的平均数。
应用以上公式,在得不到总体资料的情况下,可以用样本资料来代替。不过用样本组间方差代替总体组间方差,用样本组内方差代替总体组内方差,这样得到的抽样平均误差就不是无偏估计量,而必须加以适当的修正才能成为无偏估计量。修正后的抽样误差公式为:
式中,为样本的组间方差;为各样本组内方差的平均数。
Ⅲ.考核知识点与考核要求
一、抽样的基本概念和抽样分布
1、识记:
(1)样本容量的概念;
(2)常用样本统计量;
(3)回置抽样与不回置抽样的概念;
(4)总体平均数与成数的分布。
2、领会:
(1)样本个数的概念;
(2)不回置抽样的修正系数;
(3)样本方差的抽样分布。
3、应用:抽样平均误差的计算。
二、估计量的评价标准
1、识记:
(1)点估计的定义、常用点估计量;
(2)参数估计量的优良标准。
2、领会:顺序统计量法。
3、应用:距估计法的计算。
三、简单随机抽样的参数估计
1、识记:区间估计的含义;
2、领会:置信度、置信区间与显著性水平的含义。
3、应用:
(1)总体方差已知时的总体平均数区间估计公式及应用;
(2)总体方差未知时的总体平均数区间估计公式及应用;
(3)总体成数的区间估计公式及其应用;
(4)两个总体均值之差的区间估计公式及应用;
(5)两个总体成数之差的区间估计公式及应用;
(6)样本容量公式及其应用;
(7)利用Excel进行区间估计。
四、复杂随机抽样的参数估计
1、识记:分层抽样、整群抽样、等距抽样和多阶段抽样的概念;
2、领会:
(1)分层抽样与整群抽样的抽样平均误差公式;
(2)两阶段抽样误差控制。
Ⅳ.习题详解
一、选择题
1.B 2.D 3.D 4.B 5.C 6.B 7.B 8.A 9.C 10.A 11.BCDE 12.BCDE 13.BCD 14.ACE 15.ABCD 16.CE 17.ABCD
二、证明题
1.证:
2..解:
即:
解这一方程组可得:
,
分别以样本矩、作为总体矩和的估计量,则和的估计量分别为:
,
故有:
三、计算题
1.解:(1) 已知~
, ,,
则总体均值的置信区间为:
=
即为(2.1209,2.1291)。
我们可以90%的概率保证该批钉子的平均长度在2.1209厘米与2.1291厘米之间。
(2)已知~,未知,=0.000293,=16,
在时,
则总体均值的置信区间为:
=
即为(2.1175,2.1325)。
故我们可以90%的概率保证该批钉子的平均长度在2.1175厘米与2.1325厘米之间。
2.解:总体的分布形式未知,但=100>30为大样本,故可以认为近似服从正态分布。总体方差未知,=40, ,,。
则总体均值的置信区间为:
=
即为(992,1008)。
故我们可以95%的概率保证这批电子管的平均寿命在992小时与1008小时之间。
3.解:已知=200,,,,
(1)当 时,,有
=
=(0.1812,0.2788)
故我们可以90%的概率保证该品牌空调的家庭总体占有率在18.12%与27.88%之间。
(2)当 时,,有
=
=(0.1717,0.2883)
故我们可以95%的概率保证该品牌空调的家庭总体占有率在17.17%与18.83%之间。
4.解:样本1、2分属于不同的总体,、未知且不相等。
此时,为了求出的置信区间,首先计算出自由度如下:
=13.67914
(1)当 时,,
从而所求的近似的90%区间估计为:
=
即为(1.6373,17.9627)。
(2)当 时,,
从而所求的近似的95%区间估计为:
=
即为(-0.1426,19.7426)。
5.解:(1)已知=50,,,
当 时,,有
=
=(0.507,0.773)
故我们可以95%的概率保证该小区中赞成该项改革的户数比例在50.7%与77.3%之间。
(2) 若, ,允许误差0.05
则应抽取的样本容量为:
故为了以95%的可靠度保证估计误差不超过0.05,应取246户进行调查。
6.解:由于样本容量==250,属于大样本容量,且总体成数都不太接近0或1,
故的抽样分布可视为近似服从正态分布。
,, ,,
(1)当时,,
则的置信度为的近似置信区间为
=
即为(0.03,0.17)。
(2)当时,,
则的置信度为的近似置信区间为
=
即为(0.017,0.183)。
7.解:已知总体方差为, 总体平均数在置信度水平为时的置信区间为:
, 要求其区间长度 2L,
则有:,即至少要抽取的样本数量为 。
8.解:(1)已知~,未知,计算求得=0.2203,=20,
在时,。
则总体均值的置信区间为:
=
即为(5.107,5.313)。
故我们可以95%的概率保证这批钢件的屈服点均值在5.107吨/cm2与5.313吨/cm2之间。
(2) 在时,, ,,查表可得:
,,=0.2203,=20
则方差的置信区间为:
=
即为(0.1675,0.3218)
故我们可以95%的概率保证这批钢件的屈服点的方差在0.1675与0.3218之间。
77 / 2477
展开阅读全文