1、第六章参数估计第六章 参数估计.学习目的本章介绍有关抽样分布的基础知识,阐述参数估计的理论与方法。通过学习,要求:1. 理解抽样的基本概念和不同抽样方式对抽样分布的影响;2。理解总体参数估计量的优良评价标准及点估计公式;3. 掌握总体均值与成数指标的区间估计方法、样本容量的确定方法;4. 应用:学会总体参数的置信区间的估计、样本容量的计算。.课程内容第一节 抽样分布一、抽样分布的基本概念(一)样本容量与样本个数样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用表示,它表示一个样本中所包含的单位数。样本个数又称为样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多
2、少与抽样方法有关。(二)总体参数与样本统计量总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总体参数有,总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。样本统计量是样本的一个函数,因此,它是随机变量。我们利用统计量来估计和推断总体的有关参数。常见的统计量有:样本均值 样本成数 样本方差 样本标准差 (三)回置抽样与无回置抽样回置抽样是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮单位的抽取。无回置抽样是指从总体抽出一个单位,登记后不放回原总体,即不参加下一轮抽样,下一次继续从总体中余下的单位抽取样本。二、抽样分布(一)样本平均数的抽
3、样分布样本平均数的期望值与方差分别为:抽样平均误差(即样本平均数的标准差):在无回置抽样的情形下, , 抽样平均误差(即样本平均数的标准差):(二)样本成数的抽样分布总体成数是指具有某种特征的单位在总体中的比重。现在从总体中抽出个单位,如果其中有相应特征的单位数是,则样本成数是 (三)样本方差的抽样分布第二节 估计量的评价标准一、点估计点估计就是设总体随机变量的分布函数形式为已知,但它的一个和多个参数未知,若从体中抽取一组样本。用该组数据来估计总体的参数,称参数的点估计。点估计的方法有矩估计、顺序统计量法、最大似然法、最小二乘法等。 (一)矩估计法在统计学中,矩是指以期望为基础而定义的数字特征
4、。例如数学期望、方差、协方差等。矩可以分为原点矩和中心矩两种。阶原点矩记为 ,当时,为数学期望。阶中心矩记为 ,当时,为方差。(二)顺序统计量法所谓顺序统计量法,即用样本中位数,或样本极差来估计总体的数学期望或总体的均方差的方法。在总体为连续型随机变量,且概率密度函数为对称时,常用样本中位数来估计总体数学期望,即 ;样本极差本身就是衡量总体离散程度的一个尺度,由于其计算很简单,所以在需要估计正态总体均方差时,可使用样本极差来估计,和有下列关系:。二、估计量的优良标准1、无偏性。2、有效性。设、为的两个无偏估计量,若的方差小于的方差,即 , 则称是较有效的估计量。3、一致性。设未知参数的估计量,
5、当时,要求按概率收敛于。即 (为任意小正数),则称为的满足一致性标准要求的估计量。一致性标准说明:当样本单位数(或样本容量)越来越大时,估计量接近于被估计量的概率也越来越大。第三节 简单随机抽样的参数估计所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。设和分别为总体参数区间估计的下限和上限,则要求有 ,式中是区间估计的显著性水平,其取值大小由实际问题确定,通常人们取1%、5%和10%,称为置信度,是置信度为的的置信区间。置信区间表达了区间估计的准确性(或精确性),置信度表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠概率。一、总体均值
6、的置信区间(一)已知时总体均值的置信区间在给定显著性水平下,总体均值在的置信水平下的置信区间为: 其中,临界值可以查正态分布表得到。(二)未知时总体均值的置信区间当总体服从正态分布,但总体方差未知时,要用样本方差代替来建立置信区间。这时,新的统计量不服从标准正态分布,而是服从自由度为的分布,此时,总体均值的置信区间为:统计量的临界值,在给定显著性水平及自由度时,可查分布表获得。二、总体成数的置信区间在大样本下,若,则可以把二项分布问题转化为正态分布问题近似地去求解,在的置信水平下,总体成数的置信区间为三、两个总体均值及两个总体成数之差的置信区间(一)两个总体均值之差的置信区间1、两个总体的方差
7、、已知情况下的估计。在置信水平下的置信区间为: 2、两个总体的方差、未知情况下的估计。(1)两个总体均服从正态分布,且。当、均未知时, 两个总体均值之差的置信水平的置信区间为: 其中,(2)两个总体均服从正态分布,且。当、未知且不相等时,的置信度为的近似区间估计为 (二)两个总体成数之差的置信区间可以证明,当和都很大,而且总体成数不太接近0或1时,的抽样分布近似服从正态分布,而的置信度为的置信区间为:四、样本容量的确定(一)估计总体均值时,样本容量的确定在已知可靠性系数和总体标准差,当给出了允许误差后,必要样本容量可由下式给出:(二)估计总体成数时,样本容量的确定估计总体成数时,必要样本容量为
8、: 其中,第四节 复杂随机抽样的参数估计一、 分层抽样的估计分层抽样也称为类型抽样,它是按一定标志对总体各单位进行分类,然后分别从每一类中按随机原则抽取一定的单位构成样本。设总体由个单位组成,按对总体的认识,把总体分为组,使得然后相应从各组中分别按简单随机抽取个单位组成样本。设样本容量为,它满足采用比例抽样方式,我们从每一类抽取时要求两者间保持合适的比例,即 所以各组的样本单位数应为设是第组的组内标准差,记。回置抽样下样本平均数的抽样平均误差为:在不回置抽样下的抽样平均误差为:二、 等距抽样的估计等距抽样又称为机械抽样或系统抽样,它是将总体各单位按某标志进行排序,然后按固定的间隔来抽取样本单位
9、的抽样组织形式。根据需要抽取的样本单位数和总体的单位数,可以计算出等距抽样的间隔大小为:,先从排序后顺序是的第一部分中随机抽出第个单位,然后在顺序是的第二部分中抽取第个单位,再从顺序是的第三部分中抽取第个单位,依此类推,最后从顺序是的第部分中抽取第个单位,一共个单位构成样本。为了方便起见,可以采用简单随机抽样的平均误差代替等距抽样平均误差: 等距抽样一般都是不回置抽样。总体方差未知时,常用样本方差代替。三、 整群抽样的估计整群抽样就是将总体各单位分成若干群,然后从其中随机抽取部分群,对中选的群进行全面调查的抽样组织方式。设总体的全部个单位被划分为群,每群含有个单位。现在从总体群中随机抽出群组成
10、样本,对中选的群中的所有单位进行全面调查。记群间方差为:或者由样本数据估计是因此,样本平均数的抽样平均误差是:上式中出现修正系数,这是因为整群抽样一般都采用不回置抽样。四、 多阶段抽样的估计所谓多阶段抽样,就是先从总体中抽出较大的范围的单位,再从选的大单位中抽较小范围的单位,依次类推,最后从更小的范围抽出样本单位。两阶段抽样在组织技术上可以看出是整群抽样和分层抽样的结合。设总体分成组,每组各单位。两阶段抽样就是:第一阶段采用整群抽样方式从总体的全部群中,随机抽取群;第二阶段用分层抽样方式从每个中选群中抽出个样本单位。样本平均数的抽样平均误差为:其中,为组间方差;为组内方差的平均数。应用以上公式
11、,在得不到总体资料的情况下,可以用样本资料来代替。不过用样本组间方差代替总体组间方差,用样本组内方差代替总体组内方差,这样得到的抽样平均误差就不是无偏估计量,而必须加以适当的修正才能成为无偏估计量。修正后的抽样误差公式为: 式中,为样本的组间方差;为各样本组内方差的平均数。.考核知识点与考核要求一、抽样的基本概念和抽样分布 1、识记:(1)样本容量的概念;(2)常用样本统计量;(3)回置抽样与不回置抽样的概念;(4)总体平均数与成数的分布。 2、领会:(1)样本个数的概念; (2)不回置抽样的修正系数; (3)样本方差的抽样分布。3、应用:抽样平均误差的计算。二、估计量的评价标准1、识记:(1
12、)点估计的定义、常用点估计量;(2)参数估计量的优良标准。2、领会:顺序统计量法。3、应用:距估计法的计算。三、简单随机抽样的参数估计1、识记:区间估计的含义;2、领会:置信度、置信区间与显著性水平的含义。3、应用:(1)总体方差已知时的总体平均数区间估计公式及应用;(2)总体方差未知时的总体平均数区间估计公式及应用;(3)总体成数的区间估计公式及其应用;(4)两个总体均值之差的区间估计公式及应用;(5)两个总体成数之差的区间估计公式及应用;(6)样本容量公式及其应用;(7)利用Excel进行区间估计。四、复杂随机抽样的参数估计1、识记:分层抽样、整群抽样、等距抽样和多阶段抽样的概念;2、领会
13、:(1)分层抽样与整群抽样的抽样平均误差公式;(2)两阶段抽样误差控制。.习题详解 一、选择题1.B 2.D 3.D 4.B 5.C 6.B 7.B 8.A 9.C 10.A 11.BCDE 12.BCDE 13.BCD 14.ACE 15.ABCD 16.CE 17.ABCD二、证明题1.证: 2解: 即: 解这一方程组可得: , 分别以样本矩、作为总体矩和的估计量,则和的估计量分别为: ,故有: 三、计算题1解:(1) 已知 , , 则总体均值的置信区间为: 即为(2.1209,2.1291)。 我们可以90的概率保证该批钉子的平均长度在2.1209厘米与2.1291厘米之间。(2)已知,
14、未知,0.000293,16, 在时, 则总体均值的置信区间为: 即为(2.1175,2.1325)。故我们可以90的概率保证该批钉子的平均长度在2.1175厘米与2.1325厘米之间。2解:总体的分布形式未知,但10030为大样本,故可以认为近似服从正态分布。总体方差未知,40, ,。 则总体均值的置信区间为: 即为(992,1008)。故我们可以95的概率保证这批电子管的平均寿命在992小时与1008小时之间。3解:已知200,(1)当 时,有(0.1812,0.2788)故我们可以90的概率保证该品牌空调的家庭总体占有率在18.12与27.88之间。(2)当 时,有(0.1717,0.2
15、883)故我们可以95的概率保证该品牌空调的家庭总体占有率在17.17与18.83之间。4解:样本1、2分属于不同的总体,、未知且不相等。此时,为了求出的置信区间,首先计算出自由度如下:13.67914(1)当 时,从而所求的近似的90区间估计为: 即为(1.6373,17.9627)。(2)当 时,从而所求的近似的95区间估计为: 即为(-0.1426,19.7426)。5解:(1)已知50, 当 时,有 (0.507,0.773)故我们可以95的概率保证该小区中赞成该项改革的户数比例在50.7与77.3之间。 (2) 若, ,允许误差0.05 则应抽取的样本容量为:故为了以95%的可靠度保
16、证估计误差不超过0.05,应取246户进行调查。6解:由于样本容量250,属于大样本容量,且总体成数都不太接近0或1,故的抽样分布可视为近似服从正态分布。 , , (1)当时, 则的置信度为的近似置信区间为 即为(0.03,0.17)。(2)当时, 则的置信度为的近似置信区间为 即为(0.017,0.183)。7解:已知总体方差为, 总体平均数在置信度水平为时的置信区间为: , 要求其区间长度 2L,则有:,即至少要抽取的样本数量为 。8解:(1)已知,未知,计算求得0.2203,20,在时,。则总体均值的置信区间为: 即为(5.107,5.313)。故我们可以95的概率保证这批钢件的屈服点均值在5.107吨/cm2与5.313吨/cm2之间。(2) 在时, ,,查表可得: ,,0.2203,20 则方差的置信区间为: 即为(0.1675,0.3218) 故我们可以95的概率保证这批钢件的屈服点的方差在0.1675与0.3218之间。77 / 2477
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100