资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,Statistics,第二节 抽样分布,一、样本平均数的抽样分布,二、样本比例的抽样分布,一、样本平均数的抽样分布,(一)样本平均数的期望值与方差,(二)样本平均数的分布规律,二、样本比例的抽样分布,(,一,),样本比例的期望值与方差,(二)样本比例的分布规律,表,5-5,用正态分布来近似时对样本量的要求,总,体,参,数,0.50,0.45,0.40,0.35,0.30,0.25,0.20,0.15,0.10,1,0.50,0.55,0.60,0.65,0.70,0.75,0.80,0.85,0.90,样本量,至少为,n,36,37,38,40,43,48,57,71,100,(三)样本方差的抽样分布,第三节 参数估计,一、参数估计概述,二、总体均值的估计,三、总体比例的估计,四、总体方差的估计,参数估计,假设检验,统计方法,描述统计,推断统计,一、参数估计概述,(一)参数估计的定义与种类,所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函数)。例如,估计总体均值,估计总体比例和总体方差等等。,参数估计有两种基本形式:点估计和区间估计。前者是用一个数值作为未知参数,的估计值,后者则是给出具体的上限和下限,把,包括在这个区间内。下面分别介绍点估计与区间估计的有关概念。,(二)点估计,点估计,主要有矩估计法和最大似然估计法。,矩估计法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量;,最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。,(三)估计量的优良标准,P,(,),B,A,无偏,有偏,2.,有效性:,对同一总体参数的两个无偏点估计,量,有更小标准差的估计量更有效,A,B,的抽样分布,的抽样分布,P,(,),A,B,较小的样本容量,较大的样本容量,P,(,),区间估计 就是以一定的概率保证来估计包含总体指标的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平,表示为,(1-,为是总体参数,未在,区间内的比率,常用的置信水平值有,99%,95%,90%,相应的,为,0.01,,,0.05,,,0.10,(四)区间估计与估计的精度和可靠性,置信区间,由样本统计量所构造的总体参数的估计区间称为置信区间,统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间,用,一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值,我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,置信区间与置信水平,样本均值的抽样分布,(1-,)%,区间包含了,%,的区间未包含,1,a,a,/,2,a,/,2,影响区间宽度的因素,总体数据的离散程度,,用,来测度,样本容量,置信水平,(1-,),,影响,z,的大小,二、总体均值的估计,(二)总体方差,2,未知的情形,2.,区间估计,【,例,5-4】,在例,5-3,中,若总体方差未知,但通过抽取的,6,个样本测得的样本方差为,0.0025,,试在,0.95,的置信度下,求该产品直径的均值置信区间。,三、总体比例的估计,三、总体方差的估计,(二)区间估计,第四节 样本容量的确定,一、问题的提出,二、估计总体均值时样本容量的确定,三、估计总体比例时样本容量的确定,四、使用上述公式应注意的问题,由前面的论述,我们已知参数估计中的精度要求与可靠性要求常常是一对矛盾,但是,通过增加样本容量,n,有可能降低样本平均数的标准差,从而实现既保证一定的估计精度,又具有较高的置信度的目的。这时,需要考虑在给定的置信度与极限误差的前提下,样本容量,n,究竟取多大合适?这就是所谓样本容量的确定问题。,一、问题的提出,二、估计总体均值时样本容量的确定,三、估计总体比例时样本容量的确定,四、使用上述公式应注意的问题,1,计算样本容量时,总体的方差与成数常常是未知的,这时可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,,用试验中方差的最大值代替总体方差,;三是比例方差在完全缺乏资料的情况下,就用比例方差的最大可能值,0.25,代替。,2.,如果进行一次抽样调查,需要同时估计总体均值与比例,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足两方面的需要。,3.,上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:,n,=56.03,,那么,样本容量取,57,,而不是,56,。,本章小结,5,所谓估计就是构造适当的样本统计量,来充当总体参数的估计量。好的统计量的理想性质包括:无偏性、有效性、一致性和充分性。,6,估计包括点估计与区间估计。,7,在给定的置信度与极限误差的前提下,样本容量,n,可利用极限误差、临界值与抽样标准差三者间的数量关系去计算。,8,在,Excel,中可使用各种函数按照有关公式实现区间估计的运算。,
展开阅读全文