资源描述
1学习要求理解抽样误差的概念掌握抽样平均误差和抽样极限误差的含义并能运算可以进行参数估计(平均数、成数)2抽样误差抽样误差一、抽样误差的概念二、抽样平均误差三、影响抽样平均误差的因素四、抽样极限误差3抽样误差的概念抽样误差的概念抽样误差是样本指标和总体指标之间数量上的差别。以数学符号表示:4理解抽样误差可以从两方面着手:理解抽样误差可以从两方面着手:抽样误差是指由于抽样的随机性而产生的那一部分代表性误差,不包括登记性误差。也不包括可能发生的偏差。5误误差差登记性误差登记性误差代表性误差代表性误差在调查过程中由于主客观原因引起的登记、汇在调查过程中由于主客观原因引起的登记、汇在调查过程中由于主客观原因引起的登记、汇在调查过程中由于主客观原因引起的登记、汇总或计算等方面的差错而造成的误差总或计算等方面的差错而造成的误差总或计算等方面的差错而造成的误差总或计算等方面的差错而造成的误差由于样本结构由于样本结构由于样本结构由于样本结构和总体结构不和总体结构不和总体结构不和总体结构不同,样本总体同,样本总体同,样本总体同,样本总体不能完全代表不能完全代表不能完全代表不能完全代表总体而产成的总体而产成的总体而产成的总体而产成的样本指标与总样本指标与总样本指标与总样本指标与总体指标的误差体指标的误差体指标的误差体指标的误差偏差偏差随机误差随机误差破坏了抽样的随机原则而产生破坏了抽样的随机原则而产生破坏了抽样的随机原则而产生破坏了抽样的随机原则而产生的误差的误差的误差的误差实际误差实际误差抽样平均误差抽样平均误差是样本指标与总体指标的差别是样本指标与总体指标的差别是样本指标与总体指标的差别是样本指标与总体指标的差别所有可能出现的样本指标的标准差所有可能出现的样本指标的标准差所有可能出现的样本指标的标准差所有可能出现的样本指标的标准差遵守随机原遵守随机原遵守随机原遵守随机原则但可能抽则但可能抽则但可能抽则但可能抽到各种不同到各种不同到各种不同到各种不同的样本而产的样本而产的样本而产的样本而产生的误差生的误差生的误差生的误差6样本统样本统计量计量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统计量样本统计量的某可能值的某可能值抽样分布抽样分布样本统计量所有可能值的样本统计量所有可能值的概率分布概率分布主要样本主要样本统计量统计量平均数比率(成数)方差平均数比率(成数)方差7抽样平均误差是反映抽样误差一般水平的指标,其实质是指抽样平均数的标准差,它反映了是指样本指标与总体指标的平均离差程度,也就是样本指标与总体指标的标准差,通常用 来表示。抽样平均误差抽样平均误差8可以作为衡量样本指标对于全及指标代表性程度的一个尺度。是计算样本指标与全及指标之间变异范围的一个根据。在组织抽样调查中,也是确定抽样单位数多少的计算依据之一。9 影响抽样平均误差的因素1.总体各单位标志值的差异程度;2.样本的单位数;3.抽样的方法;4.抽样调查的组织形式。差异越大,抽样误差异越大,抽样误差越大差越大单位数越多,单位数越多,抽样误差越小抽样误差越小重复抽样的抽重复抽样的抽样误差比不重样误差比不重复抽样的大复抽样的大101.重复抽样的条件下 式中,n为样本容量;为总体标准差。一般情况下是未知,可用样本标准差替代 。11 式中,n为样本容量;为总体成数标准差,一般情况下是未知,可用样本成数标准差替代 。.122.不重复抽样的条件下 式中,N为总体单位数;n为样本容量;X2 为总体方差。一般情况下是未知,可用样本方差替代x 2。式中,N为总体单位数;n为样本容量;P2 为总体成数的方差。一般情况下是未知,可用样本成数方差替代p2。13抽样平均数的平均误差例题:抽样平均数的平均误差例题:某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下月平均工资524534540550560580600660工人数469108643计算样本平均数和抽样平均误差。计算样本平均数和抽样平均误差。14解:先列表解:先列表 xfxf524420961296518453463204676405654094860400360055010550010010005608448000580634804002400600424001600640066031980100003000050280005264015计算平均数即平均工资:计算平均数即平均工资:16抽样成数的平均误差例题:抽样成数的平均误差例题:某钢铁厂生产某种钢管,现从该厂某月生产的某钢铁厂生产某种钢管,现从该厂某月生产的500500根根产品中抽取一个容量为产品中抽取一个容量为100100根的样本。已知一级品率根的样本。已知一级品率为为60%60%,试求样本一级品率的抽样平均误差。,试求样本一级品率的抽样平均误差。解:已知解:已知p=60%p=60%、n=100n=100、N=500N=50017练习:要估计某高校练习:要估计某高校10000名在校生的近视率,现随机从中名在校生的近视率,现随机从中抽取抽取400名,检查有近视眼的学生名,检查有近视眼的学生320名,试计算样本近视率名,试计算样本近视率的抽样平均误差。的抽样平均误差。解:根据已知条件:解:根据已知条件:1 1)在重复抽样条件下,)在重复抽样条件下,样本近视率的抽样平均误差:样本近视率的抽样平均误差:182 2)在不重复抽样条件下,)在不重复抽样条件下,样本近视率的抽样平均误差:样本近视率的抽样平均误差:计算结果表明,用样本的近视率来估计总体的近视率其计算结果表明,用样本的近视率来估计总体的近视率其抽样平均误差为抽样平均误差为2左右(即用样本的近视率来估计总体左右(即用样本的近视率来估计总体的近视率其误差的绝对值平均说来在的近视率其误差的绝对值平均说来在2左右)。左右)。19抽样极限误差抽样极限误差抽样极限误差是指用绝对值形式表示的样本指标与总体指标偏差可允许的最大范围。即:或 maxmax20上面两式可改写成以下两个不等式,即:为总体平均数的估计区间(置信区间)为总体成数的估计区间(置信区间)21例:要估计某乡粮食亩产量和总产量,从该乡2万亩粮食作物中抽取400亩,求得其平均亩产量为400公斤。如果确定抽样极限误差为5公斤,试估计该乡粮食亩产量和总产量所在的置信区间。22即该乡粮食亩产量的区间落在即该乡粮食亩产量的区间落在4005公斤的范围内,即在公斤的范围内,即在395405公斤之间。公斤之间。粮食总产量在粮食总产量在20000(4005)公斤,即在公斤,即在790810万公斤之间万公斤之间23例:要估计某高校10000名在校生的近视率,现随机从中抽取400名,计算的近视率为80,如果确定允许误差范围为4,试估计该高校在校生近视率所在的置信区间。该校学生近视率的区间落在804的范围内,即在7684之间。24抽样误差的概率度抽样误差的概率度基于概率估计要求,抽样极限误差x或p 通常需要以抽样平均误差x或p为标准单位来衡量。把抽样极限误差x或p分别除以x或p得相对数t,表示误差范围为抽样平均误差的t倍。t是测量抽样估计可靠程度的一个参数,称为抽样误差的概率度。25即,抽样极限误差是抽样平均误差的多少倍。我们把倍数t称为抽样误差的概率度26抽样估计的置信度抽样估计的置信度抽样估计的置信度就是表明样本指标与总体指标的误差不超过一定范围的概率保证程度,它一般用F(t)表示。又称抽样估计的概率保证程度。27 置信度与概率度的之间关系:置信度与概率度的之间关系:可以通过正态分布概率表获得281、总体平均数抽样估计的置信度、总体平均数抽样估计的置信度2、总体成数抽样估计的置信度、总体成数抽样估计的置信度29参数估计参数估计一、总体参数的点估计二、总体参数的区间估计30总体参数的点估计总体参数的点估计(一)参数点估计的基本特点(二)抽样估计的优良标准31(一)参数点估计的基本特点 基本特点:基本特点:根据总体指标的结构形式设计根据总体指标的结构形式设计样本指标作为总体参数的估计量,样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相并以样本指标的实际值直接作为相应总体参数的估计值。应总体参数的估计值。例如,样本平均值代表总体平例如,样本平均值代表总体平均数;以抽样调查所获得的人口结均数;以抽样调查所获得的人口结构代表总体的人口结构等。构代表总体的人口结构等。32(二)抽样估计的优良标准 无偏性无偏性 作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总体参数。这样的估计量称为无偏估计量。有效性有效性 以抽样指标估计总体指标要求作为优良估计量的方差应比其它估计量的方差小。一致性一致性 作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标。即方差越小的估计量就越有效一般情况下均可满足33总体参数的区间估计(一)区间估计的基本特点及要素(二)总体平均数(成数)的区间估计34(一)区间估计的基本特点及要素 区间估计的基本特点区间估计的基本特点 根据给定的概率保证度,利用实际抽样资料,指出总体参数可能存在的区间范围。这个区间称为置信区间。区间估计必须具备的三个要素区间估计必须具备的三个要素 (1)估计值 (2)抽样误差范围 (3)概率保证程度 35(二)总体平均数(成数)的区间估计表表达达式式其中,其中,为极限误差为极限误差成成成成数数数数其中,其中,为极限误差为极限误差36(二)总体平均数(成数)的区间估计1.计算抽样平均数和标准差:或抽样成数平均数和成数标准差:简简单单随随机机抽抽样样下下的的一一般般步步骤骤2.计算平均误差:5.结果结果3.计算计算极限误差:4.计算计算区间的上下限:如:可以在如:可以在如:可以在如:可以在1-1-的概率保的概率保的概率保的概率保证程度下,估计证程度下,估计证程度下,估计证程度下,估计*在在在在*之间。之间。之间。之间。如果给定的是概率度,如果给定的是概率度,如果给定的是概率度,如果给定的是概率度,则可查则可查则可查则可查正态分布概正态分布概正态分布概正态分布概率表率表率表率表获得。获得。获得。获得。这是上面所计这是上面所计这是上面所计这是上面所计算的上下限算的上下限算的上下限算的上下限37练习:某制造厂的产品重量服从正态分布,其总体标准差15千克,平均重量未知。现随机抽取一个n=250的样本,计算结果是 65千克。以95的置信度估计总体平均重量的置信区间。解:本题已知条件为:样本容量n=250,XN(65,15);置信水平为95;查正态概率双侧临界值表有:t=1.9638x=tx=1.960.9487=1.86则,651.8665+1.86即95%的估计区间为:63.1466.86计算结果说明,我们有95的把握程度认为总体平均数介于63.14千克到66.86千克之间。39从某厂生产的5000只灯泡中,随机重复抽取100只,对其使用寿命进行调查,调查结果如表 使用寿命(小时)组中值x产品数量fx f3000以下3000 40004000 50005000以上25003500450055002305018500010500022500099000-1480-8401601160677120021168000128000024220800合 计1004340005344000040又该厂质量规定使用寿命在3000小时以下为不合格品。(1)按重复抽样方法,以95.45%的概率保证程度估计该批灯泡的平均使用寿命;(2)按重复抽样方法,以68.27%的置信度估计该批灯泡的合格率。41练习2:对某批成品按重复抽样方法抽选200件检查,其中废品8件,以95的把握程度估计该批成品的废品率范围。42必要抽样数目的确定必要抽样数目的确定确定适当样本容量的意义1.1.在一定的误差允许下,样本容在一定的误差允许下,样本容在一定的误差允许下,样本容在一定的误差允许下,样本容量太大,则会增大工作量,造成量太大,则会增大工作量,造成量太大,则会增大工作量,造成量太大,则会增大工作量,造成人力、财力和时间的浪费。人力、财力和时间的浪费。人力、财力和时间的浪费。人力、财力和时间的浪费。2.2.如查改变了对误差的要求,则如查改变了对误差的要求,则如查改变了对误差的要求,则如查改变了对误差的要求,则可以通过增减样本容量来控制抽可以通过增减样本容量来控制抽可以通过增减样本容量来控制抽可以通过增减样本容量来控制抽样误差的大小。样误差的大小。样误差的大小。样误差的大小。43样本容量的确定样本容量的确定由于由于由于由于44判断1.抽样误差的产生是由于破坏了随机原则所造成的。()2.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。()3.样本指标是一个客观存在的常数。()4.抽样平均误差就是总体指标的标准差。()5.同样条件下,重复抽样误差一定大于不重复抽样误差。()
展开阅读全文