1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第八章 多阶抽样,第一节 多阶抽样概述,第二节 一阶单元等大小的两阶抽样,第三节 一阶单元不等大小的两阶抽样,返回,1,第一节 多阶抽样概述,一、多阶抽样的基本概念,根据实际情况将整个抽样程序分成若干个阶段,一个阶段一个阶段地进行抽样,以完成整个抽样过程,这种抽样就叫多阶抽样。从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对它们进行全面调查,我们把这种抽样技术称为两阶抽样。它是由印度统计学家马哈拉诺比斯首先提出来的。,二、多阶抽样的特点,(,一,),便于组织抽样,(,二,
2、),抽样方式灵活,有利于提高抽样的估计效率,(,三,),多阶段抽样对基本调查单元的抽选不是一步到位的,(,四,),多阶段抽样实质上是分层抽样与整群抽样的有机结合,(,五,),多阶抽样在抽样时并不需要二阶或更低阶单元的抽样框,(,六,),多阶抽样还可用于,“,散料,”,的抽样,即散料抽样,2,第二节 一阶单元等大小的两阶抽样,返回,3,4,2,、总体比例的估计,5,3.,最佳抽样比的确定,按费用固定条件下,使方差极小,或在方差固定条件下使费用极小的条件,6,二、分层二阶抽样,设总体分成,L,层,第,h,层有,N,h,个一阶单元,每个一阶单元均含,M,h,个二阶单元。在第,h,层随机抽了,n,h,
3、个一阶单元,又从每个被抽中的一阶单元中随机抽了,m,h,个二阶单元。则的估计量为,其中,7,是按二阶单元的层权;,为第,h,层的样本均值。其方差为,8,方差估计量为,9,其中,上式乘以,10,即总体中每个二阶单元入样的概率都相等,则样本是自加权时,,11,三、三阶抽样,设总体中含有,N,个一阶单元,每个一阶单元又含,M,个二阶单元,而每个二阶单元中又含有,K,个三阶单元,各阶样本大小分别为,n,m,和,k,。,令,y,iju,(u=1,2,K),为第,i,个一阶单元的第,j,个二阶单元中,第,u,个三阶单元的观测值,则,12,13,14,15,16,若,三阶抽样中,每阶抽样都是简单随机的,则总
4、体均值的无偏估计量为,17,其方差为,方差的无偏估计量为,其中,18,第三节 一阶单元不等大小的两阶抽样,在两阶抽样中,各一阶单元所包含的二阶单元数不等是最普遍的现象,因此对其样本指标和抽样方差的估算,具有普遍意义,但较一阶单元等大小的估算复杂很多。根据各个一阶单元的不相等及其差异程度是否悬殊,在抽样时,(,即抽取一阶单元时,),就要考虑采用等概抽样或不等概抽样。,19,一、等概率抽样,在进行两阶段抽样时,不考虑各一阶单元权重,(,主要用所含二阶单元数的多少表示,),的不同,一律予以同等被抽中的机会,在的变 异不大时,既简单易行,且效果也好;当的 变异悬殊时,则会对抽样产生不合理的影响。,假定
5、总体由,N,个一阶单元组成,第,i,个一阶单元包含个 二阶单元。从,N,个一阶单元中按简单随机抽样抽取,n,个一阶单元,然后在每个被抽中的一阶单元中按简单随机抽样抽取个二阶单元。,20,1,、简单估计量,由于两阶段的抽样都是简单随机的,因此总体总和的无偏估计量为,当两阶段均为不放回抽样时,其方差为,21,方差的无偏估计量为,其中,=n/N,为第一阶段抽样比,,,为第,i,个一阶单元内的抽样比;,22,,,若,即第二阶段的抽样比为常数,则,23,可见,此时,是自加权的,,是总体中每个二阶单元入样的概率。,其方差为,方差估计量为,其中,若估计总体均值,则有,24,简单估计量 虽然是无偏的,但效果一般不好,,方差较大。因此也可利用以为辅助变量来构造,比估计量。,2,、比估计量,25,比估计量是有偏的,其估计量 的近似方差为,方差估计量为,26,其中 用 估计,由此易得关于 估计量的相应结果,27,就可得到估计比例,P,的公式。由于二阶单元总数通常,是未知的,这里给出比估计的公式。,设 表示第,i,个一阶单元的二阶样本单元中具有某特性,的单位占的比例,则总体中具有该特性的单位占的比例,的估计量,在估计 的公式中,令,3,、比例的估计,28,其方差估计量,其中,29,30,31,32,33,34,35,36,37,