资源描述
Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,抽样调查,原理与方法,第一节 概述,一,.,什么是多阶段抽样,分多个阶段抽到最终接受调查的样本。,初级单元(,PSU,),-Primary Sampling Unit,二级单元,(SSU)-Second-stage Sampling Unit,三级单元(,TSU,),-Third-stage Sampling Unit,最终单元,(USU)-Ultimate Sampling Unit,多阶段抽样推断原理,以单位大小相同的二阶段抽样为例,推导 过程,第二节 初级单元大小相 等时的二阶抽样,与整群抽样比较一下,估计量方差一般公式为:,于是有:,(,1,),假定,n=1,第二阶段抽取,m,个单位,用 估计 ,误差大小取决于 和,m,,,即,其次,用 推断 时,第二次推断误差大小取决于 和,n,,,当,n=1,时,这时,若以,n,个 的均值 推断 ,其方差为,再考虑,fpc,则(,1,)式成立。,证明:,(,2,)即 是 的无偏估计,但,不是,的无偏估计,计算 时 不受二阶抽样影响,计算 的 则不然。,即:,(,3,),【,例,8.1,】,欲调查,4,月份,100,家企业的某项指标,首先从,100,家企业中抽取了一个含有,5,家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水帐,为了减轻样本企业的负担,调查人员对这,5,家企业分别在调查月内随机抽取,3,天作为调查日,要求样本企业只填写这,3,天的流水帐。调查的结果如下:,要求根据这些数据推算,100,家企业该指标的总量,并给出估计的,95,置信区间。,样本企业,第一日,第二日,第三日,1,57,59,64,2,38,41,50,3,51,60,63,4,48,53,49,5,62,55,54,样本企业,1,60,13,2,43,39,3,58,39,4,50,7,5,57,19,方差估计式中,第一项是主要的,第二项要小得多,这是因为第二项的分母是第一项的,m,倍,而且它还要乘以小于,1,的,f1,如果第一阶的抽样比,f1,可以忽略,则方差估计式可以简单为如下的结果:,这个结果在实际工作中非常有用,因为第二阶抽样采用等距抽样或某些复杂抽样时,方差的无偏估计很难得到,当,f1,可以忽略时,只需要初级单元的均值就可以得到方差的估计。,(,4,),(,5,),由上式看出,,m,与 ,成正比,与 ,成反比。,求出,m,后,利用(,4,),(,5,)式,即可求出,n.,分层二阶段抽样时的估计,第一阶段:分层抽样,同一层内初级单元大小相等,总体均值的估计,第三节,初级单元大小不等时的二阶抽样,为常数,按简单随机抽样抽取初级单元,简单估计量,自加权条件:第二阶(段)抽样比为一个常数,比率估计量,第四节 多阶段抽样,各级单元大小相等时的三阶段抽样,各级单元大小不等时的三阶段抽样:,总体总和的无偏估计量,不等概抽样在 多阶段抽样中的应用,【,例,8.5,】,某调查公司接受了一项关于全国城市成年居民人均奶制品消费支出及每天至少喝一杯鲜奶的人数的比例情况的调查。,确定抽样范围为全国地级及以上城市中的成年居民。成年居民指年满,18,周岁以上的居民。,第一步:确定抽样方法,调查公司决定采用多阶段抽样方法进行方案设计,调查的最小单元为成年居民。确定调查的各个阶段为城市、街道、居委会、居民户,在居民户中利用二维随机表(,Kish,随机表的简化)抽取成年居民。,第二步:确定样本量及各阶段样本量的配置,=3.2,初级单元:,20,个城市;,二级单元:,80,个街道,每个样本行政区内抽,4,个街道;,三级单元:,160,个居委会,每个样本街道内抽,2,个居委会;,四级单元:,1600,个居民户,每个样本居委会内抽,10,户居民户。,在样本居民户内,利用二维随机表抽,1,名成年居民。,第三步:抽样方法,第一阶段,在全国城市中按与人口数成比例的放回的不等概抽样,即,PPS,抽样。,第二和第三阶段分别按与人口数成比例的不等概系统抽样。,以第二阶段为例,在某个被抽中的样本城市中,将其所属的街道编号,搜集各街道的人口数,赋予每个街道与其人口相同的代码数;根据该市总人口数除以样本量,4,,确定抽样间距;然后对代码进行随机起点的等距抽样,则被抽中代码所在的街道为样本街道。,第四阶段,分别在每个样本居委会中,按等距抽样抽出,10,个居民户。即根据居委会拥有的居民户数除以样本量,10,得到抽样间距,然后随机起点的等距抽样。,第四步:推算方法,各样本城市人均奶制品消费支出为:,成年居民人均奶制品消费支出为,
展开阅读全文