1、一、抽样的必要性 调查调查的客体是由许许多多的个人、群体和组织所的客体是由许许多多的个人、群体和组织所构成的最复杂的总体。其通常既无法象工程测量构成的最复杂的总体。其通常既无法象工程测量或科学实验那样要求进行次数很多的重复性测量或科学实验那样要求进行次数很多的重复性测量或调查,也无法象工程测量或科学实验那样要求或调查,也无法象工程测量或科学实验那样要求进行全面的测量或调查。进行全面的测量或调查。另外,调查的主体人财物资源有限,根本无法另外,调查的主体人财物资源有限,根本无法进行全面调查。进行全面调查。优点:费用少速度快准确性高 二、抽样的程序 1 1、定义总体、定义总体2 2、建立或选择抽样框
2、建立或选择抽样框3 3、定义样本数目、定义样本数目4 4、确定抽样方法、确定抽样方法5 5、抽选样本、抽选样本 三、抽样中基本的程序 抽样程序抽样程序1 1、确定目标人群或总体、确定目标人群或总体 内容:内容:1 1、构成分析的单位是什么?、构成分析的单位是什么?2 2、抽样的单位是什么?、抽样的单位是什么?3 3、什么东西指定包括在内?、什么东西指定包括在内?4 4、时限怎么样,即要获取的信息属于哪一段时间?、时限怎么样,即要获取的信息属于哪一段时间?5 5、空间限制如何,是那些地区,是否限于城市,或、空间限制如何,是那些地区,是否限于城市,或城市的繁华街区?城市的繁华街区?抽样 程序2、
3、建立或选择抽样框建立或选择抽样框抽样框-是构成总体的全部单元的“家庭聚会”街道居委名录、企业名录、电话本、选民花名册、俱乐部名录 抽样程序抽样程序3 3、定义样本数目定义样本数目确定样本容量要考虑的因素确定样本容量要考虑的因素 (1 1)总体变异程度)总体变异程度(2 2)调查精度要求)调查精度要求(3 3)总体规模)总体规模(4 4)抽样方式)抽样方式(5 5)回答率)回答率(6 6)分组需要)分组需要(7 7)调查经费)调查经费(8 8)时间限制)时间限制(9 9)人力资源限制)人力资源限制(1010)其他设施、工具等限制)其他设施、工具等限制影响样本规模的因素可分为两个方面 与满足数据的
4、可靠性要求有关的因素(如调查经费、时间限制、人力资源)与实际操作上的限制有关的因素(如总体变异、调查精度、总体规模、抽样方式、回答率)基本基本样本样本含量的估计含量的估计估算公式估算公式连续型变量资料:连续型变量资料:离散型变量资料离散型变量资料:估计样本含量的依据估计样本含量的依据 总体中个体的变异程度总体中个体的变异程度 精度即相对误差精度即相对误差 置信程度(置信程度(1)确定确定样本量的程序样本量的程序 (1 1)根根据据估估计计参参数数性性质质、总总体体变变异异大大小小和和调查精度要求计算基本样本量。调查精度要求计算基本样本量。(2 2)根据总体规模对基本样本量进行调整。)根据总体规
5、模对基本样本量进行调整。(3 3)根据抽样方式的设计效应调整样本量。)根据抽样方式的设计效应调整样本量。(4 4)根据预期回答率调整样本量。)根据预期回答率调整样本量。(5 5)根根据据客客户户以以及及调调查查计计划划确确定定是是否否需需要要分组进行样本量计算。分组进行样本量计算。(6 6)根据时间经费等各种限制调整样本量。)根据时间经费等各种限制调整样本量。按照确定样本量的程序来介绍如何确定样本容量步骤具体如下:第一步第一步 根据估计参数性质、总体变异大小和调查精度要 求计算基本样本量,其计算公式为:总体变异程度和调查精度要求是确定样本容量要考虑的两个基本因素。通常总体的标准差未知的,一般用
6、下面五种方法来解决:利用以前的调查结果和经验利用试调查或预调查的结果利用同类或相似或有关的二手资料利用某些理论上的结论利用专家的判断。第二步第二步 根据总体规模对基本样本量进行调整,其计算公式为:这是通过有限总体修正系数(fpc=(Nn)/N)对样本容量产生影响的推导过程:由 推出 2220/dSZn=001nNNnn+=-NnNnfpcnn 1001=第三步第三步 根据抽样方式的设计效应调整样本量,其计算公式为:抽样方式对样本量的影响表现为与简单随机抽样相比的情况 设计效应deff是指任意抽样方式下的抽样方差除以简单随机抽样方式下抽样方差的商简单随机抽样的deff=1 分层随机抽样的deff
7、1 整群随机抽样的deff1 机械随机抽样的deff1 第四步第四步 根据预期回答率调整样本量,其计算公式为:调查回答率r是指实际回收的有效问卷数与计划回收的有效问卷数之比 第五步第五步 根据客户以及调查计划确定是否需要分组进行样本量计算第六步第六步 根据时间、经费等各种限制调整样本量抽样程序4、明确抽样方法 见“抽样基本方法”抽样程序5、抽选样本 是指按指定方法抽取受访者是指在某一特定地区或任何地区,按照一系列标准直接指定受访者的抽样方法。【抽样程序4】抽样基本方法掌握几种抽样的概念掌握几种抽样的概念熟悉常用抽样方法的实施熟悉常用抽样方法的实施了解多阶段分层随机抽样方法了解多阶段分层随机抽样
8、方法解决用什么方法抽解决用什么方法抽(抽样方法)、(抽样方法)、抽多少(抽多少(样本含量样本含量)、)、怎么抽(怎么抽(实施步骤实施步骤)、)、如何分析(如何分析(参数估计)参数估计)等几个问题?等几个问题?基本调查方法:基本调查方法:普查普查(全面调查)(全面调查)典型调查典型调查 抽样调查抽样调查总体总体与样本与样本抽样抽样基本抽样方法基本抽样方法非概率抽样非概率抽样概率抽样概率抽样PPS抽样抽样基本抽样方法基本抽样方法(一一)非概率抽样非概率抽样偶遇抽样或自然抽样:偶遇抽样或自然抽样:街头随访,邮寄调查等街头随访,邮寄调查等判断式抽样:判断式抽样:销售需求调查销售需求调查配额抽样:配额抽
9、样:居民家庭情况调查居民家庭情况调查滚雪球抽样:滚雪球抽样:SARS流调,调查老年人的生活状流调,调查老年人的生活状况况空间抽样:空间抽样:广告公司调查广告公司调查基本抽样方法(二)基本抽样方法(二)概率抽样概率抽样 单纯单纯【简单简单】随机抽样随机抽样系统抽样系统抽样整群抽样整群抽样分层抽样分层抽样多阶段抽样多阶段抽样概率抽样(一)概率抽样(一)单纯随机抽样单纯随机抽样:定义:定义:又称简单随机抽样,简单任意抽样等,又称简单随机抽样,简单任意抽样等,指从总体指从总体N个抽样单元中,每次抽取一个单元时,个抽样单元中,每次抽取一个单元时,使每个单元都有相同的概率被抽中,连续抽取使每个单元都有相同
10、的概率被抽中,连续抽取n次,组成简单随机样本样本。次,组成简单随机样本样本。优点:优点:方法简单,易于操作,是其它抽样方法的方法简单,易于操作,是其它抽样方法的基础基础 缺点:缺点:要求总体同质性好,未充分利用总体的要求总体同质性好,未充分利用总体的其他信息,大样本不使用其他信息,大样本不使用 抽样方法:抽样方法:抽签法、随机数字法、随机数骰子法抽签法、随机数字法、随机数骰子法 抽签法 随机数法 使用统计软件直接抽取 准备2000张卡片,写上所有学生的编号,摇匀后抽出300名学生利用随机数表,从09的第一个个位数,以及两位数,三位数符合某个规律。SPSS,EXCEL,S-PLUS 等概率抽样(
11、二)系统抽样:系统抽样:定义:定义:或称等距抽样、机械抽样。将总体的观或称等距抽样、机械抽样。将总体的观察单位按照顺序排列或标志后,每隔一定的距离察单位按照顺序排列或标志后,每隔一定的距离抽取一个单位作为样本。抽取一个单位作为样本。优点:优点:更具代表性,方法简单,易操作,应用更具代表性,方法简单,易操作,应用广泛广泛 缺点:缺点:周期性影响周期性影响概率抽样(三)整群抽样:整群抽样:定义:定义:将总体各观察单位划分为若干群,随机将总体各观察单位划分为若干群,随机抽取一部分群,对改该群内所有单位进行调查的抽取一部分群,对改该群内所有单位进行调查的方法。方法。分群原则:分群原则:尽量扩大群内变异
12、尽量扩大群内变异概率抽样概率抽样 (四)(四)分层抽样:分层抽样:定义:定义:也叫类型抽样,指在抽样之前,先将总体划分也叫类型抽样,指在抽样之前,先将总体划分称若干层次,然后在每个层中独立抽样。称若干层次,然后在每个层中独立抽样。分层原则分层原则 :尽量减小层内变异尽量减小层内变异步骤:步骤:获得总体相关信息获得总体相关信息确定分层标准和层数确定分层标准和层数确定各层样本含量确定各层样本含量各层独立抽样各层独立抽样概率抽样概率抽样 (五)(五)多阶段抽样:多阶段抽样:定义:定义:根据实际情况将整个抽样程序分成若干个阶段,根据实际情况将整个抽样程序分成若干个阶段,一个阶段一个阶段地进行抽样,以完
13、成整个抽样过一个阶段一个阶段地进行抽样,以完成整个抽样过程,这种抽样就叫多阶抽样。程,这种抽样就叫多阶抽样。特点:特点:便于组织抽样便于组织抽样;抽样方式灵活,有利于提高抽样方式灵活,有利于提高抽样的估计效率;便于组织实施;应用广泛。抽样的估计效率;便于组织实施;应用广泛。例:全国职工收入调查抽样方案例:全国职工收入调查抽样方案#配额抽样 是一种抽选一群特定数目的满足特定条件的受访者的是一种抽选一群特定数目的满足特定条件的受访者的抽样方法抽样方法 和概率抽样中的分层抽样有些类似和概率抽样中的分层抽样有些类似各种概率抽样方法比较单纯随机抽样系统抽样整群抽样分层抽样优点简单直观,其它抽样基础,计算
14、简便易理解,简便易行;易得到按照比率分配的样本;便于组织,节省经费,容易控制调查质量可独立分析层参数;灵活,信息利用好缺点大样本不使用,变异大时代表性差周期性影响大抽样误差大层变量选择适用范围总体不大的情况按抽样顺序个体随机分布情况群间差异小层间差异大抽样误差大较小最大小五、抽样设计注意的事项五、抽样设计注意的事项抽样设计通常需要取得客户的认可 在精度与预算之间求得平衡 必须与问卷甄别部分相呼应 必须与数据处理方案相呼应 六、抽样原理一、抽样科学性依据部分来自于全体,必带有反映全体的信息;构成(同质)总体的一些个体之间在性质上必定相似或相近,所以彼此有相当代表性;不管原始分布如何,样本平均数的
15、分布总可视为正态分布,而且由此得到总体参数准确估计的概率值极大。二、样本均值的抽样分布 大样本均值的抽样分布及其特征根据单个样本推断 点估计和区间估计 样本比例的抽样分布与总体比例估计三、样本容量的确定 样本均值的抽样分布 1.大样本均值的抽样分布特征是正态分布 分布的均值等于总体均值分布的标准差称为均值的标准差,等于总体标准差除以样本容量的平方根具体公式如下:2.根据单个样本推断 3.点估计和区间估计点估计是把样本均值作为总体均值的估计值,是一个数值点的估计。区间估计是用一个区间去估计总体均值,即把总体均值估计在某两界限之间。总体均值的区间估计步骤及置信区间 4.样本比例的抽样分布与总体比例估计样本比例的抽样分布类似于样本均值的抽样分布,其特征这里不再赘述。简单随机抽样公式 不放回抽样方法的参数计算公式:放回抽样方法的参数计算公式:七、估计七、估计 点估计是把样本平均值作为总体平均数的估计值。区间估计就是对变量值如总体平均值的区间或范围进行估计。实实际际总总体体平平均均值值在在该该区区间间范范围围之之内内的的概概率率通通常常被称为置信系数或是置信度,被称为置信系数或是置信度,区间则被称为置信区间。区间则被称为置信区间。抽抽样样误误差差是指样本平均值与真实总体平均值的差距。由于只是根据一次简单随机抽样得到的一个样本的样本平均数来估计总体平均值,这种误差几乎不可避免。






