1、社會調查理論與方法教學幻燈片社會調查理論與方法教學幻燈片1 12024/9/7 2024/9/7 周六周六社會調查理論與方法教學幻燈片社會調查理論與方法教學幻燈片2 22024/9/7 2024/9/7 周六周六5抽样调查抽样调查l l抽样调查抽样调查是指从全体被研究对象中,按照是指从全体被研究对象中,按照一定的方法抽取一部分对象作为代表进行一定的方法抽取一部分对象作为代表进行调查分析,以此推论全体被研究对象状况调查分析,以此推论全体被研究对象状况的一种调查方式。的一种调查方式。l l总体总体总体总体(population)(population)(population)(population
2、)总总总总体体体体通通通通常常常常与与与与构构构构成成成成它它它它的的的的元元元元素素素素(element)(element)(element)(element)共共共共同同同同定定定定义义义义;总总总总体体体体是是是是构构构构成成成成它它它它的的的的所所所所有有有有元元元元素素素素的的的的集集集集合合合合,而而而而元元元元素素素素则则则则是是是是构构构构成成成成总总总总体体体体的的的的最最最最基基基基本本本本单位。单位。单位。单位。l l样本样本样本样本(Sample)(Sample)(Sample)(Sample)样本就是从总体中按一定方式抽取出的一部分元素的样本就是从总体中按一定方式抽取
3、出的一部分元素的样本就是从总体中按一定方式抽取出的一部分元素的样本就是从总体中按一定方式抽取出的一部分元素的集合。集合。集合。集合。l l抽样抽样抽样抽样(Sampling)(Sampling)(Sampling)(Sampling)抽样是从总体中按一定方式选择或抽取样本的过程。抽样是从总体中按一定方式选择或抽取样本的过程。抽样是从总体中按一定方式选择或抽取样本的过程。抽样是从总体中按一定方式选择或抽取样本的过程。社會調查理論與方法教學幻燈片社會調查理論與方法教學幻燈片3 32024/9/7 2024/9/7 周六周六l l抽样单位抽样单位抽样单位抽样单位(Sampling Unit)(Sam
4、pling Unit)(Sampling Unit)(Sampling Unit)抽抽抽抽样样样样单单单单位位位位就就就就是是是是一一一一次次次次直直直直接接接接的的的的抽抽抽抽样样样样所所所所使使使使用用用用的的的的基基基基本本本本单单单单位位位位l抽样框抽样框(Sampling Frame)(Sampling Frame)抽样框也叫抽样范围是指一次抽样时总体中抽样框也叫抽样范围是指一次抽样时总体中所有抽样单位的名单。所有抽样单位的名单。l l调查对象和调查总体调查对象和调查总体调查对象和调查总体调查对象和调查总体 调查对象是调查过程中获取社会信息的最基调查对象是调查过程中获取社会信息的最基
5、调查对象是调查过程中获取社会信息的最基调查对象是调查过程中获取社会信息的最基层单位。调查总体是全部调查对象的集合体层单位。调查总体是全部调查对象的集合体层单位。调查总体是全部调查对象的集合体层单位。调查总体是全部调查对象的集合体。l l参数值和统计值参数值和统计值参数值和统计值参数值和统计值l l抽样误差抽样误差抽样误差抽样误差 是指样本统计量和总体参与之间的差异。是指样本统计量和总体参与之间的差异。是指样本统计量和总体参与之间的差异。是指样本统计量和总体参与之间的差异。l l随机抽样与非随机抽样随机抽样与非随机抽样随机抽样与非随机抽样随机抽样与非随机抽样社會調查理論與方法教學幻燈片社會調查理
6、論與方法教學幻燈片4 42024/9/7 2024/9/7 周六周六抽样调查的特点抽样调查的特点l l它以足够数量的调查单位组成的它以足够数量的调查单位组成的“样本样本”来代表和说明总体。来代表和说明总体。l l一般按随机原则抽取调查单位。一般按随机原则抽取调查单位。l l以样本推断总体的误差可以事先计算并加以样本推断总体的误差可以事先计算并加以控制。以控制。l l节省人力、物力和时间。节省人力、物力和时间。社會調查理論與方法教學幻燈片社會調查理論與方法教學幻燈片5 52024/9/7 2024/9/7 周六周六抽样调查的应用抽样调查的应用l l总体范围较大,调查对象较多。总体范围较大,调查对
7、象较多。l l实际工作中,不可能进行全面调查,而又实际工作中,不可能进行全面调查,而又需要了解其全面情况的调查。需要了解其全面情况的调查。l l虽可以但没有必要进行全面调查的事物。虽可以但没有必要进行全面调查的事物。l l对普查统计资料的质量进行检验、修正。对普查统计资料的质量进行检验、修正。大数定律也称大数法则,是指在大量观察或多大数定律也称大数法则,是指在大量观察或多次试验的情况下,随机现象的偶然离差趋向于互次试验的情况下,随机现象的偶然离差趋向于互相抵消,总体呈现出稳定的统计规律性。相抵消,总体呈现出稳定的统计规律性。抽样调查的方法 概率抽样概率抽样简单随机抽样等距随机抽样分层随机抽样整
8、群随机抽样多阶段随机抽样常用的方法常用的方法:A A、总体元素较少时,、总体元素较少时,直接抽样直接抽样法法 B B、总体元素较少时,类似于、总体元素较少时,类似于抽签或抓阄抽签或抓阄方法方法 C C、总体元素较多时,、总体元素较多时,随机数表随机数表法法基本原理:基本原理:从从N N中抽取中抽取n n 练习练习 1 1:我系共有学生我系共有学生300300人,系学生会打算采人,系学生会打算采用简单随机抽样的办法,从中抽取用简单随机抽样的办法,从中抽取6060人进行调查。人进行调查。1.1.简单随机抽样简单随机抽样具体方法具体方法(总体元素少时总体元素少时):先编制一个抽样框,把总体各单位编上
9、号码写在纸片上搓成纸团,作成先编制一个抽样框,把总体各单位编上号码写在纸片上搓成纸团,作成签和阄签和阄(给每个学生编号,从(给每个学生编号,从001001到到300300,并写在纸片上),并写在纸片上);然后,把签和阄放在一个盒子内搅拌均匀;然后,把签和阄放在一个盒子内搅拌均匀;最后,随机从盒子内抽取签和阄,被抽中的签和阄上的号码所代表的单最后,随机从盒子内抽取签和阄,被抽中的签和阄上的号码所代表的单位就是样本,直到抽满规定的样本为止位就是样本,直到抽满规定的样本为止(从(从300300张纸条里抽取张纸条里抽取6060张,张,并找相关同学)。并找相关同学)。特点特点:总体单位很多时,写号码的工
10、作量就很大,搅拌均匀也不容易,:总体单位很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法经常在总体规模较小的时候使用因而此法经常在总体规模较小的时候使用随随机机数数表表总体元素多时,采用随机数表利用随机数表进行抽样的利用随机数表进行抽样的具体步骤具体步骤:先取得一份总体所有元素的先取得一份总体所有元素的名单名单(即抽样框即抽样框)将总体中所有元素一一按顺序将总体中所有元素一一按顺序编号编号 根据总体规模是几位数来根据总体规模是几位数来确定确定合适的随机数表合适的随机数表以总体的规模为标准,对随机数表中的数码逐一进行以总体的规模为标准,对随机数表中的数码逐一进行衡量衡量并决并决定取舍定取
11、舍 根据样本规模的要求根据样本规模的要求选择选择出足够的数码个数出足够的数码个数 依据从随机数表中选出的数码,到抽样框中去依据从随机数表中选出的数码,到抽样框中去找出找出它所对应的它所对应的元素元素 练习练习 2 2对照随机数表,练习随机抽样。对照随机数表,练习随机抽样。要从要从30003000个人(或其他分析单位)的总体中用简单个人(或其他分析单位)的总体中用简单随机抽样的方法选取随机抽样的方法选取100100个人作为样本进行调查。个人作为样本进行调查。步步 骤骤首先,将总体中所有的人编码首先,将总体中所有的人编码:本例中编码为:本例中编码为1-1-30003000。接下来的问题是从随机数表
12、中随机选取。接下来的问题是从随机数表中随机选取100100个数字。这个数字。这100100个数字所对应的人就是样本。个数字所对应的人就是样本。接下来是确定所选择的随机数需要几位数接下来是确定所选择的随机数需要几位数。需要有四。需要有四位数字才能保证所有人都有被选中的机会位数字才能保证所有人都有被选中的机会 。(如果。(如果总数为总数为2165421654的话,需要选择五位数的随机数)。因的话,需要选择五位数的随机数)。因此,我们要从此,我们要从00010001到到99999999的数字中抽取的数字中抽取100100个随机个随机数。数。我们可以我们可以随意随意确定表格中选取数字的顺序:依纵列的方
13、向确定表格中选取数字的顺序:依纵列的方向向下选取,也可以依纵列的方向往上选取,由左到右或者由右向下选取,也可以依纵列的方向往上选取,由左到右或者由右到左,也可以依对角线的方式选取。什么方式并不重要,到左,也可以依对角线的方式选取。什么方式并不重要,关键关键是从头到尾贯彻使用这种方法是从头到尾贯彻使用这种方法。这里我们为了方便选择从纵列。这里我们为了方便选择从纵列方向,当一列到了末端时,可以从下一列最顶端选起,当一页方向,当一列到了末端时,可以从下一列最顶端选起,当一页选完以后,可以从下一页的第一纵列继续选取。选完以后,可以从下一页的第一纵列继续选取。现在,现在,我们决定从那里开始我们决定从那里
14、开始。可以闭着眼睛随便戳一个数字。可以闭着眼睛随便戳一个数字。也可以随意想一个行号和列号,譬如第五行第三列作为开始。也可以随意想一个行号和列号,譬如第五行第三列作为开始。假设我们从第五行第三列的数字作为起点,会看到这假设我们从第五行第三列的数字作为起点,会看到这个数字是个数字是09060906,那么第一个样本就为,那么第一个样本就为09060906,由第三,由第三列往下,我们选择列往下,我们选择00410041,25072507,26832683,然后从下,然后从下一列开始。一列开始。依次进行,选足依次进行,选足100100个随机数个随机数。样本的编码就为。样本的编码就为09060906等。等
15、。随机数表抽样随机数表抽样例例随机数表中的数码选用的数码不选用的原因09063020004125074310604226832507117609060041250726831176大于3000大于3000大于3000与所选的第三个数码重复是把总体的单位进行编号排序后,在计算出来某种是把总体的单位进行编号排序后,在计算出来某种间间隔隔,然后按照这一固定的间隔抽取个体的号码来组成,然后按照这一固定的间隔抽取个体的号码来组成样本的方法。样本的方法。练习练习1 1:在某大学总共在某大学总共30003000名学生中,抽取一个名学生中,抽取一个容量为容量为100100的大学生样本。的大学生样本。2.2.等
16、距随机抽样等距随机抽样具体步骤具体步骤给总体中的每一个个体按顺序编号,即给总体中的每一个个体按顺序编号,即制定出抽样框制定出抽样框 计算出计算出抽样间距抽样间距。计算方法是用总体的规模除以样本。计算方法是用总体的规模除以样本的规模的规模:K KN N(总体规模)n n(样本规模)K=K=在最前面的在最前面的K K个个体中,采用简单随机抽样的方法抽取一个个体,个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号记下这个个体的编号(假设所抽取的这个个体的编号为假设所抽取的这个个体的编号为A A),它称,它称做做随机的起点随机的起点 e.g.e.g.如果如果K=10K=10,就从,就从0
17、1-1001-10号中抽签决定一个号码作为起点,号中抽签决定一个号码作为起点,假定为假定为0505在抽样框中在抽样框中,自自A A开始,每隔开始,每隔K K个个体抽取一个个体,即个个体抽取一个个体,即所抽取个所抽取个体体的编号分别为的编号分别为A A,A A十十K K,A A十十2K2K,A A十十(n(n一一1)K 1)K 将这将这n n个个体合起来,就构成了该总体的个个体合起来,就构成了该总体的一个样本一个样本 001011021031091002012022032092003013023033093004014024034094005015025035095006016026.09600
18、7017027097008018028098009019029099010020030100随机起始的等距随机抽样 如果我们要从某城市电话号码簿中产生一个如果我们要从某城市电话号码簿中产生一个容量为容量为300300的样本,已知该市电话号码簿共的样本,已知该市电话号码簿共900900页(或页(或921921页),每页有页),每页有2 2栏号码,每栏有栏号码,每栏有6060行行(个)号码,请问如何用等距随机抽样抽取样本(个)号码,请问如何用等距随机抽样抽取样本?练习练习2 2值得注意的是,等距随机抽样的一个十分重要的前提条值得注意的是,等距随机抽样的一个十分重要的前提条件,是件,是总体中个体的排
19、列,相对于研究的变量来说,应总体中个体的排列,相对于研究的变量来说,应是随机的是随机的,即,即不存在某种与研究变量相关的规则分布不存在某种与研究变量相关的规则分布。否则,等距随机抽样的结果将会产生极大的偏差。否则,等距随机抽样的结果将会产生极大的偏差。因此,我们在使用等距随机抽样方法时,一定要注意因此,我们在使用等距随机抽样方法时,一定要注意抽抽样框的编制方法。样框的编制方法。注意注意:总体名单中,个体的排列具有某种次序上的先后、等级上的高低总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况的情况 例如例如:我们从:我们从20002000户家庭的社区,抽取户家庭的社区,抽取5050
20、户进行消费状况的户进行消费状况的调查,而调查,而20002000户家庭的名单是按照家庭收入的多少按照由高到低户家庭的名单是按照家庭收入的多少按照由高到低排列的。排列的。抽样间距抽样间距=2000/50=40=2000/50=40 如果两个人选择样本,一个人选择初始号码为如果两个人选择样本,一个人选择初始号码为3 3,另一个人选,另一个人选择初始号码为择初始号码为3838,那么肯定前者家庭平均收入远远高于后者。,那么肯定前者家庭平均收入远远高于后者。解决措施解决措施:重新编排总体名单;改用其他抽样方法。:重新编排总体名单;改用其他抽样方法。总体名单中,个体的排列上有与抽样间隔相对应的周期性分布总
21、体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况的情况 例如:例如:某大学总共某大学总共30003000名学生,抽取名学生,抽取100100人,抽样间隔为人,抽样间隔为3030。但是如果总体名单按教学班排列、每班刚好。但是如果总体名单按教学班排列、每班刚好3030人左右,而人左右,而且各班的名单按照成绩高低排列,如果样本的初始号为且各班的名单按照成绩高低排列,如果样本的初始号为2 2号,那号,那么样本全是好学生;如果样本初始号为么样本全是好学生;如果样本初始号为25 25 号,样本全部为差学号,样本全部为差学生。生。3.3.分层随机抽样分层随机抽样 是先将总体中的所有单位是先将总体中
22、的所有单位按某种特征或标志按某种特征或标志(如性(如性别、年龄、职业或地域等)划分为若干类型或层次,然别、年龄、职业或地域等)划分为若干类型或层次,然后再在各个类型或层次中采用后再在各个类型或层次中采用简单随机抽样或等矩随机简单随机抽样或等矩随机抽样抽样的方法抽取一个子样本,最后,将这些子样本的方法抽取一个子样本,最后,将这些子样本合起合起来构成总体的样本来构成总体的样本。分类分类随机随机抽样抽样总体子群样本分类随机抽样示意图例例:800800家私营企业,抽取家私营企业,抽取100100家。家。(譬如:我们调查的主题是看各种不同类型企业为国家创(譬如:我们调查的主题是看各种不同类型企业为国家创
23、税情况)税情况)步骤:(1 1)800800家企业按产业分为家企业按产业分为3 3个类型,第一产业个类型,第一产业8080个,个,第二产业第二产业320320个,第三产业个,第三产业400400个。个。(2 2)第一产业)第一产业10%10%,100*10%100*10%应该抽取应该抽取1010个个 第二产业第二产业40%40%,100*40%100*40%应该抽取应该抽取4040个个 第三产业第三产业50%50%,100*50%100*50%应该抽取应该抽取5050个个 (3 3)按照简单随机抽样或等距随机抽样抽取样本。按照简单随机抽样或等距随机抽样抽取样本。优点优点当一个总体其内部分层明显
24、时,分层随机抽样能够当一个总体其内部分层明显时,分层随机抽样能够克服简单随克服简单随机抽样的缺点机抽样的缺点 。采用分采用分层层随机抽样的随机抽样的最基本目的最基本目的,正是在于把异质性较强,正是在于把异质性较强的总体分成一个个同质性较强的子总体,以便提高抽样的效率,的总体分成一个个同质性较强的子总体,以便提高抽样的效率,达到更好的抽样效果。达到更好的抽样效果。分层随机抽样可以提高分层随机抽样可以提高总体参数估计值的精确度总体参数估计值的精确度 有些研究有些研究不仅要了解总体的情形,而且还要了解某些类别的情不仅要了解总体的情形,而且还要了解某些类别的情形形,分,分层层随机抽样可以同时满足这两个
25、要求随机抽样可以同时满足这两个要求,因为我们可以将因为我们可以将每一类每一类(层层)看作一个总体。此外,对总体的不同部分还可以采用看作一个总体。此外,对总体的不同部分还可以采用不同的抽样方法。不同的抽样方法。分层的标准问题分层的标准问题(分层原则):(分层原则):以以调查所要分析和研究的主要变量或相关的变量调查所要分析和研究的主要变量或相关的变量作为分作为分层的标准。层的标准。以以保证各层内部同质性强、各层之间异质性强、突出总保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量体内在结构的变量作为分层变量。作为分层变量。以那些以那些已有明显层次区分的变量已有明显层次区分的变量作为分层
26、变量。作为分层变量。分层的比例问题分层的比例问题:按比例分层按比例分层:指的是按照各种类型或层次中的单位数:指的是按照各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。目同总体单位数目间的比例来抽取子样本的方法。不按比例分层不按比例分层:便于对不同层次的子总体进行专门研:便于对不同层次的子总体进行专门研究或进行相互比较。究或进行相互比较。4.4.整群随机抽样整群随机抽样整群随机抽样整群随机抽样:又称为聚类随机抽样或者集体随机抽:又称为聚类随机抽样或者集体随机抽样),它是从总体中随机抽取一些小的群体,然后由样),它是从总体中随机抽取一些小的群体,然后由所抽出的若干小群体(家庭、
27、学校中的班级、工厂的所抽出的若干小群体(家庭、学校中的班级、工厂的车间、城市中的居委会)内的所有元素构成抽样调查车间、城市中的居委会)内的所有元素构成抽样调查的样本。的样本。最大特点是最大特点是:抽样单位不是单个的个体,而是成群的:抽样单位不是单个的个体,而是成群的个体。个体。从总体中随机抽取一些小的群体,所抽取的若干小群从总体中随机抽取一些小的群体,所抽取的若干小群体内的所有元素构成调查的样本体内的所有元素构成调查的样本。整群随机抽样中对小群体的抽取可采用简单随机抽样、整群随机抽样中对小群体的抽取可采用简单随机抽样、等矩随机抽样或分等矩随机抽样或分层层随机抽样的方法。随机抽样的方法。具体步骤
28、具体步骤 A、先将总体各单位按一定的标准分成许多群体,并将每一个群先将总体各单位按一定的标准分成许多群体,并将每一个群体看做一个抽样单位体看做一个抽样单位。B、利用简单随机抽样、等矩随机抽样或分类随机抽样从这些群利用简单随机抽样、等矩随机抽样或分类随机抽样从这些群体中抽取若干作为样本。体中抽取若干作为样本。C、对样本群体中每一个单位逐个进行调查。对样本群体中每一个单位逐个进行调查。例如例如:某中学共有:某中学共有100100个班级,每班都是个班级,每班都是3030名学生,总共有名学生,总共有30003000名学生,现在要抽名学生,现在要抽300300名学生作为样本进行体检。名学生作为样本进行体
29、检。整群抽样整群抽样示意图示意图划分划分子群子群随机随机抽样抽样优点:优点:简便易行简便易行节省费用节省费用缺点:缺点:样本分布面不广样本分布面不广样本对总体的代表性相对较差样本对总体的代表性相对较差作业:作业:假设我们的总体是全国所有城市的集合假设我们的总体是全国所有城市的集合(600(600个城市个城市),我们要抽取一个规模为,我们要抽取一个规模为4040个城市的样个城市的样本。本。请分别用简单随机抽样、等矩随机抽样、分请分别用简单随机抽样、等矩随机抽样、分类随机抽样和整群随机抽样方法进行抽样,并比类随机抽样和整群随机抽样方法进行抽样,并比较彼此之间的异同。较彼此之间的异同。5.5.多阶段
30、随机抽样多阶段随机抽样 又称为又称为多级随机抽样多级随机抽样或或分段随机抽样分段随机抽样是按抽样元素的是按抽样元素的隶属关系隶属关系或或层次关系层次关系,把抽样过程分,把抽样过程分为几个阶段进行为几个阶段进行 e.g.e.g.大学大学院系院系班级班级学生学生具体操作,例如:多段整群随机抽样具体操作,例如:多段整群随机抽样从总体中随机抽取若干大群,从大群中抽取从总体中随机抽取若干大群,从大群中抽取小群,小群,一层层抽一层层抽,抽到最基本的抽样元素为,抽到最基本的抽样元素为止。止。例例 1:1:调查某市青年工人的状况调查某市青年工人的状况以企业为单位抽样,即以以企业为单位抽样,即以全市所有企业全市
31、所有企业为抽样框,从为抽样框,从中随机抽取一部分企业中随机抽取一部分企业 在抽中的企业里,以在抽中的企业里,以车间车间为抽样单位抽样,即从全部为抽样单位抽样,即从全部车间中抽取若干个车间车间中抽取若干个车间 再在再在抽中的车间抽中的车间内抽取青年工人内抽取青年工人 某县某县2020个乡镇,每个乡镇有个乡镇,每个乡镇有1010个行政村,每个行政村个行政村,每个行政村有有1010个自然村,每个自然村有个自然村,每个自然村有5050户。这样,全县就共户。这样,全县就共有有200200个行政村,个行政村,20002000个自然村,个自然村,1010万户。现在决定万户。现在决定采用多段抽样方法对该县计划
32、生育状况按采用多段抽样方法对该县计划生育状况按5/10005/1000的比的比例进行抽样调查,共抽取例进行抽样调查,共抽取500500户,如何抽?户,如何抽?例2步步 骤骤首先,确定抽样单位。首先,确定抽样单位。根据该县社会组织的根据该县社会组织的4 4个层次,即乡镇、行政村、个层次,即乡镇、行政村、自然村和户,采取自然村和户,采取4 4段抽样抽取样本。乡镇为段抽样抽取样本。乡镇为1 1级单位,级单位,行政村为行政村为2 2级单位,自然村为级单位,自然村为3 3级单位,户为级单位,户为4 4级单位。级单位。(4 4级单位也可以是企业、车间、班组、工人;学校、级单位也可以是企业、车间、班组、工人
33、;学校、年级、班组、学生。)年级、班组、学生。)采用不同的方法,分采用不同的方法,分4 4段逐步抽取样本:段逐步抽取样本:一段抽样,从县抽到乡镇。适宜用分层随机抽样一段抽样,从县抽到乡镇。适宜用分层随机抽样(由于该县乡镇之间经济发展状况差异较大)(由于该县乡镇之间经济发展状况差异较大)具体做法具体做法 首先,编制抽样框首先,编制抽样框。假定以经济发展状况为标准,将。假定以经济发展状况为标准,将该县的该县的2020个乡镇分为经济发展状况较好的、一般的和较个乡镇分为经济发展状况较好的、一般的和较差的差的3 3类,分别为类,分别为4 4个、个、12 12 个、个、4 4个。个。其次,确定样本的数量其
34、次,确定样本的数量。假定在一级单位中抽取。假定在一级单位中抽取25%25%的单位即的单位即5 5个乡镇作为样本。个乡镇作为样本。再次,按照随机抽样和上述比例再次,按照随机抽样和上述比例,在经济状况较好,在经济状况较好的的4 4个乡镇中抽取个乡镇中抽取1 1个乡镇,一般的个乡镇,一般的1212个乡镇中抽个乡镇中抽3 3个乡个乡镇,较差的镇,较差的4 4个乡镇中抽个乡镇中抽1 1个乡镇作为样本。个乡镇作为样本。具体做法:具体做法:首先,编制抽样框。首先,编制抽样框。就是把第就是把第1 1级样本中的级样本中的5 5个乡镇的个乡镇的5050个行政村个行政村(2 2级单位),按一定的标准(如按空间分布)
35、确定他们的编号级单位),按一定的标准(如按空间分布)确定他们的编号1-501-50。其次,计算抽样间隔。其次,计算抽样间隔。假定从第假定从第2 2级单位中抽取级单位中抽取20%20%的单位即的单位即1010个行政村作为第个行政村作为第2 2级样本,其间隔就是级样本,其间隔就是50/10=550/10=5。再次,抽取第一个样本,再次,抽取第一个样本,我们随机抽取第我们随机抽取第3 3个行政村作为样本。个行政村作为样本。这样我们就抽到了第这样我们就抽到了第3 3、8 8、1313、1818、2323、2828、3333、3838、4343、4848这些行政村作为样本。这些行政村作为样本。二段抽样,
36、从乡镇抽到行政村,采用等距随机抽样二段抽样,从乡镇抽到行政村,采用等距随机抽样三段抽样,从行政村抽到自然村,为了便于集中调查,三段抽样,从行政村抽到自然村,为了便于集中调查,节约人财物力和时间,我们采用整群抽样。节约人财物力和时间,我们采用整群抽样。具体做法:具体做法:首先,划分群体首先,划分群体,将,将2 2级样本级样本1010个行政村所属的个行政村所属的100100个自然个自然村,按照地理位置把每两个相近的自然村划分为一个群体,共村,按照地理位置把每两个相近的自然村划分为一个群体,共5050个群体。个群体。其次,抽取第其次,抽取第3 3级样本级样本,即按照随机抽样的原则从,即按照随机抽样的
37、原则从5050个群体个群体中抽出中抽出1010个群体作为第个群体作为第3 3级样本。级样本。四段抽样,从自然村到户。(为了简便,选用简单随机四段抽样,从自然村到户。(为了简便,选用简单随机抽样)抽样)社會調查理論與方法教學幻燈片社會調查理論與方法教學幻燈片45452024/9/7 2024/9/7 周六周六抽样调查的基本方法抽样调查的基本方法随机抽样方法对比表随机抽样方法对比表随机抽样方法对比表随机抽样方法对比表名名名名 称称称称优优优优 点点点点缺缺缺缺 点点点点简单随机抽样简单随机抽样简单随机抽样简单随机抽样方便、易理解,结果可推广到方便、易理解,结果可推广到方便、易理解,结果可推广到方便
38、、易理解,结果可推广到总体总体总体总体抽样框不易建立,费用高、抽样框不易建立,费用高、抽样框不易建立,费用高、抽样框不易建立,费用高、精度低,不一定保证代表性精度低,不一定保证代表性精度低,不一定保证代表性精度低,不一定保证代表性等距随机抽样等距随机抽样等距随机抽样等距随机抽样比简单随机抽样易操作、代表比简单随机抽样易操作、代表比简单随机抽样易操作、代表比简单随机抽样易操作、代表性提高性提高性提高性提高样本的代表性不一定能保证,样本的代表性不一定能保证,样本的代表性不一定能保证,样本的代表性不一定能保证,也可能减低代表性也可能减低代表性也可能减低代表性也可能减低代表性分层随机抽样分层随机抽样分
39、层随机抽样分层随机抽样可包括所有重要的子总体,精可包括所有重要的子总体,精可包括所有重要的子总体,精可包括所有重要的子总体,精度高度高度高度高对许多变量来说不易分层,对许多变量来说不易分层,对许多变量来说不易分层,对许多变量来说不易分层,费用高费用高费用高费用高整群随机抽样整群随机抽样整群随机抽样整群随机抽样易操作,样本集中,成本合理易操作,样本集中,成本合理易操作,样本集中,成本合理易操作,样本集中,成本合理样本分布不均匀,代表性差,样本分布不均匀,代表性差,样本分布不均匀,代表性差,样本分布不均匀,代表性差,误差较大误差较大误差较大误差较大多段随机抽样多段随机抽样多段随机抽样多段随机抽样精
40、度较高,成本较低,抽样工精度较高,成本较低,抽样工精度较高,成本较低,抽样工精度较高,成本较低,抽样工作简便易行作简便易行作简便易行作简便易行计算较复杂,误差机会多计算较复杂,误差机会多计算较复杂,误差机会多计算较复杂,误差机会多社會調查理論與方法教學幻燈片社會調查理論與方法教學幻燈片47472024/9/7 2024/9/7 周六周六非随机抽样方法非随机抽样方法l l偶遇抽样偶遇抽样(Accidental or Convenience Sampling)(Accidental or Convenience Sampling)(Accidental or Convenience Samplin
41、g)(Accidental or Convenience Sampling)l l判断抽样判断抽样(Judgmental or Purposive Sampling)(Judgmental or Purposive Sampling)(Judgmental or Purposive Sampling)(Judgmental or Purposive Sampling)l l定额抽样定额抽样(Quota Sampling)(Quota Sampling)(Quota Sampling)(Quota Sampling)l l滚雪球抽样滚雪球抽样(Snowball Sampling)(Snowbal
42、l Sampling)(Snowball Sampling)(Snowball Sampling)1.1.偶遇抽样偶遇抽样 (accidental sampling)(accidental sampling)又称作又称作方便抽样方便抽样或便利或便利抽样抽样是研究者根据现实情况,是研究者根据现实情况,以自己方便的形式抽取偶然以自己方便的形式抽取偶然遇到的人作为调查对象,遇到的人作为调查对象,或者仅仅选择那些离得最近或者仅仅选择那些离得最近的、最容易找到的人作为调查对象的、最容易找到的人作为调查对象区别区别简单随机抽样简单随机抽样2.2.判断抽样判断抽样 (judgmental sampling)
43、(judgmental sampling)又叫又叫立意抽样立意抽样 (purposive sampling)(purposive sampling)调查者调查者根据研究的目标和自己主观的分析根据研究的目标和自己主观的分析来选择和确来选择和确定调查对象的方法定调查对象的方法难点难点:确定抽样标准:确定抽样标准优点优点:发挥研究者主观能动性:发挥研究者主观能动性缺点缺点:无法判断样本代表性:无法判断样本代表性3.3.配额抽样配额抽样 (quota sampling)(quota sampling)又称作又称作定额抽样定额抽样研究者尽可能地研究者尽可能地依据那些有可能影响研究变量的各种依据那些有可能
44、影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例在总体中所占的比例然后依据依据这种划分以及各类成员的比例然后依据依据这种划分以及各类成员的比例选择调查选择调查对象对象例:例:假设假设某高校有某高校有40004000名学生,其中男生占名学生,其中男生占6060,女生占女生占4040;文科学生和理科学生各占;文科学生和理科学生各占5050;一年;一年级学生占级学生占4040、二年级、三年级、四年级学生分别占、二年级、三年级、四年级学生分别占3030、2020和和l0l0。现在要用定额抽样方法依上述三个变数抽取一现在要用
45、定额抽样方法依上述三个变数抽取一个规模为个规模为100100人的样本人的样本。依据依据总体的构成和样本规模总体的构成和样本规模,我们得到的定额表,我们得到的定额表 男生(男生(6060人)人)女生(女生(4040人)人)文科(文科(3030人)人)理科(理科(3030人)人)文科(文科(2020人)人)理科(理科(3030人)人)年级年级一一 二二 三三 四四一一 二二 三三 四四一一 二二 三三 四四一一 二二 三三 四四人数人数12 9 6 312 9 6 312 9 6 312 9 6 38 6 4 28 6 4 28 6 4 28 6 4 2特点特点:按事先规定的条件,有目的地寻找。按
46、事先规定的条件,有目的地寻找。区别区别分层随机抽样分层随机抽样4.4.滚雪球抽样滚雪球抽样 (snowball sampling)(snowball sampling)当我们无法了解总体情况时,可以当我们无法了解总体情况时,可以从总体中少数成员从总体中少数成员入手入手,对他们进行调查,向他们询问还知道哪些符合,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并再询问他们知道的人。条件的人;再去找那些人并再询问他们知道的人。如同如同滚雪球滚雪球一样,我们可以找到越来越多具有相同性一样,我们可以找到越来越多具有相同性质的群体成员。质的群体成员。社會調查理論與方法教學幻燈片社會調查理論
47、與方法教學幻燈片56562024/9/7 2024/9/7 周六周六抽样的基本程序抽样的基本程序l l设计抽样方案设计抽样方案设计抽样方案设计抽样方案l l界定调查总体界定调查总体界定调查总体界定调查总体l l编制抽样框编制抽样框编制抽样框编制抽样框l l选择抽样方法选择抽样方法选择抽样方法选择抽样方法l l抽取调查样本抽取调查样本抽取调查样本抽取调查样本l l评估样本质量评估样本质量评估样本质量评估样本质量确定样本大小经验确定样本数的大致范围表经验确定样本数的大致范围表总体规模总体规模总体规模总体规模 100100100100人以下人以下人以下人以下100100100100100010001
48、0001000人人人人10001000100010005000500050005000人人人人500050005000500010000100001000010000人人人人1 1 1 1万万万万10101010万人万人万人万人10101010万人以上万人以上万人以上万人以上样本占总体样本占总体样本占总体样本占总体 的比重的比重的比重的比重 50%50%50%50%以上以上以上以上50%50%50%50%20%20%20%20%30%30%30%30%10%10%10%10%15%15%15%15%3%3%3%3%5%5%5%5%1%1%1%1%1%1%1%1%以下以下以下以下(一)抽样框编制
49、(一)抽样框编制(二)抽样概率(二)抽样概率 1.PPS抽样抽样 2.SPS抽样抽样 3.入户后选择回答人入户后选择回答人随机抽样中应注意的问题随机抽样中应注意的问题社會調查理論與方法教學幻燈片社會調查理論與方法教學幻燈片58582024/9/7 2024/9/7 周六周六 为了解普通居民对某种新产品的接受程度,需要在一个城为了解普通居民对某种新产品的接受程度,需要在一个城为了解普通居民对某种新产品的接受程度,需要在一个城为了解普通居民对某种新产品的接受程度,需要在一个城市中抽选市中抽选市中抽选市中抽选1000100010001000户居民开展市场调查,在每户居民中,选择户居民开展市场调查,在
50、每户居民中,选择户居民开展市场调查,在每户居民中,选择户居民开展市场调查,在每户居民中,选择1 1 1 1名名名名家庭成员作为受访者。家庭成员作为受访者。家庭成员作为受访者。家庭成员作为受访者。总体抽样设计总体抽样设计总体抽样设计总体抽样设计 由于一个城市中居民的户数可能多达数百万,除了一些大型的由于一个城市中居民的户数可能多达数百万,除了一些大型的由于一个城市中居民的户数可能多达数百万,除了一些大型的由于一个城市中居民的户数可能多达数百万,除了一些大型的市场研究机构和国家统计部门之外,大多数企业都不具有这样庞大市场研究机构和国家统计部门之外,大多数企业都不具有这样庞大市场研究机构和国家统计部