资源描述
广播收听率调查理论的基础
(一) 常用的抽样方法
在市场调研中,存在各种可选择的抽样方法,可根据总体的特征、调研的目标、费用预算以及运作的可行性选择一个适当的抽样方法。
1. 简单随机抽样(SRS)
简单随机抽样是最基本的概率抽样,是对总体中所有单位按照完全符合随机原则的方法抽取样本。对于简单随机抽样,一个可操作的定义为:从一个随机数字表中按等概率选出n个不同数字,它对应于N个总体元素号码中的n个不同号码。简单随机抽样是统计学抽样理论的基础,总体中的每一个个体都有一个被选做样本的已知的独立的机率。
例如,在N=500个居民户中抽取一个n=10户的简单随机样本,抽样的过程为——
第一步,将总体抽样框中的500户按001-500编号;
第二步,从表2.2.3随机表中的一个随机位置(画框的位置)开始抽样(见随机数字表);
第三步,向下连续地以三个数字为一组摘取数字。
这样,便得到10个三位数字组的简单随机样本:171,102,393,……
表2.2.3 随机数字表
… … … … … … … … … … … … … … … … …
… 85 53 83 29 95 56 27 09 24 43 21 78 55 09 82 …
… 37 79 49 12 38 48 13 93 55 96 41 92 45 71 51 …
… 89 09 39 59 24 00 06 41 41 20 14 36 59 25 47 …
… 76 62 16 48 68 58 76 17 14 86 59 53 11 52 21 …
… 71 82 13 50 41 27 55 10 24 92 28 04 67 53 44 …
… 34 18 04 52 35 74 13 39 35 22 68 95 23 92 35 …
… 11 20 99 45 18 76 51 94 84 86 13 79 93 37 55 …
… 27 37 83 28 71 79 57 95 13 91 09 61 87 25 21 …
… 10 65 81 92 59 77 31 61 95 46 20 44 90 32 64 …
… 59 71 74 17 32 48 38 75 93 29 73 37 32 04 05 …
… 87 63 93 95 17 81 83 83 04 49 77 45 85 50 51 …
… 08 61 74 51 69 92 79 48 89 79 29 18 94 51 23 …
… 08 52 85 08 40 48 40 35 94 22 72 65 71 08 86 …
… 89 85 84 46 06 64 71 06 21 66 89 37 20 70 01 …
… 42 29 72 23 19 06 94 76 10 08 81 30 15 39 14 …
… … … … … … … … … … … … … … … … …
不过,在现实的调研中,很少采用简单随机抽样设计。在实际收听率调查中,总体N往往非常大,简单随机抽样不易于做到,首先难以构建一个包含全部所有抽样单元的抽样框,其次采用该方法得到的样本单元比较分散,调查难以实施。另外,考虑到不同样本在年龄、居住地区等方面存在同质性,简单随机抽样所取得的效果也往往不能达到最优。
2. 系统抽样(Systematic Sampling)
系统抽样又称等距抽样,其基本方法是:首先将总体中的单位按照某一标识排列,然后随机选定一个起点,以一个固定的间隔选取单位作为样本。
例如,假定要在一座拥有N=640户的居民楼内抽取n=12户进行调查,应用系统抽样法的抽样步骤是:
第一步,计算抽样间距:k=[640/12]=[53.33]=53;
第二步,按照右手规则,确定640户的编号顺序。右手规则是指在行走编号的过程中,始终保持房门在行走者的右端,而且没有遗漏任何一户;
第三步,随机地确定一个编号(假定是84)为样本的第一个单元,每隔53户抽取1户(即间距、步长为53);
这样,所抽取的n=12户样本的编号分别是:84,137,190,243,296,349,402,455,508,561,614,27。
3. 整群抽样(Cluster Sampling)
当个别的抽选样本过于复杂,或为了节约运作成本时,可以通过整群抽样来进行,即每个抽样单位中包含若干个样本。简单地说,整群抽样是指将总体按照某种标准划分为一些子群体,以每个子群体作为一个抽样单位。例如,学校学生可以按班级抽选,公司职员可以按工作的群体抽选,城市住户可以按街区抽选,等等。
整群抽样在视听率调查特别是电视收视率调查中被广泛应用。在电视收视率调查中,一般采用以户为抽样单元的整群抽样,对抽中户内的所有符合条件的居民进行调查。例如,央视索福瑞公司的电视收视率调查,就是对所抽中家庭所有4岁以上的成员,利用人员测量仪或日记法进行调查的。在广播收听率调查中,有时也采用以户为抽样单位的整群抽样,即对抽中户内的所有符合条件的居民进行调查。例如,调查一个地区居民的广播接触率,赛立信的做法通常是对所抽中的家庭所有6岁以上具有收听广播能力的成员进行调查。
4. 分层抽样(Stratified Sampling)
分层抽样又称类型抽样,是指先对总体单位分层,然后每一层都按照一定的方法随机抽取部分单位构成样本的一种抽样形式。大体上说,分层抽样包括以下步骤:(1)将整个总体划分成多个相互区别的次级总体,称为“层”;(2)在每一层中,从构成该层的抽样单位中选出一个独立的样本;(3)用每一层得到的样本计算一个单独的层平均数(或其它统计量)。层的平均数经过适当加权就可以得到对整个总体的估计值。
【案例】某年度进行的广东省广播收听率调查
在某年底进行的广东省广播收听率调查项目中,n=2300户的全省代表性样本也采用了分层、多级PPS整群抽样技术。其中,一级分层指标为“地理位置”,将总体划分为四大区域:珠江三角洲、粤东、粤北和粤西;二级分层指标为“非农业人口比例”,将各区域以县(区)为单位划分为城市域(非农业人口≥70%)和农村域(非农业人口<70%);三级分层指标包括:人口规模、6岁以上人口比例、非农业人口比例、人均GDP、人均收入水平等五个指标,将各地区的城市域和农村域划分成若干个小层。
5. 多级抽样(Multi-stage Sampling)
多级抽样法也被称为多阶段抽样法,就是在总体单位比较多的情况下,根据总体单位中既定的层次或级别,然后在各个不同的级别(或“层”)中,分多个阶段采取不同的抽样方法进行抽样。先抽大单位,再在大单位中抽小单位,小单位中抽取更小的单位。多级抽样通常结合分层抽样或整群抽样等方法进行,在收听率调查中被广泛应用。例如,赛立信2005年全国50城市广播收听率调查中,就是采用了与分层抽样、等距抽样、整群抽样结合的多级抽样方法(具体做法见“赛立信城市广播收听率调查网的样本抽取方法实例”)。
6. PPS抽样
PPS抽样全称为“与规模的度量成比例的概率抽样”(sampling with probability proportional to size)。在第一阶段,根据所在群的大小,给予各个群不同的中选概率,然后在第二阶段的各个群内以等样本量的方法抽取样本。
例如,要在某一个城市抽选1000户家庭进行家庭收入状况调查,该城市共有50个居委会,拟从5个居委会中各抽200户作为样本。应用PPS法的抽样步骤是:
第一步,以最小户数的居委会为1,按照户数计算第个居委会的权重,即=该居委会户数/最小居委会的户数;
第二步,计算第个居委会的中选概率(),并据此随机抽取5个居委会;
第三步,在抽中的每个居委会中分别抽取1000/5=200个家庭作为调查样本。
7. 非随机抽样(Nonrandom Sampling)
非随机抽样(Nonrandom Sampling)主要包括三种抽样法,即任意抽样、判断抽样和配额抽样,这三种抽样法的共同特点是在抽选样本过程中或多或少地增加了调查者的人为意愿因素,使可能被抽中的样本在调查者事前设定的或可控的范围内。当然,为达到调研目标,调查者使用非随机抽样法,令调查样本的确定带有人为因素,但并不是以调查者操纵调查结果为目的。因此,非随机抽样不适用于收听率调查中。
(1) 任意抽样
在任意抽样法中不存在样本设计。这种抽样方法近似于调查人员对他们在街上、商场或者其其它地方偶然碰到的人提问,对调查对象的选择完全由调查者决定。例如,我们在某次乘坐出租车时,询问出租车司机平时习惯收听哪个电台,并了解当时正在收听哪个电台等信息,调查及选择调查对象都是随意的,其抽样方法为任意抽样。
任意抽样法在小样本或小范围调查中常常被用到,而且也很管用。比如,记者需要了解市民对某一事件的态度,随意在街上对行人进行采访。再比如,如果需要寻找使用某一品牌化妆品的消费者,那么以纯粹的随机抽样为基础来进行调查就可能成本太高,采用任意抽样方式相对更为适宜。
(2) 判断抽样
在判断抽样法中,调查者对调研中所要求包括的样本作一个简单的判断。这些判断通常由调查者或调研公司去做。例如:需要了解家庭主妇购买食用油的行为习惯和喜好,调查者可以直接在超市购物人群中抽样;需要了解白领收听广播的习惯,邀请一些白领人士参加小组座谈会,调查者可以在大型写字楼实施抽样等等。
判断抽样法在一些对特定群体进行调查的定量研究和小组座谈会形式的定性研究中被经常使用。但是,由于需要调查者在抽样过程中做出某些判断,因此,调查者的调研经验和调研实施方案的合理性,往往对调查能否实现调研目标产生决定性的作用。
(3) 配额抽样
在抽样调查中,为了减少或避免因小概率事件造成样本的重大偏差,或者增加对样本的控制和把握,调查者会依据相关的数据及其经验判断,在抽样之前对调查样本做出一些条件限制或量化定额,这种抽样方法称为配额抽样。
配额抽样与判断抽样的区别在于,其对样本结构与总体结构在“量”方面的质量控制,能够保证样本具有较高的代表性。在实际调研中,这种抽样方法通常与其他的随机抽样方法结合起来使用,而且应用十分广泛。如果对总体单位特征(如听众特征)比较明确,并且有相关的数据可以参照,当抽取的样本量不是足够大的话,使用配额抽样法,就能够保证在一定程度上控制调查数据的偏差。有时基于研究目标的需要,例如比较听众对各个电台的满意度,使用配额抽样法设置配额,规定收听各个电台的听众样本量,不仅可以满足研究分析的需要,而且可以节省调研时间和费用。
【案例】某城市的收听率调查,要求记录日记卡的听众样本量n=400,采用分级抽样、配额抽样结合的方式抽样,根据当地的人口结构和以前调查所得到的听众结构数据,确定受访者的配额要求如下:
12-19岁
20-24岁
25-29岁
30-39岁
40-49岁
50-59岁
60-69岁
合计
A区
男
6
6
21
24
26
14
6
103
女
7
7
22
25
28
16
7
112
B区
男
3
3
11
13
14
8
3
55
女
4
4
12
13
15
8
4
60
C区
男
2
2
6
7
9
5
2
33
女
2
2
8
9
9
5
2
37
合计
24
24
80
92
100
56
24
400
(二) 城市一次性的广播收听率调查的样本抽取方法
在城市一次性进行的收听率调查中,调查总体是市辖区内6岁及以上的、有广播收听能力的人口,样本抽取方法主要是采取分层抽样、系统抽样、整群抽样相结合的多级抽样方法。具体做法是:
第一阶段:随机抽出抽样小区
1. 取得调研城市的人口及各区的人口分布数据,将该城市的样本量按各区人口比例分到各区;
例如:在广州市抽取500户进行收听率调查,分配到各区的样本为:
合计
东山
荔湾
越秀
海珠
天河
芳村
白云
黄埔
人口
(万人)
427.0
63.9
52.0
42.1
83.8
59.9
18.5
85.7
21.1
比例(%)
100
15
12
10
20
14
4
20
5
样本量(户)
500
75
60
50
100
70
20
100
25
2. 通过城市地图,将所在城市的各个区划分成面积大致相等的N个地块,为抽样小区,并将各抽样小区按照一定的顺序排列;
3. 为了保证样本的地区分布比较均匀,规定每个抽样小区的样本量为10户,则每个区需抽出的小区数量n=该区的样本数量10;
4. 以K=N/n为步长,随机起点,每隔K抽出一个小区,作为抽中的抽样小区。
例:广州市东山区,需抽样75户,共划分出35个抽样小区,则需抽出的小区为n=7510≈8个,步长K=358=4.375(4),若以9为起点,抽中的小区如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
第二阶段:实地抽样,随机抽出家庭样本
1. 在抽中的小区范围内,以任意点为起点,右手原则,按住户地址顺序,每隔五户抽一户(即步长为5);
起点
图2.2.2 行走路线图
2. 抽样员敲门进入被抽中的住户,说明来意,请求其配合接受访问;
3. 若抽中的住户不接受访问,则放弃该样本,然后再间隔5户抽选下一住户,直至完成该小区的5户抽样。
第三阶段:入户访问,抽取家庭样本
1. 根据甄别问卷规定的程序和要求实施抽样,首先将家庭人口按照年龄从大到小列出。
例如:某项收听率调查甄别问卷(摘选)
C1. 【出示卡片】请问您家里一共有多少人?这里指的是平时一个星期起码有5天是住在这里的成员。他们的年龄、性别和职业分别是……? 记录家庭人口: 人
(请按照年龄从大到小分别记录每位成员的年龄、性别和职业)
C2. 【出示卡片】请问您家人中,在过去的一个月内曾经听过/看过/接触过哪些媒体呢?
C3. 【出示卡片】他们最常接触的媒体是哪一种呢?
访问员注意:请将受访家庭的每一位成员(按年龄从大到小)记录在下表,并分别记录每一个成员的C1、C2的答案(C1职业及C2、C3请记录编码)
序号
C1
C2
C3
备注
关系
年龄
性别
职业
过去一个月曾经接触过的媒体
最常接触的媒体
1
1 男
2 女
媒体编码:
1. 电视
2. 广播
3. 报纸
4. 杂志
5. 互联网
6. 其他
2
1 男
2 女
3
1 男
2 女
4
1 男
2 女
5
1 男
2 女
6
1 男
2 女
7
1 男
2 女
8
1 男
2 女
2. 若使用配额抽样,则根据配额情况在该户中选出符合条件的受访者;若使用随机表抽样,则根据随机表抽出受访者。
例如:某项收听率调查甄别问卷(摘选)
请检查C2各个家庭成员的答案,将所有曾经收听过广播(即有记录答案2)的成员的情况登录到下表中(按年龄从大到小)。若无一人曾经收听过广播,则终止该户的访问。
成员序号
关系
年龄
问卷编号的最后一位号码(请划红线)
1
2
3
4
5
6
7
8
9
0
岁
1
1
1
1
1
1
1
1
1
1
岁
2
1
2
1
2
1
2
1
2
1
岁
2
3
1
2
3
1
2
3
1
2
岁
3
4
1
2
3
4
1
2
3
4
访问员注意:根据以上抽样表按照要求抽出受访者,并在相应的家庭成员序号上划圈。
(三) 城市固定样本组的样本抽取方法
在进行全年连续不间断或每月一次的收听率调查时,往往需要采用固定样本组的方式,即一次性抽取足够的样本户(包括正式样本户和备用样本户),首先将正式样本户相对固定下来连续记录日记卡,然后定期按照一定的比例从备用样本中更换。利用固定样本组进行收听率调查,样本抽取通常分两个阶段进行,第一阶段是从全部城市居民家庭中抽取基础研究样本,建立样本库,作为第二阶段抽样的样本框;第二阶段,从样本框中抽出用于实施收听率调查的样本,生成固定样本组。
1.基础样本库的样本抽取方法
建立基础样本库的作用在于,一是用于收听率调查前及定期(通常为一年一次)进行的基础研究,二是作为抽取固定样本组的样本框,三是为固定样本组的轮换和控制提供依据。
基础样本库的样本抽取方法主要是采取多阶段PPS抽样方法。具体做法是:
(1)抽取居委会或村委会
第一步:从当地民政局、统计局、公安局(派出所)等机构取得全市调查总体范围内的居委会或村委会名单,以及各个居委会或村委会的总户数;
第二步,将所有的居委会或村委会按照一定的标志(如按照行政区划、所在位置等)排列,形成抽样框。例如表2.2.4;
第三步:计算抽样间距K=N/n。即计算每隔多少户抽选一个居委会或村委会,在这里,K=全市调查总体范围内的居委会或村委会总户数需抽选的居委会或村委会数。例如,某城市居民总户数为114280户,需抽选的居委会或村委会数为10个,则K=11428010=11428,即抽样间距K为11428。
第四步:确定抽样起点。在抽样间距范围内随机选取一个数字,作为抽样起点。在上例中,是在0–11428之间随机选取一个数字,如以K/2=114282=5714为抽样起点。
第五步:抽取居委会或村委会。首先通过抽样起点找到第一个居委会或村委会,然后按照抽样间距K分别抽出其他的居委会或村委会。在上例中,首先在表2.2.4中“累计户数”栏找到第一个大于或等于5714的累计户数,其对应的居委会或村委会即为第一个被抽中的居委会或村委会;然后,按公式:Li=5714+i11428(i=1,2,3,…,9),分别计算出第二至第十个抽样点数值为5714、17142、28570、39998、51426、62854、74282、85710、97138、108566,再分别在“累计户数”栏找到的大于或等于上述数值的累计户数,各自在其对应的居委会或村委会即是被抽中的居委会或村委会。如表2.2.4。
表2.2.4 某城市居委会或村委会抽样示例表
序号
区
居委会/村委会名称
户数(户)
累计户数(户)
规定范围
抽中
对抽中的居/村委会再编号
1
江
南
区
居委会1
3105
3105
0
3105
2
居委会2
1714
4819
3106
4819
3
居委会3
644
5463
4820
5463
4
居委会4
3782
9245
5464
9245
1
5
居委会5
4413
13658
9246
13658
6
居委会6
2061
15719
13659
15719
7
居委会7
2134
17853
15720
17853
2
8
居委会8
3161
21014
17854
21014
9
居委会9
1926
22940
21015
22940
10
居委会10
1213
24153
22941
24153
11
居委会11
1946
26099
24154
26099
12
居委会12
3271
29370
26100
29370
3
13
居委会13
2796
32166
29371
32166
14
居委会14
2332
34498
32167
34498
15
江
北
区
居委会1
1088
35586
34499
35586
16
居委会2
1616
37202
35587
37202
17
居委会3
2984
40186
37203
40186
4
18
居委会4
1989
42175
40187
42175
19
居委会5
3737
45912
42176
45912
20
居委会6
6341
52253
45913
52253
5
21
居委会7
4326
56579
52254
56579
22
居委会8
1567
58146
56580
58146
23
居委会9
2339
60485
58147
60485
24
居委会10
2481
62966
60486
62966
6
25
居委会11
3826
66792
62967
66792
26
居委会12
2108
68900
66793
68900
27
居委会13
1998
70898
68901
70898
28
东
城
区
居委会1
2329
73227
70899
73227
29
居委会2
1179
74406
73228
74406
7
30
居委会3
4267
78673
74407
78673
31
居委会4
2464
81137
78674
81137
32
居委会5
1244
82381
81138
82381
33
居委会6
2634
85015
82382
85015
34
居委会7
1819
86834
85016
86834
8
35
居委会8
2634
89468
86835
89468
36
西
城
区
居委会1
910
90378
89469
90378
37
居委会2
2312
92690
90379
92690
38
居委会3
1082
93772
92691
93772
39
居委会4
1731
95503
93773
95503
40
居委会5
1285
96788
95504
96788
41
居委会6
1623
98411
96789
98411
9
42
居委会7
473
98884
98412
98884
43
居委会8
3427
102311
98885
102311
44
居委会9
1378
103689
102312
103689
45
居委会10
378
104067
103690
104067
46
居委会11
433
104500
104068
104500
47
居委会12
2256
106756
104501
106756
48
城
郊
区
第一村委会
1310
108066
106757
108066
49
第二村委会
493
108559
108067
108559
10
50
第三村委会
1817
110376
108560
110376
51
第四村委会
507
110883
110377
111947
52
第五村委会
819
111702
111948
112766
53
第六村委会
628
112330
112767
113374
54
第七村委会
1337
113667
113375
113847
55
第八村委会
613
114280
113848
114280
(2)抽取家庭户
第一步:将以上抽中的居委会或村委会重新排列,如表2.2.5;
第二步:按照各居委会或村委会的户数占总户数的比例,计算出各居委会或村委会需抽的样本数,如表2.2.5。
第三步:计算抽样间距K=N/n。在这里,K=抽中的居委会或村委会总户数需抽选的样本户数。例如需抽取的样本总数为2000户,则K=261072000=13.05,即抽样间距K为13。
表2.2.5 某城市抽中的居委会或村委会示例表
序号
区
居委会/村委会名称
总户数(户)
抽样户数(户)
抽样间隔
1
江南区
居委会4
3782
290
13
2
居委会7
2134
163
13
3
居委会12
3271
251
13
4
江北区
居委会3
2984
229
13
5
居委会6
6341
486
13
6
居委会10
2481
190
13
7
东城区
居委会2
1179
90
13
8
居委会7
1819
139
13
9
西城区
居委会6
1623
124
13
10
城郊区
第二村委会
493
38
13
合计
26107
2000
13
第四步:实施实地抽样,抽出家庭户地址。实地抽样的具体做法是:在抽中的居委会或村委会范围内,以任意点为起点,右手原则,按住户地址顺序,每隔一个抽样间隔(本例中抽样间隔K即步长为13)抽一户,详细询问并记录家庭地址及家庭基本情况,如户主姓名、家庭人口数、电话等。
第五步:将所有抽中的家庭户按照居委会或村委会的顺序和抽样顺序登录到表格中(如表2.2.6),并输入到电脑,生成样本库。
表2.2.6 某城市基础样本库示例表
江南区第4居委会
总序号
本页序号
户主姓名
详细地址
联系电话
家庭人口
1
张大伟
前进路2号304
XXXXXXX
3
2
李平
前进路2号605
XXXXXXX
2
3
王华
前进路4号201
XXXXXXX
4
4
钱图
前进路4号602
XXXXXXX
3
5
李志显
前进路沙田巷1号201
XXXXXXX
3
6
杨在敏
前进路沙田巷6号
XXXXXXX
5
7
李莹
前进路沙田巷8号302
XXXXXXX
2
8
高惠敏
前进路沙田巷8号711
XXXXXXX
2
9
陈小华
前进路沙田巷10号101
XXXXXXX
3
10
杨志坚
前进路沙田巷16号403
XXXXXXX
6
…
…
……
……
……
2.固定样本组的抽样方法
当有了城市基础样本库以后,利用基础样本库进一步抽取作为固定样本组的样本,便是轻而易举的事情了。抽样的基本步骤如下:
第一步:根据所需的样本量,确定抽样间隔K。在上例中,若城市固定样本组收听率调查的样本总数为300户,考虑到可能出现的不符合条件(比如没有收听广播的家庭等)、拒访以及样本轮换等因素,一般需要增加100个备用样本。因此,抽样间隔K=2000400=5。
第二步:按照基础样本库的排列顺序,随机确定抽样起点,每隔5户抽选1户,直至抽够所需的样本数量为止。
第三步:依据样本甄别条件对抽中的家庭户进行甄别,对于符合条件、愿意接受调查者,可作为收听率调查的正式样本,构成固定样本组。
展开阅读全文