1、市场调查问卷设计的几类常见错误及纠正企业经济 付志远 2000.1本文介绍了问卷调查中经常出现的一些问题,并就各类问题提出了相应的改进的方法。 问卷调查法是目前在市场调查中的一种常用方法,它是通过所设计的调查问卷,直接对单位或个人进行调查的一种方法。由于它具有简明、通俗、客观。真实、反馈快、保密性好等特点,已被越来越多的企业(公司)、市场研究与咨询机构等所采用。如何通过卷调查活动获取准确、全面而又有价值和符合要求的资料,关键在于能否设计出一份高质量的调查问卷表。然而,问卷设计需要很高的技巧,它是一门科学,也是一种艺术。缺乏理论和经验往往不能设计出完美的调查问卷,从而使调查无法搜集到准确而全面的
2、资料,不能正确的分析和说明市场的变化情况。在这里我把调查问卷设计中经常出现的错误作一归纳,并提出相应的对策,希望对大家有所帮助。 问题定义不准确 一个问题对于每个被调查者而言,应该代表同一主题,只有一种解释。定义不清的问题会产生很多歧义,使被调查者无所适从。例如,“您使用哪个牌子的洗发液?”这个问题表面上有一个清楚的主题,但仔细分析会发现很多地方含糊不清,假如被调查者使用过一个以上的洗发液品牌,则他对此可能会有四种不同的理解或回答,回答最喜欢用的洗发液品牌回答最常用的洗发液品牌(最常但并不一定是最喜欢用的,例如受支付能力的影响)回答最近在用的洗发液品牌回答此刻最先想到的洗发液品牌;另外,在使用
3、时间上也不明确:上一次?上一周?上一月?上一年甚至更长时间?都可由被调查者随意理解,这样的问题显然无法搜集到准确的资料。因此明确定义你的问题极其重要,以下几条或许会对你有所帮助: 1采取六要素明确法,即在问题中尽量明确什么人,什么时间,什么地点,做什么,为什么做,如何做六要素。问题的含糊往往是对某个容易产生歧义的要素,缺乏限定或限定不清引起的。因此在设计问题或在检查问题时,可以参照这六要素进行。如上的问题明确几个要素后改为:“在过去的一个月中,你在家中使用什么牌子的洗发液?如果超过一个,请列出其他的品牌名称”。这样定义的问题显然明确多了。 2避免使用含糊的形容词、副词,特别是在描述时问、数量、
4、频率、价格等情况的时候。像有时、经常、偶尔、很少、很多、相当多,几乎这样的词,对于不同的人有不同的理解。因此这些词应用定量描述代替,以做到统一标准。下面这个例子中。显然比精确的多。“在普通的一个月中,你到百货商店的采购情况如何?”.从不 偶而经常定期少于一次 1到2次3到4次超过4次。 3避免问题中含有隐藏的选择和选择后果,使隐藏的选择和后果明晰化。无论是是非式问题还是选择式问题,都是在几个备选选项中作出选择,因此必须使被调查者清楚所有的备选选项及起后果,否则不能全面的搜集信息。如下面这个例子,显然比好得多。一家航空公司想分析旅客对短途飞机旅行的需求量,“在做 300公里以内的短途旅行时,您喜
5、欢乘飞机进行吗?”“在做300公里以内的短途旅行时,你喜欢乘飞机呢,还是喜欢坐汽车,或者其他方式?”同样,问题中有德新的后果也应该尽量明晰,以便被调查者这行合理的选择。“你喜欢喝纯净水吗?(纯净水中缺乏人体所需的微量元素)。这个问题中有无括号内的部分,结果大为不同。 问题形式不妥当 问题的形式多种多样,大的可分为开放式,是非式,选择式、排序式、评分式、联想式等等;小的则涉及到一些语言技巧的运用和处理。问题形式的选择具有相当的艺术性,合理的形式选择与处理应使被调查者愿意,并且以最小的努力就能提供客观真实的答案。不恰当的形式选择会导致被调查者不愿意或不能够提供问题所要求的信息。例如,“请问你家每人
6、平均每年的食品支出是多少”?“请问你个人每月的工资收人是多少”“人们都说牌电视机比牌电视机好,您是不是也这样认为?”这三个问题都存在形式运用不当的问题。第一个问题要求被调查者付出额外的努力,进行复杂的计算:首先把每月的食品支出估算出来,然后乘以十二,最后再除以家庭成员数以得出结果。这样烦琐的计算可能使被调查者单方面结束访问。第二个问题涉及敏感的个人隐私,直接的提问容易遭拒绝。第三个问题则带有引导性倾向,会影响被调查者的选择。问题形式的选择应注意以下几点: 1避免问题中包含过多的计算。 问题的设计应着眼于取得最基本的信息,计算应在数据处理阶段通过计算机程序进行,这样可以减少被调查者的负担。例如上
7、面第一个问题可以改为“请问你家每月食品支出大概是多少”和“请问你家有几口人”两个小问题。取得这两个数据后,计算人平均年食品支出也就容易多了。 2.避免单纯依靠被调查者的记忆回答问题,应提供一定的提示或选择。在当今信息过度的时代,遗忘和记忆的差错导致被调查者无法提供全面和准确的资料。例如,很多人都不能直接回答“昨天晚上你看了哪个牌子的洗发液广告?”这个问题,但要是提供可供选择的选项,回答则容易并准确的多。因此这类问题应采用选择式,而非填空式。 3.避免直接提问窘迫性问题。窘迫性问题指应答者不愿在调查人员之前作答的某些问题,如私人问题、不为一般社会道德所接纳的行为或态度或有碍声誉的问题。这类问题直
8、接提问往往会遭拒绝,因此应改为采用非直接、联想式提问。如上面第二个问题,可以提供几个收人段“1000以下,1000至2000,2000至3000,3000以上”作为选项,在一定程度上会降低窘迫性。此外还可通过说明信息的正当用途降低敏感性。 4避免出现诱导性倾向,提问尽量客观。在有外界压力存在的情况下,被调查者提供的是符合压力施加方偏好的答案,而不是他自己真正的想法。因此,提问应创造被调查者自由回答的气氛,避免诱导性倾向。如上面第三题的结果会夸大牌比 牌好的比例,应改为“您认为A牌和B牌电视机哪个更好”,这样更为客观。 问题顺序不正确 问题顺序的安排有一定的规律可循。正确的排序应该合乎问题之间的
9、逻辑,前后连贯,先易后难,避免因顺序的安排不当而导致访问被调查者中止。现在有很多问卷在顺序安排上存在错误,比如问卷开始就要求被调查者填写姓名、性别、年龄、婚否、职业等等,好像在填申请表,而不是调查,这样很容易遭致被调查者的反感和拒绝。这就是明显的顺序安打上存在的错误。在进行问题顺序安排时可参考以下几点: 1基本信息应安排最前,分类信息居中,鉴别性信息放在最后。调查信息主要包括了三种信息类型:一类是基本信息,是达到研究目标所必带的信息。如对产品、价格、分销、促销信息的调查;一类是分类资料,即将被调查人按年龄、忙别、职业等予以分组归类的资料;第三类是鉴别性信息,如被调查人的姓名、住址等。一般来说,
10、应将最主要问题(基本信息)置于最前面,然后列举后两类问题,只要前面的问题得到回答,那么后面的问题如果被调查者不愿回答或因事中止也就无关大局了。 2先易后难。容易、直观、清楚的问题置前,困难、复杂、敏感、窘迫的问题置后。随着调查的进行,调查人员与被调查者交流的深人,被调查者可能降低或消除原有的戒备心理,愿意回答一些复杂、敏感的问题,从而使调查获得尽可能多的信息。这一点的目的与第一点目的相同,它可作为第一点的补充。 3总括性问题应先于特定性问题。总括性问题指对某个事物总、体符征的提问。“在选择冰箱时,哪些因素会影响你的选择”?就是一个总括性的问题。特定性问题指对事物某个要素或某个方面的提问。如“您
11、在选择冰箱时,耗电量处于一个什么样的重要程度?”总括性问题应置于特定性问题之前,否则特定性问题复前会影响总括性问题的回答。如把放在的前而,则的答案中“耗电量”选挥会偏大。 问题取舍不合理 问题的数量必须合理,应该既能保证搜集到全面的资料,又尽量保持问卷的简短,同时也尽力使问卷整体连贯、和谐、生动,能调动被调查者的积极性。现在有的问卷过于冗长,其中充斥着一些与调查主题毫无相关的问题;有的虽然短小,却不能全面搜集所需资料,而且过于严肃、死板,全文贯穿一问一答的形式,压抑被调查者的主动性。问题的取舍应注意以下几点。 1按调查主题组织问题,每个问题都应有益于调查信息的取得。首先要明确调查的主题是什么,
12、这是整个调查的基础,也是问卷设计的灵魂和核心所在。应绝对避免为节省费用而附带调查主题之外的问题。问题东拉西扯,会使被调查者产生调查组织不严密的印象,影响他们的答卷态度。 2为了融洽调查气氛,不致于过于严肃、呆板,可以设置一些表面上与调查主题无关,但实质上有益于调查的问题。当问卷的调查主题较为敏感时,这点尤其有效。如在问卷开始,可以设置一些轻松的开放式问题,请被调查者畅述自己的看法,有利于调动被调查者的积极性;在各类信息的连接处,可以设置一些过渡性问题,顺畅被调查者的思维。 3为节省调查时间,保证被调查者符合调查对象的标准,可以在问卷开始设置一个“过滤性”问题,检查被调查者的合格性。如想调查现有
13、掌上电脑的不足之处,则必然要调查掌上电脑的使用者。可以在问卷开始提问“您使用过掌上电脑吗?”这样就可检查被调查者是否合格,及时“过滤”不合格者了。 问卷排版装订不雅观 问卷的排版装订也是问卷设计的重要内容。排版应做到简洁、明快、便于阅读,装订应整齐、雅观、便于携带,便于保存。现在的一些调查问卷,卷面排版凌乱,为了节省用纸或为了使问卷显得简短,压缩了一切可以压缩的空间,使卷面显得异常复杂和冗长,容易使被调查者产生反感情绪;有些问卷用纸粗糙低劣,装订混乱,类似街头小广告,也易遭拒绝。问卷的排版装订可参考以下几点: 1应避免为节省用纸而挤压卷面空间。如多项选择题的选项,应采用竖排形式。竖排虽占用一定
14、的空间,但能使卷面简洁明快,一目了然,便于阅读和理解。例如可对选项的两种排版方式作一比较。“您的月工资收人是()” 横排方式 、100以下、100到 2000、2000到 3000 、 3000以上 竖排形式 、1000以下 、1000到2000 、 2000到3000 、 3000以上 显然竖排形式比横排方式更为直观,明快。多题累加之后,此点更为明显。 2同一个问题,应排版在同一页。避免翻页对照的麻烦和漏题的现象。 3问卷的问题按信息的性质可分为几个部分,每个部分中间以标题相分,如第一、二、三、四部分形式。这样可以使整个问卷更为清楚,也便于后阶段的数据整理与统计。 4调查问卷用纸尽量精良;超
15、过一定的页数,应把它们装订成小册,配上封皮和封尾,而不应仅仅用订书钉订在一起而已。这样既可利用纸的双面进行排版,节省用纸,还便于携带和保存;更可使问卷显得庄重、专业,使被调查者以更认真的态度对待调查。 辅助信息及在抽样调查中的应用统计与预测 俞纯权 1/2000本文介绍了辅助信息的内涵、分类,重点阐述了它的应用:改进抽样方法、改进估计方法、同时改进两者和进行样本轮换。 一、辅助信息及其分类 抽样调查是通过对样本的调查达到对总体目标量的估计。在抽样调查中,调查指标的样本信息是估计总体目标量必不可少的信息。通过对样本调查并对所得数据加以整理,获得调查指标在总体中分布的某些特征,由此给出总体目标量的
16、估计。我们把调查指标的样本信息称为基本信息。由于样本是总体的一部分,抽样又是按照一定概率进行的,故样本提供的是不全面的且带有随机干扰的信息,这就是说,基本信息不仅信息量极其有限,而且这极其有限的信息在反映总体特征时常常伴有不可消除的偏差,这就必然使估计量精度受到一定限制分。 在许多情况下,我们在抽样调查之前对总体及抽样单元并不是贫乏到一无说知的地步,往往是事先掌握某些可资利用的总体信息及抽样单元信息,而在抽样调查中除了获得调查指标的样本信息之外,常可伴随获得其它可资利用的样本信息。这些信息对改善样本的代表性、提高估计量的精度有积极作用,若不能充分地利用,势将造成信息资源的浪费。我们把除调查指标
17、样本信息以外的一切有关总体、抽样单元及样本的信息统称为辅助信息。在不扩大调查规模的情况下,充分利用辅助信息是提高估计精确度的有效手段。 辅助信息就其性质可分为以下几类: 第一类是反映总体结构的信息。如总体抽样单元按调查指标取值差异程度可分为若干层,各层的构成及其在总体中所占比重等信息。 第二类是反映抽样单元规模的信息。如在总体分为不同级别的抽样单元时,常可用某一级别抽样单元包含下一级别抽样单元的数目或其它度量值表示这一抽样单元的规模或大小。 第三类是与调查指标密切相关的辅助指标的信息。例如在对居民支出进行调查时,居民收入就是一个与支出有着高度相关性的辅助指标。这种辅助指标的信息可以是总体的,也
18、可以是抽样单元和样本的。在一些经常性的抽样调查中,常取上期调查指标作为现期调查指标的辅助指标,有时也可用同一调查项目的近期普查指标作为现期抽样调查指标的辅助指标,这时辅助指标提供的信息即调查指标的历史信息。 二、辅助信息在抽样调查中的应用 .应用辅助信息改进抽样方法,改善样本的代表性 在抽样调查中除了样本容量之外,抽样方法、估计方法都对估计量的精度有重要影响。评价抽样方法优劣的标准就是看按这一 方法抽得的样本其代表性如何,也就是考察样本特征的能力如何。如果一个样本可以作为总体的缩影,能够反映总体分布的基本特征,那么其代表性就好,调查资料的偏差就比较小,据此对目标量进行估计时精度就比较高,否则就
19、比较低。因此,在抽样调查中为了使样本具有较好的代表性,常常通过改进抽样方法来实现。调查前已掌握的总信息和抽样单元信息就可用于抽样方法的改进。 例如在总体抽样单元调查指标值差异悬时,采用简单随机抽样有可能得到极端的样本,使估计值出现很大偏差。这时如果已总体可分为若干层,层内抽样单元之间差很小,不同层之间差异较大,就可改简单随油样为分层随机抽样,从而避免出现极端样本,使样本能较好地反映总、体分布的特征,使估计有较小的偏差。再如等距抽样是一种极方便的抽样方法,但是当总体抽样单元徘列具有线性趋势时,随机起点等距样本往往提供过高或过低的估计值。如果已知抽样单元排列具有线性趋势,则可把随机起点等距抽样改进
20、为随机起点对称等距抽样,从而大大改善了样本的代表性,避免出现有较大偏差的估计值,有利于估计精度的提高,效果极为显著。在实际工作中,不可能根据调查指标的取值来获得总体单元的排列,然而若存在与调查指标有高度线性相关性的辅助指标,各抽样单元取值已知,就可根据辅助指标为造总体单元的排列。如果排列呈线性趋势,由相关性,各单元按调查指标排列也必呈线性趋势,就可应用对称等距抽样。在应用上常取调查指标的前期指标为辅助指标,此时两者之间往往呈高度线性相关,且前期指标取值已知。例如我国农产量抽样调查就采用按近三年平均每公顷粮食产量由低到高顺序排列,使排列具有明显的线性趋势,实施随机起点对称等距抽样。在上面这些例子
21、中,总体信息、辅助指标信息在抽样方法的改进中起了关键作用。 在抽样调查中,尽管等概率抽样是一种应用最广泛的抽样方法,但并不是对任何总体都是最适宜的方法。当抽样单元规模(大小)不等从而在总体中所处地位不一致时,对抽样单元的等溉率抽样将压缩大的抽样单元对总体的影响,扩大小的抽样单元对总体的影响,因此等概率抽样提供的信息是扭曲的信息,对总体目标量的估计效果一股不会很好。如果事先已知抽样单元规模(大小),从而改等概率抽样为不等溉率抽样,使大单元入样概率大,小单元人样概率小,就可使样本按照抽样单元在总体中所处地位的程度反映总体分布的特征,有助于提而估计的精度。 在这里,抽样单元的规模(大小)作为一种辅助
22、信息对确定抽样单元人样概率、改变样本特性起行决定性作用。 应用辅助信息改进估计方法,提高估计的精度 评价估计量精度的常用标准是估计量的方差。在抽样方法固定的条件下寻求具有较小方差的估计量历来是抽样调查的核心问题之一。通常的简单估计量仅仅使用调查指标的样本信息,除此之外不再使用其它信息,包括抽样调查之前已知的辅助指标总体后息及抽样调查中可伴随获得的辅助指标样本信息,信息使用的种类单一,信息量利用率低,因而精度不高。如果在构造估计量时不仅使用调查指标的样本信息,而且同时使用辅助指标的总体信息和样本信息,那么在抽样方法和样本容量固定的前提下,这种估计量的信息量就会比简单估计量丰富得多,必然有助于提高
23、估计精度。调查前己掌握的总体信息连同调查时伴随获得的辅助指标样本信息常可用于估计方法的改进。 在抽样调查中,如果存在与调查指标有较高正相关性的辅助指标,就可利用辅助指标的总体信息及样本信息构造比估计量: yk=yx*x 和回归估计量: ylryb(x-x) 作为调查指标总体均值Y的估计、在这两种估计量中,除了调查指标样本信息外,还使用了辅助指标的总体信息和样本信息x,其信息量比通常的简单估计量y大为丰富,因而可望有较高的精度。事实上,不论调查指标和辅助指标线性相关程度如何。回归估计量的精度都不低于简单估计量,而两指标线性相关程度较高时,比估计量的精度将优于简单估计量。这类估计量的一个典型应用场
24、合是农产量抽样调查。在正常年景下,当各方面条件基本不变时,相邻两年的产量具有较高的正相关性;以上年产量作为辅助指标构造比估计量变和回归估计量,在相同的样本下,可以获得比简单估计量精度高得多的估计。 应用辅助信息同时改进抽样方法和估计方法 将辅助信息应用于抽样调查,除单独用于改进抽样方法以改善样本代表性或单独用于改进估计方法以提高估计精度外,也可同时应用于两者,以最大限度地发挥辅助信息的作用。在抽样和估计两个阶段,可同时使用同一种辅助信息,也可将两种辅助信息有机结合使用。 例如在农产量抽样调查中,由于各种因素的影响,不同的抽样单元农产量亩产之间存在显著差异。对这种总体要提高样本代表性最好的方法是
25、实施分层抽样。如前所述,在正常年景下相邻两年产量具有较高的正相关性,因此可以上年产量作为辅助指标对总体实施分层以获得有较好代表性的样本,其效果与应用当年指标分层基本相当。在构造估计量时再次利用这种正相关性构造分层比估计量或分层回归估计量,使相关性辅助指标的信息在抽样和估计两个阶段得以充分利用。 众所周知,整群抽样是一种有着广泛应用的抽样方法。在实际问题中,群的划分通常是基于某种方便的原则,例如按行政区划、部门行业、地理区域或时间顺序分群,此时群的大小往往差异显著。为提高估计精度,可采用PPS整群抽样,即按与群的大小成比例的概率抽样。在这里使用了作为初级单元的群的规模辅助信息。但是当群内方差过小
26、,群间方差过大时,估计精度仍可能不高。在这种情况下,如果存在与调查指标有着较高的正相关性的辅助指标,就可用此辅助指标构造比估计量或回归估计量提高估计精度。反映抽样单元规模的辅助信息和相关性辅助指标的信息、结合运用,最大限度地发掘了辅助信息的效益。 .应用辅助信息进行样本轮换 为了获得具有一定间隔时期的资料并使其具有可比性,在经常性的抽样调查中往往采用固定样本的调查方式。但是这种固定样本的调查方式存在严重缺陷,主要是当样本代表性下降即呈老化状态时估计精度低。 因此,对周期性进行的抽样调查为了样本具有较好的代表性以获得精度较高的估计。不能采用固定样本的方式,必须对样本实施轮换。 样本轮换的核心问题
27、是确定样本轮换率,即被轮换的抽样单元在样本中的比例,这可应用相关性辅助指标确定。在周期性的抽样调查中,以记现期调查指林,以记上期调查指标,以1,2,n记上期样本现期观察值,以x1,2,n;记上期样本当期观察值,得两期观察值间的样本相关系数: r=(xi-x)(yi-y)/ 在某种条件下,由于事物发展过程呈现连续性,相邻两期指标间具有正的相关性,从而0r1。 如果,表明和以概率有完全的线性关系,即上期样本现期观察值1,2,完全可以由上期观察值1,2,n解释,因此现期指标观察值对于估计现期总体目标量毫无新的价值,也就是说这样的样本完全老化,应全部轮换。如果=,表明和没有线性关系,上期样本现期观察值完全不能由上期观察值解释,可以认为上期样本对现期调查来说仍有很好的代表性,不必轮换。如果 ,表明 与 有一定的正相关性,其程度视值而定。这时可以认为上期样本有一定程度的老化,其大小可用描述。越大,现期观察值可用上期观察值解释的比重也就越大,样本老化程度就越严重;越小,现期观察值可用上期观察值解释的比重就越小,样本老化程度就越不严重。因此上期样本相邻两期观察值的样本相关系数可作为样本老化程度的质量,其数值就是现期观察值可被上期观察值解释的比重这样,以上期调查指标为辅助指标,可用调查指标与辅助指标之间的相关系数作为样本轮换率来决定样本轮换量。