1、敏感性问题调查的技巧【摘要】 敏感性问题是指涉及私生活的问题以及大多数人认为不便于在公开场合表态或陈述的问题,如私人财产、不轨行为、性问题、避孕手段使用情况等。进行这类问题调查时,如不注意方式、方法、措词等,就会使拒答率相当高,或者得不到真实的答案,从而导致调查失败。在不同的情况下,调查问题的敏感性可以完全不同,某一问题是否敏感受到很多因素的影响,如社会制度、文化背景、被调查对象的特征等。如少女婚前性行为在一些西方国家就不是敏感问题,而在我国则是一个非常敏感的问题。再如,对不同的调查对象,同一问题的敏感性也存在差异,吸烟对成年人来说不是一个敏感问题,而当对中学生进行调查时就相对比较敏感。另外,
2、不同的敏感问题之间还存在程度上的差异,上述少女婚前性行为就比吸烟问题要敏感得多。【关键词】 敏感性问题; 随机化回答模型 1 敏感性问题调查时常用的方法 对敏感性问题的调查,所采用的方法主要为面访、自填问卷、电话访谈,由于网络技术的普及电脑问卷调查也开始出现在敏感性问题的调查中。在发达国家电话较普及,电话访谈也常用,但应答率并不理想,并且对样本的选择性较大。面访虽然能控制调查的进行和记录,但面对敏感问题的尴尬有可能影响回答的真实性。自填问卷可以消除面对敏感问题的尴尬,从而可能得到 改变提问的形式 可采用对象转移法、假定法等。但应注意用这种方法得到的结果与直接询问法有所差别。即注意敏感性问题的提
3、问方式,在问卷中经常采用的有文字游戏法提问方式。这种方法采用不直截了当的文字语句进行询问,通过旁敲侧击来引出被访问者的实话。同时不给访问对象有泄露隐私的感觉。常用的方法有释疑法、人称代换法、数值归栏法等。 例1 询问被访问者对饮酒的态度 “有些医生认为饮酒有害有些医生认为有益,你认为如何?” 运用了无假定规范性意见的策略(释疑法)。 例2 询问被访问者是否有过犯罪冲动 “多数人承认他们有过犯罪的冲动,你有过么?” 指出该想法或该行为即使可能有违规范,但也是比较正常的现象(人称代换法)。 例 3 询问家庭积蓄情况 1. 你认为你的生活水平在本地区属于哪一个层次 01富裕 02较好 03一般 04
4、偏低 05困难 2.你认为每月支出在何种水平上才称得上是 01 富裕 元/月 02 较好 元/月 03 一般 元/月 04 偏低 元/月 05 困难 元/月 3.如果从现在开始你家不再有任何收入,以你家现在的生活水平和积蓄情况,估计能维持多长时间的基木生活呢? 01 1个月以下 02 3个月 03 6个月 04 1年 05 2年 06 3年 07 4年 08 5年 09 6年 10 7年 11 8年 12 9年 13 1015年 14 15年以上 例3中采取将一个敏感的大问题分解成若干个不敏感且容易回答的小问题来暗中测量(数值归档法)3。 随机化回答模型 随机应答技术(randomized r
5、esponse technique, RRT)它是60年代以来兴起的一种对敏感问题调查的技术。当调查的主要目的在于估计某种行为(如婚外性关系、青少年妊娠)的概率时,随机化回答模型是比较理想的方法。所谓随机化回答模型就是采用一种既能保护被调查者个人秘密,又能使其讲实话,并在敏感性问题调查中获得某类人数所占比例或某敏感指标均值的估计量的方法。 沃纳模型 沃纳模型是1965年由Wamer提出的,其设计原则是根据敏感性特征设计两个相互对立的问题,让被调查者按预定的概率从中选择一个回答,调查者无权过问被调查者究竟回答的是哪一个问题,从而起到了为被调查者保密的效果4。 设总体具有互不相容的两类,具有敏感性
6、特征的一类A和不具有敏感性特征的一类 即总体中的每一个个体或者具有敏感性特征A(属A),或者不具有敏感性特征A(属于 )。我们的目的是估计具有敏感性特征(属A)的人在总体中所占的比例N。从总体中随机抽取n个观察单位,然后对这n个观察单位进行随机化回答调查,所使用的随机化装置描述如下:外形相同的卡片上写有问题:“属于A吗?”与“你属于A 吗?”。如“你在考试中作弊了吗?”“你在考试中没有作弊吗?”,以预定的比例混合后放入一盒子中,调查时,被调查者从盒中任拿一张卡片,根据卡片上的问题进行回答。回答完后,仍将卡片放回盒子,供其他被调查者使用。 设P是具有敏感性特征的人所占的比例,p是写有问题“你属于
7、A吗?”的卡片所占的比例,若调查结果中有 n1人回答“是”,有n-n1 人回答“否”,则: PA=n1 n-(1-p) 2p-1 SPA=n1 n(1-n1 n) n(2p-1)2 p的取值不能为,一般介于之间比较适宜5。 模型的适用条件及注意事项:p越接近,S越大,而SPA 越小,估计的A 越准确;当p越接近0或接近1时,SPA 越小,但此时对被调查者的保护程度降低,从而降低了被调查者的合作程度,随机化回答的作用降低,增加了收集到真实数据的难度。一般来说,p的取值介于之间比较合适,但也须根据实际调查的敏感程度而定,敏感程度较高则p的取值较小,反少亦然6。 例4 欲研究大学生酗酒情况,估计大学
8、生的酗酒率。如果一个学生在调查前的一个月饮酒超过1250m1则认为他是酗酒。根据该定义,现从某大学中随机抽取100名大学生,目的是估计该校大学生的酗酒率。首先设置一装有60张卡片的盒子,其中有45张写有“上一个月你是否至少饮酒1250m1”, 占全部卡片的75% ;15张写有“上一个月你是否饮酒少于1250m1”在调查时,在没有调查员的情况下,被调查者把盒中的卡片摇匀,从中随机抽出一张,而后根据卡片上的内容如实回答“是”,或“不是”。调查结果是28人回答“是”,72人回答“不是”。 n=100 n1=28 p=45/60=75% PA=n1 n-(1-p) 2p-1=28 100-() 2=
9、SPA=n1 n(1-n1 n) n(2p-1)2=28 100(1-28 100) 100(2)2 = 西蒙斯模型 西蒙斯模型是1967年由Simmons提出的。其设计思想仍是基于沃纳的随机化回答思想,只是在设计中,用无关的问题Y代替了沃纳模型中的敏感性问题A的对立问题。比如敏感性问题为“你在考试中作弊了吗?”,沃纳模型中的对立问题是“你在考试中没有作弊吗?”在西蒙斯模型中用一个与敏感性问题无关的问题来代替这一问题,比如“你是四月份出生的吗?”7。 模型的基木设计为:制作一个能产生两种实验结果的随机化装置,如两套外形一致的卡片,一套卡片上写有敏感性问题“你属于A吗?”比如“你考试作弊了吗?”
10、;另一套卡片上写有无关问题“你属于Y吗?”,其中Y是与A无关的非敏感型问题,比如“你是4月份出生的吗?”,称此卡片为2号卡片。将1号卡片和2号卡片按预定比例混合后,放入一盒子中,调查时,被调查者只需从盒子中任意抽取一张卡片,根据卡片上的问题做出真实回答,而调查者不知道被调查者回答的是哪一个问题。 设抽样方式是简单随机有放回的,样本容量为n, PA是具有敏感性特征的人所占的比例,PY 是具有无关特性Y的人所占的比例,可以查有关资料获得。p是一号卡片出现的概率,若调查结果中有n,人回答“是”,则 PA=n1 n-(1-p)PY p SPA=n1 n-(1-n1 n) np2 模型的适用条件及注意事
11、项:只需从盒子中任意抽取一张卡片调查时,被调查者根据卡片上的问题做出真实回答,而调查者不应待在现场,避免通过推理得知被调查者的秘密。PY 是具有无关特性Y的人所占的比例,可以查有关资料获得或者对被调查人群进行相应无关特性问题调查而得到8。 例5 某学者进行婚外性关系调查,共调查200名博士。首先设计如卜两个相互无关的问题 A:您有过婚外性关系吗? B::您今人早上吃鸡蛋了吗? 然后,让每一个被调查者自己用二项随机试验的方法悄悄地确定回答哪一个问题。比如被调查者可以任意拿出一张人民币,约定其编号末位数为奇数者如实回答问题A,为偶数者如实回答问题B,但不告诉调查员自己回答的是哪一个问题。统计得到回
12、答“是”的为60张,回答“否”的为140张。敏感问题调查完后每个人再填写一张纸条:您今天早上是否吃了鸡蛋:是或否。从而得到吃鸡蛋的人数为92人。根据常识知道,人民币编号末位数为奇数的概率为,于是 p= n1=60 PY =92/200= PA=n1 n-(1-p)PY p=60 200-() = SPA=n1 n-(1-n1 n) np2=60 200-(1-60 200) 200= 多项分类模型 多项分类模型设一敏感性问题可分为k种相互排斥的类别A1,A2A3K,AK ,为了估计A1,A2A3K,AK 在总体中占的比例1,23K,k ,抽取一个样本含量n的有放回的简单随机样,可以构造出下列理
13、论化的随机化问答模型:可以制作m张相同的卡片,上面分别标有0,1,2,k ,其个数分别为m0,m1m2K,mk ,k i=0mi=m 。把卡片放入一盒子中,让被调查者从盒子中随机抽取一张卡片,读取卡片上号码,若抽到的卡片号码为0他须按真实情况回答自己属于A1,A2A3K,AK 的那一类,若抽到的卡片号码为i,i=1,2,3,k 都简单回答问题i。 可以看出一个属于Ai 的被调查者抽到号码为0的概率是P0=m0 m ,抽到号码为i的卡片的概率为Pi=mi m ,i=1,2,3,k 。 因此被调查者回答i的概率是p0+pi, i=ni n 因此敏感性问题i的概率及标准误分别为 i=/ p0 SPA
14、i=1 (n-1)p02 i2(1-i) 模型适用条件及注意事项:该方法整个过程都是在调查者不在场的情况下进行的,调查者只知道回答的数字却不知道被调查者属于哪一类,因而对保护隐私起到屏蔽作用,操作非常简单,但需注意当样本含量不够大时,得到的很有可能是负值,因而样本含量应保证9。 例6 对一个地区开展性病调查,将人群分为3类:无性病;有性病,去正规医疗机构诊治过;有性病但未去正规医疗机构诊治过。 在广泛进行调查目的和随机化调查方法保护隐私作用宣传的基础上,抽取一个样本容量为3000的一个随机样木用问卷进行调查。要求被调查者在回答问题时,使用一个骰子,如果出现1点,直接回答1;出现2点,直接回答2
15、;出现3点,直接回答3;如果出现4,5,6,则按实际情况回答属于哪一类。在3000个回答中,回答1的有1986份,回答2的有504份,回答3的有510份,此时 p0=3 6= p1=p2=p3=1 6 1=1986 3000 2=504 3000 3=510 3000 1=(1-p1)/p0=(1986 3000-1 6)/= 2=(2-p2)/p0=(504 3000-1 6)/= 3=(3-p3)/p0=(1510 3000-1 6)/= SPA1= SPA2= SPA3= 应用随机化回答模型时因注意的事项 RRT不失为一类调查敏感问题有用的方法,已得到广泛应用。但应该认识到,无论它如何完
16、善,毕竟是一种不得已而为之的办法,带有其方法自身的特性所决定的无法消除的缺陷。一是由于调查结果的随机误差要比常规问卷法大,要求的样本量也就比常规问卷法大;二是由于得不到个人资料,信息量大为减少,使资料分析如影响因素分析受到较大的限制,如要作影响因素分析,则需作分组分析,分别计算各组的二值,所要求的样本量将会成倍地,甚至数十倍地增加,但RRT方法本身就较复杂,加大样本例数往往是不可能的;三是不愿配合的调查对象在RRT使用时更易掩盖敏感行为等。因此,不要调查任何敏感问题均毫无例外地使用RRT,RRT也并非敏感问题调查的唯一方法,同时它本身也有一定的适用范围10。 【参考文献】 1 王春平.医学定性
17、敏感性问题的研究方法及评价.中国医院统计,2005, 6(12):2356. 2 杜金柱.敏感性问题调查的几种方法与比较.中国统计, 2002,12: 4243.3 石艳芬.敏感性问题调查的基本方法与比较.统训与信息论坛,2002, 17(5): 722.4 孙山泽.二项选择敏感性问题调查的基本方法.数理统训与性,理,2000, 19(1): 5864.5 孔圣元.敏感性问题“随机变量”和“回答模型”.数理统计与性,理,1998,17 (2): 3539.6 方积乾,主编.卫生统计学.北京:人民卫生出版社, 2003.7 郑俊池.敏感性问题调查方法探讨.数理统计与管理,1991, 10 (2) : 4042.8 王桂明.医院管理中几个敏感问题的探讨.中国医院统计, 2001, 8( 2): 9193.9 宋新明. 流行病学知识问答. 中华流行病学杂志,1997,4(18):419.10 唐卫红. 艾滋病高危行为调查中的方法学. 国外医学社会医学分册,2001,11(4):4255.