测量设计.pptx_咨信网zixin.com.cn

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,二、测量尺度,P186-187,名义尺度,（,nominal,level of measurement),或,类别量表,：用数字表示事物或对事物进行分类。要求：排斥、穷尽,顺序量表（,ordinal level of measurement,）,：用数字表示事物的类别及类别之间的顺序关系。但无法知道类别高低间,的,确实差距为多少。,等差量表,(interval level of measurement),：不仅根据某种特性用数字给事物排序，而且数字之间相等的差距还表示事物之间在所测特性上的相等差距,等比量表,(ratio level of measurement),：除了等差量表的特性外，还有一固定的或绝对的原点,第,3,讲测量技术与问卷设计,第,3,讲测量技术与问卷设计,三、测量的效度与信度（,P195-202,）,测量准确与否，用信度和效度来表示。只有信度和效度达到一定水平的测量，其结果才适于作为决策的依据。,测量值,=,真实值,+,系统误差,+,随机误差,信度（,Credibility,）：几次测量结果的稳定性和一致性,度效（,Validity,）,指真正测量到了的与想要测量的符合程度,第,3,讲测量技术与问卷设计,有效且可信,可信而无效,有效但不可信,无效且不可信,第,3,讲测量技术与问卷设计,（一）测量的信度,信度的主要类型,：重测信度；复本信度；内部一致性信度（折半法），,Cronbach,使用的前提条件,1,、重测信度,所测量的心理特质必须是稳定的；,遗忘和练习的效果基本上相互抵消,含义,：重测信度指的是用同一个量表对同一组被试施测两次所得结果的一致性程度。,第,3,讲测量技术与问卷设计,含义,：复本信度指的是两个平行的测验测量同一批被试所得结果的一致性程度。,2,、复本信度,第,3,讲测量技术与问卷设计,使用前提条件,计算复本信度首先要构造出两份或两份以上真正平行的测验（即,A,、,B,卷）。,“真正平行”指的是复本测验之间必须在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式和测验等其他方面都相同或相似。也就是说用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验。,计算复本信度是被试要有条件接受两个测验。这种条件取决于时间、经费等几个方面。,含义：,折半信度指的是将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。因为分半信度描述的是两半题目间的一致性，所以它有时也被称作内部一致性系数。,第,3,讲测量技术与问卷设计,3,、内部一致性信度（折半信度），,使用条件：,分半信度通常是在只能施测一次或没有复本的情况下使用。当一个测验无法分成对等的两半时，分半信度不宜使用。,此外，由于将一个测验分成两半的方法很多（如，按题号的奇偶性分半、或按题目的难度分半、或按题目的内容分半等等），所以，同一个测验通常会有很多个分半信度值。,影响测量信度的主要因素,：,被试、主试、测试内容、施测情境,第,3,讲测量技术与问卷设计,1,）就单个被试而言,就单个被试而言，被试的身心健康状况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差，因为这些因素往往会影响被试心理特质水平的稳定性。,2,）就被试团体而言,就被试团体而言，整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度。这是因为，我们所计算的信息估计值大都是以相关为基础的，而相关系数的大小往往取决于全体被试得分的分布情况。,1,、被试方面,1,）就施测者而言,就施测者而言，若他不按指导手册中的规定施测，或故意制造紧张气氛，或给考生一定的暗示、协助等，则测量信度会大大降低。,2,）就阅卷评分者而言,就阅卷评分者而言，若评分标准掌握不一，或前紧后松，甚至是随心所欲，则也会降低测量信度。,2,、主试者方面,第,3,讲测量技术与问卷设计,3,、实测环境,4,、测量工具,试题的多少、试题的同质性程度、试题的难易程度,一般智力测试的信度系数在,0.9,以上就可以认为该测试信度相当好；,而个性测试的信度系数在,0.8,以上就认为该测试信度相当高；,一般要求,0.7,；,0.5,以上也可以接受,第,3,讲测量技术与问卷设计,信度值多高为合适,内容效度,（,Content validity,），指一个概念的内容在测量中被呈现出来的程度，也就是指,测量题目（测项,item,）对有关内容或行为范围取样的适当性。,（二）测量的效度,第,3,讲测量技术与问卷设计,例如，在成就测验中，测验题目是根据教学大纲和教材内容适当抽出的，内容效度就是判断测验题目（考试内容）是否符合它欲测的目标。,内容效度很容易与表面效度相混淆，实际上两者意义不同。表面效度指从外表（如测验的材料及用语、试题的印刷等）直观地看，测验题目与测量目标的一致程度，,内容效度的确定主要依据专家或经验确定,效标效度,（,Criterion,）是通过测试分数与效度标准（效标）相关来证明测试是有效的一种效度类型。效标效度又分为,预测效度,和,同测效度,。,预测效度,：,指测验分数与将来的效标之间的相关程度，如对应聘者先测评，但依其它标准录用，对录用人员过一段时间后进行绩效考核，求两者的相关系数。,同测效度,：,指测验分数与当前的效标之间的相关程度，如对现有人员进行测评，将其和工作绩效比较。,第,3,讲测量技术与问卷设计,结构效度,（,structure,）,结构效度是指一个测量实际测到所要测量的理论结构和特质的程度，或者说它是指测量分数能够说明一种理论的某种结构或特质的程度。,第,3,讲测量技术与问卷设计,可分为收敛效度（,convergent,）和区分效度（,discriminant,）,第二节态度测量的量表技术方法,第,3,讲测量技术与问卷设计,1,、评比量表,评比量表的主要形式,:,见下页,评比量表由刻度和两端组成,。设计时确定出两种极端态度分别于两端，中间刻度表示态度、程度的逐渐变化顺序，可以用文字或记分表示，也可以不表示出来。,评比量表的设计思路:,人们对某种事物的态度是十分复杂的，但是他肯定在两种极端态度之间；于是，以两种极端态度为极限，在中间划分若干等级，便可以确定人们态度的位置，从而将态度问题数量化。,第,3,讲测量技术与问卷设计,1,完全不重要,非常,重要,1 2 3 4 5 6 7 8 9 10,2,完,全,不很,非常,不,重要,重要,不重要,无所谓,重要,很,重要,重要,1 2 3 4 5 6 7,3,完,全,非常,不,重要,重要,-3 -2 -1 0 +1 +2 +3,第,3,讲测量技术与问卷设计,3,）平衡与非平衡量表,如果有利态度的答案数目与不利态度答案数目相等，该态度量表就是一个平衡量表，如上述第2、3量表；反之，就是非平衡表，如上述第1量表。,采用平衡量表，回答的答案有均匀分布的可能性；而非平衡量表，一般是有利态度答案较多，就有可能使调研结果倾向于有利方向，从而出现偏差。因此非平衡量表只有在必要情况下才使用。,第,3,讲测量技术与问卷设计,注意事项：,1,）文字描述,2,）分类数目,5,）强迫性与非强迫性量表,例如上述洗发液问题，可设计为：,“飘柔洗发液在去屑方面与其它品牌相比较，你认为”：,1、较其它好 2、差不多 3、较其它差,强迫性量表是指调研人员对某一问题列出若干答案，无论被调查者选择哪一答案，都迫使他们明确表示自己的看法。,非强迫性量表就是指在调研人员列出的若干答案中，有一个是允许被调查者不表明自己态度的。例如上例中，加上第四种答案“4、很难说”，就使强迫量表变成了非强迫量表。,第,3,讲测量技术与问卷设计,4,）奇数还是偶数,2,、顺位量表,顺位量表指调研人员向被调查者列出若干不同项目，被调查者根据对这些项目的偏好程度，给出各个项目按要求的标准排列顺序的一种量表。在调查消费者的品牌偏好时可采用这一方法。,例1,，,请你按喜爱的程度对下述牌号的洗发液进行打分，最不喜爱的为1分，最喜爱得为6分(顺序由1到6),华姿,飘柔,力士,蜂花,飘逸,奥丽斯,第,3,讲测量技术与问卷设计,例2，,请对下列有关影响房地产的事项，按照您认为的重要性程度排序（从重要到不重要依次为1，2，3，,，,n,）,地段（）结构（）物业管理（）,朝向（）绿化（）交通状况（）楼层（）装修（）,第,3,讲测量技术与问卷设计,3,、配对比较量表,4,、固定总数量表,例1：请给以下各洗衣粉品牌打分，分数总和必须为100分。,碧浪,白猫,奥妙,佳美,例2：对某商品三种不同品牌在消费者心中的形象高低进行调查，要求消费者按不同程度给三种品牌对应项目打分，每个项目总分100。,项目/品牌,品牌1,品牌2,品牌3,合计,质量,功能,售后服务,合计,第,3,讲测量技术与问卷设计,调研人员列举出若干用于对比的项目，由被调查者根据自己的认识程度给每个项目评分，各项目得分总和必须是一个固定值。常用于不同商标产品的比较以调查消费者对品牌的偏好，也可用于对同一问题的不同因素之间重要性程度的比较。,70,50,30,150,20,30,40,90,10,20,30,60,100,100,100,5,、语意差别量表,语意差别量表的优点在于，它既注重总和得分，也注重单项得分，而后一点对于两个或两个以上调查对象的比较很重要。,语意差别量表是同时列出若干子量表，每一子量表都,由两个意义对立的形容词构成双极标度来评价产品、品牌、企业等，在两个对立形容词中间，又分为不同的级别。,被调查者在每一子量表上都选择一个答案，然后将答案汇总，以判断被调查者的态度或意见。,表现形式：既可以以直观图表示，也可以以分数表示。,第,3,讲测量技术与问卷设计,例1,：请根据您对商品的评价在适当的空格上方打。,+3 +2 +1 0 -1 -2 -3,态度热情态度冷谈,价格便宜价格昂贵,环境清洁环境肮脏,商品新颖陈旧商品,例2.,请根据您对某快餐店的评价在适当的空格上方打。,-3 -2 -1 0 +1 +2 +3,服务不周服务周到,店址不便店址便民,等候过长等候不长,环境不佳环境良好,第,3,讲测量技术与问卷设计,甲、乙两家银行语意差别量表蛇型图,3 -2 -1 0 +1 +2 +3,服务不周服务周到,店址不便店址便民,等候过长等候不长,环境不佳环境良好,甲银行乙银行,第,3,讲测量技术与问卷设计,利克特量表(,Likert Scale）,原理是：由研究人员围绕要测量的内容提出一系列陈述(,Statements)，,这些陈述包括正面的和反面的；由被调查者按照对每一条陈述的肯定或否定的强弱程度进行表态，并折合成分数；最后将被调查者对所有陈述的打分加总，用这个总分数说明其态度。,赖克特量表,6,、利克特量表,第,3,讲测量技术与问卷设计,利克特量表的设计与分析过程如下：,首先，拟定若干条有正面的和反面的陈述（问题），形成初始设计方案(见下表)。,其次，对初始设计的陈述进行试测，并形成试测评分和陈述评选表。也就是从调查对象中选取一个足够大的样本，让他们给所有陈述打分。所有陈述的答案一般分为,“,非常同意,”,、,“,同意,”,、,“,未定,”,、,“,不同意,”,和,“,非常不同意,”,等五级。记分方式是，对于正面的陈述，五个等级的分数依次为5、4、3、2、1分；对于反面的陈述，五个等级的分数依次为1、2、3、4、5分。,第,3,讲测量技术与问卷设计,第,3,讲测量技术与问卷设计,1,）先计算每个样本的总分，并排序；,2,）对得分总和前三名和得分总和后三名在每条陈述上的评分分别算出平均分；,3,）分别计算它们差额，即为辨别力分。如表中关于问题1 的两个平均分分别是4.7 和 4.0，辨别力分为0.7(4.7-4.0),第,3,讲测量技术与问卷设计,4,）最后，去掉辩别力差的，保留辨别力强的陈述，即得到最终的利克特量表。辨别力分小，说明差额不显著，其所对应的陈述对测量被调查者的态度没有区别力，所以应予排除；反之，则保留在方案中。这里的关键是确定评选的标准，即辨别力分多大时排除或保留陈述。本例中确定辨别力分等于1为标准，排除掉了第1、2和8个陈述，从而形成正式的赖克特量表(见下表)。,第,3,讲测量技术与问卷设计,3,4,5,6,7,9,10,

展开阅读全文