测量量表.ppt_咨信网zixin.com.cn

资源描述

Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,第八章测量量表,学习目标,建构衡量尺度的五种方式。,如何建立量表衡量的信度和效度？,学习了本章之后，应该能够达到如下目标：,如何及何时，使用不同方式的评点量表与等级量表？,课程回顾,上一章节中我们讨论了如何将企业研究中的一般观念转化为有效的、可测量的概念。,本章主要讨论测量量表的类型、建构等相关议题。,量表的基本概念,一种测量工具，常被用来测量调查对象如何感觉或思考某事物，研究者借助它来测量某个建构的强度、方向、层次。,定义,以一个连续体的方式来排列回答值或观察值，然后对其结果加以分析,。,方法,量表的构建旨在创造以顺序、等距、比率形式测量变项的数字分数，而数字的指派有助于人们进行量化思考。,目的,量表不仅有助于概念的概念化与操作化过程，而且量表产生量化测量，可以和其他变量一起被用来检验假设。,优点,第一节评点量表与等级量表,第三节量表的信度与效度,第二节测量量表制定,第一节评点量表与等级量表,一、评点量表（,rating scales,）,二、等级量表（,ranking scales,）,1,、二分量表（,dichotomous scale,）,2,、类别量表,(category scale),3,、李克特量表,(,likert,scale),4,、语意差别量表,(semantic differential scale),5,、数值量表,(numerical scale),6,、列举式评点量表,(itemized rating scale),7,、固定或常数总和评点量表,(fixed or constant sum rating scale),8,、多等级清单量表（,multiple rating list scale,）,9,、,Stapel,量表,(staple scale),10,、图形评点量表,(graphic rating scale),11,、共识性量表,(consensus scale),12,、其他量表,一、评点量表（,rating scales,）,text in here,text in here,1,、二分量表（,dichotomous scale,）,二分量表又称为,简单分类量表（,simple category scale,）,提供两个相互排斥的回答选项，通常以“是”或“否”来做回答，但是有时也可以时是“重要”和“不重要”，“同意”和“不同意”，或另外一套不连续的种类。如以下范例（其采用名目量尺来标志受试者地回答）。,你有车子吗？是否,范例,1,2,、类别量表,(category scale),多选项单一选择量表（,multiple choice,single-response scale,）,多选项单一选择量表允许评价者选择一个或几个选项，在上表中，我们用一个问题测量,7,个指标，可能所有,7,个家装设计的来源都在考虑之中，当考虑了所有应答者的选项时，这种选项的积累特点是有效的。,类别量表,多选项多选择量表（,multiple choice,multiple-response scale,）,80%,9%,30%,55%,范例,2,你居住在加州北部的何处？,北湾南湾东湾半岛其他（）,范例,3,在你选择,pc,电脑时，你主要考虑哪些方面？,价格品牌售后服务保修期外形设计性能其他（）,举例如下,3,、李克特量表,(,likert,scale),李克特量表是,评分加总量表（,summated rating scale,）,的变种中最常用的一种量表，加总量表有一些陈述，应答者利用数值表示对每一个陈述的赞成或反对程度，这些数值可以加总来测量应答者的态度，一般一个可靠的李克特量表要求包括,20,25,个适当构造的、有关态度对象的问题。在下面的例子中，对每一个陈述被设计为五点量表，如下所示之,定位点（,anchors,）,是用来检查受试者对叙述句的赞成或不赞成程度有多强烈。,范例,4,非常不同意,不同意,不赞成也不同意,同意,非常同意,1,2,3,4,5,接着，可将每位受试者在这些题项上的答案加总，而这些题项通常是用来衡量特定概念或变项（如范例,4,）。此种量表一般采用的是区间量尺，而在量表中任何两点之间地差距是相等的。,范例,5,（,1,）我的工作非常有趣,1,2,3,4,5,（,2,）我并非整天都全神贯注在我的工作,1,2,3,4,5,（,3,）生活中没有工作将是乏味的,1,2,3,4,5,使用前述的李克特量表，指出你赞成下列每一个叙述的程度：,4,、语意差别量表,(semantic differential scale),语意差别量表具有是建立在一个对象具有几个方面的内涵意义基础之上的，这些意义分布在多维属性空间里面，被称作语意空间（,semantic space,）。每一种内涵意义具有相对两极的属性，将相对应的属性放在量表两端当作极端值，而受试者则被要求在语意空间中，指出他们对某些特定地个人、目标物或事件的态度。例如，常使用某些具有相对应两端地形容词，如“好坏”、“强弱”、“热冷”等。语意差别量表不仅常被用来评估受试者对特定品牌、广告、目标物或个人的态度外，还时常可透过他们地选择获得不错的点子。管理人员品牌形象、机构形象、政治问题和个性对象的市场营销研究以及组织研究中常常采用这种量表。此外，该量表通常会被当作区间量尺来处理，举例如下。,范例,6,有反应的,没有反应的,美丽的,丑陋的,勇敢的,胆小的,5,、数值量表,(numerical scale),数值量表中每个数值表度点之间的间距是相等的，共有的点作为极端点的标志。应答者量表中选择一个数字写在每个问题旁边。如果例子中包含无数个有关员工业绩的问题，这种方法可以既提供重要性的绝对度量，又提供被评价的不同问题的相对度量（排序）。数值量表跟语意差别量表很类似，也经常被当作区间量尺来使用，不过其不同之处在于数值量表提供五点或七点量表，并且将极端的形容词放在两端，如下所示。,非常愉快,7,6,5,4,3,2,1,非常不愉快,范例,7,你和你的房地产代理人之间的相处有多愉快？,6,、列举式评点量表,(itemized rating scale),底下每一题皆使用下列量表作答，并于题项右边的底线上标示你的答案。,非常不可能,1,不可能,2,中等,3,可能,4,非常可能,5,（,1,）我将在,12,个月内换工作,（,2,）我最近将负担起新的任务,（,3,）我将可能在,12,个月内离开公司,注：以上为有中立点（,neutral point,）的,平衡式评点量表（,balanced rating scale,）,范例,8,（,i,）,请在下列题项上圈选出最接近你的感觉之数字,完全没兴趣,1,有一点兴趣,2,有中等程度的兴趣,3,非常有兴趣,4,你会如何评定你对改变目前组织,政策的兴趣,1 2 3 4,注：此为没有中立点的不,平衡式评点量表（,unbalanced rating scale,）,范例,8,（,ii,）,7,、固定或常数总和评点量表,(fixed or constant sum rating scale),受试者必须在欲评点的变项之间分配点数，但是当要均衡或加总许多方面时，应答者的耐心和精确度都会受到影响。这种尺度的优点是它与百分比的相容性和可以对连续的数据进行比较并做出选择。如下所示（该量表较偏向具有顺序量尺的特性）。,总分为一百点，请以分配的方式，指出你在选择香皂时，对下列五个特性之重视程度,香味,颜色,形状,大小,泡沫的质地,总点数,100,范例,9,8,、多等级清单量表（,multiple rating list scale,）,多等级清单量表与数值量表类似，但在两个方面有所不同：,（,1,）它允许评价者循环回答,（,2,）它的编排允许看到结果，其优点是应答者的评价清楚的展现在研究人员和面前，这种尺度产生与区间数据。,9,、,Stapel,量表,(staple scale),请根据以下所提之观点，评价你上司的能力如何，并圈选出适合数字。,3,3,3,2,2,2,1,1,1,采用现代化的技术产品创新人际关系的技巧,1 1 1,2 2 2,3 3 3,范例,10,10,、图形评点量表,(graphic rating scale),图形评点量表是利用图形的呈现可帮助受试者在量表中，指出其答案之所在位置，使研究人员能够识别很小的差异。藉由在标线上相称的点做记号（如下所示），帮助受试者在量表上表达他们对特定问题的回答。虽然以下范例看起来好像是区间量尺，但该量表实为顺序量尺。,特点：,该量表的优点是容易作答，并可透过量表中标识点旁的简短叙述作为导引评点的位置，且此一作法较抽象的分类来得好。表情量表（,face scale,）也是一种图形评点量表，其是将表情的差距以图案从微笑到悲伤加以呈现，让受试者评定他们在一些事情上的感受，例如，对工作的感觉。,11,、共识性量表,(consensus scale),共识性量表是由评审小组依据与欲测量概念的切题程度或相关程度来挑选特定的题项，并经由信度与效度的检验之后发展而成。其中，塞斯通等距量表就是一种共识性量表，在挑选出题项后，使用大量叙述概念的卡片，让评审小组评定该叙述句距离欲研究概念有的接近程度。然而，由于该量表需要长时间的发展，因此，很少用来衡量组织的概念。,12,、其他量表,有些进阶的测量方法，如多元尺度度量表可用视觉方式针对目标物、人或此二者加以量表化，然后在进行联合分析（,conjoint analysis,）。此量表可提供构念中各面向间之关系的想象空间。在此需注意的是，许多有名的量表，如李克特量表或其它数值量表，是组织研究中最常用来衡量态度与行为的工具。,返回,第一节评点量表与等级量表,二、等级量表（,ranking scales,）,1,、配对比较量表,（,paired comparison scale,）,2,、强迫选择量表,（,forced ranking scale,）,3,、比较量表,（,comparative scale,）,配对比较量表,“下面列出的每对双座跑车中，如果你必须选择出一个，请选择出你比较喜欢的一个，并在旁边做上记号。,”,BMWZ3,Chevrolet corvette,Porsche,Boxster,Porsche,Boxster,Chevrolet corvette,Porsche Boxster,BMWZ3,Dodge Viper,Chevrolet corvette,Dodge Viper,Dodge Viper,BMWZ3,强迫选择量表,“根据你的偏好顺序对雷达的探测特点进行排序，在最喜欢的旁边标上,1,，在第二个喜欢的旁边标上,2,，等等”,使用人员程序设计,无线设施,体积小,长距离预警,最少的错误预警,比较量表,“与你以前的互助基金业相比，新的基金的业绩：”,好大致相同差,1 2 3 4 5,返回,consensus scaling,arbitrary scale,item analysis scaling,factor scale,主观决断量表,共识量表,项目分析量表,因素量表,通过收集适合给定主题的问题来设计主观决断量表,共识量表要求问题由一组裁判选出，然后在三个方面进行评价,项目分析方法涉及计算每个量表问题在高分群体和低分群体中的平均得分,用于处理怎样处理多维的内容范围；怎样找出那些探索性研究没有发现的基础维度,第二节测量量表制定,你怎样看待公司的形象？,1,作为一个工作的场所？,差好,2,作为市政建设的主办方？,差好,3,对生态环境的关注？,差好,4,作为少数民族人士的雇主？,差好,优点：设计简单、成本低廉，可以提供由于而充分的信息。,缺点；设计方法是主观的，设计的问题无普遍性。,返回,下表显示了同义词典研究的结果,评价,权力,行动,好差,硬软,主动被动,积极消极,强弱,快慢,完全不完全,重轻,热冷,及时的不及时的,阳性阴性,易激动的冷静的,严厉的仁慈的,固执的屈从的,评价的子类,温顺的优点,动态的优点,可信赖的优点,快乐主义的优点,干净肮脏,成功不成功,正确错误,快乐的痛苦的,仁慈残忍,高低,有声望的无声望的,美丽的丑陋的,善交际的不善交际,有意义的无意义的,相信怀疑,善交际的不善交际,明亮的黑暗的,重要的不重要的,明智愚蠢,有意义无意义,利他的利己的,进步的退步的,健康的生病的,感激的不感激的,干净的肮脏的,美丽的丑陋的,和谐的不和谐的,返回,第三节量表的信度与效度,在建立了衡量的标准后，就要衡量量表的信度与效度指标。简单来说，所谓的信度是指当检验衡量工具在衡量任一概念时，是否具有一致性。效度则是在检验发展完成的衡量工具，是否能真正衡量到想要衡量的特定概念。换句话说，效度是关于我们是否真正衡量到对的概念，而信度则是与衡量的稳定性与一致性有关。衡量的效度与信度是将科学上所要求的严谨，应用到一般的调查研究中。以下将针对这二种标准做深入讨论，并说明各种形式的信度与效度。,第三节量表的信度与效度,一、衡量的信度,二、衡量的效度,一、衡量的信度,1,、定义：,2,、影响因素,3,、评估方法,测量的一致性与稳定性而言的，说的是在测量重复进行的情况下，测量工具能否产生一致性结果，能够稳定的测量研究变量的程度,影响信度的主要因素,（,1,）在结构式、标准化程度较高的测量中，信度主要受随机误差的影响。,而随机误差源自：,受访者：是否认真、耐心的配合调查，有无太大情绪波动,调查时间：一般来说，调查时间越长、问题越多、难度越大、信度越低,调研人员：是否认真、规范的调查、记录，是否有意或无意地对受访者施加影响,测量工具：量表设计是否合理，问题措辞是否清晰，题目间的关联度的高低,测量环境：有无他人“在场”，有无噪音和分心的事物,注意，要想提高测量的信度，我们需要注意两个明确，一是问题要明确，二是遣词造句要清晰，尽量使受访者知道究竟该如何做答。,影响信度的主要因素,（,2,）在非结构式、非标准化的测量中，除偶然因素外，信度还受一些主观因素的影响。,调研人员：容易搀杂自己武断的评估，特别在观察和试验法中,受访者：不同的受访者会带入不同的世界观，使用不同的评分标准。,对此情况，我们通常采用删除极端的受访者的评分，取均值的办法来解决。,返回,评估信度的方法,方法,（,1,）复测信度,（,2,）复本信度,（,3,）折半信度,（,1,）复测信度,定义：,复测信度是指我们用同一份量表，对同一群受访者，在两次不同的时间进行调查，根据两次测量结果，计算相关系数，以此来评估测量信度。,使用技巧,：,1,：选取少数重要的问题通过电话、邮件或再上门拜访等方式进行复测。,2,：面对面访谈，在受访者做答完完毕后，进行补充式复测。,3,：长期跟踪调查，采用完全重复测量，并辅以电话、电邮、电脑等建立大型的数据库管理系统，定期更新、修补数据。,（,2,）复本信度,定义：,指用两个等价的量表形式（原本和复本），对同一群受访者进行两次调查，然后根据测量结果，比较两次答案的相似性，计算相关系数，评估测量信度。,缺点：,构建一个完全等价的量表技术上非常困难,复本的设计耗时、耗力、且成本昂贵,设计技巧：,同一主题，可将原本中的某些问题或陈述反向表达,如原本中，让受访者对“,A,商店的服务员态度热情”发表意见，答案选项设“非常不赞同，不赞同，不确定，赞同，非常赞同”五项，则在复本中，我们可以这样提问，“,A,商店的服务员给人高傲的感觉”，答案依然设“非常不赞同，不赞同，不确定，赞同，非常赞同”五项。,（,3,）折半信度,定义：,指信度的测量集中在构成一份量表的项目体系的内部一致性上。它是在我们无复本又不准备复测的情况下，通常采用的最简单的估计信度的方法。,系数：,分割量表项目的不同方法的所有可能的折半系数的平均数。,用于测量结果取决于量表或问卷项目是如何被拆分时。,随量表项目数的增加而增大。,一般介于,01,之间，,0,代表测量不可信，,1,代表测量完全可信，当,系数小于或等于,0.6,时，表明内部一致性很低。,系数常与,系数配合使用，以帮助确定在计算,系数时所用的拆分方法是否掩饰了任何不一致的项目。,3,、建立可靠的测量标准,可靠的测量标准是指持有相同看法或感受的受访者在接受对同一研究变量的测量时，会产生相同或相近的答案。,而不可靠测量标准的产生原因一般为：如问题的提示语或解说词不够明确；调查人员对不同受访者所做的问题陈述方式不一；受访者对问题中的某些措辞有不同的理解等。一般而言，在时间允许的情况下，调研人员有必要在展开市场调查时进行可靠度评估，尽量选用可靠的测量标准。,4,、可靠度评估的步骤,通常，第一次测量的可靠度达到,0.65,或,0.70,就被认为是可以接受的。,首先，形成一个合格的测量标准。我们应在正式调查前，用心进行前期测试，改进或剔除那些含有不可靠测量标准的问题。,其次，量表中项目及所设答案的添减或变化都是造成不可靠测量标准的原因。在调查进行中，当我们对测量标准产生疑问时，可以考虑“浓缩”量表，增加可信度。,再次，在确保有一个比较准确的测量标准前提下，我们可以使用复测信度、复本信度或折半信度来直接检测受访者的可信性，将那些不可靠的测量结果排除于最终的汇总、分析之外。,但在将这些受访者的答案排列之前，必须肯定你的度量标准对大多数受访者来说是可信的。,最后，通过计算,系数来表征可信度。,返回,二、衡量的效度,效度,（,Validity,）是就测量的准确性和真实性而言的，是指测量工具能够准确地测量调查对象特性的程度。,调查测量结果的有效性,衡量工具本身的效度,表面效度,准则效度,内在效度,内容效度,效标关系效度,建构效度,系统误差和其他变量,测量工具,样本的代表性,内在效度和外在效度,影响效度的因素,评估方法,（,1,）内容效度,内容效度（,content validity,）的建立是要确保量表中，包含了能够衡量该概念的适当且具代表性的题项。量表内的项目愈能代表该概念的主要领域或共通性，则其内容效度愈好。简单来说，内容效度也代表了将概念拆解成构面与要素的过程是否完善的指标。,一般来说，量表的内容效度通常会透过评审小组的认可。,Kidder,与,Judd,（,1686,）曾举例说明，某个用来衡量“语言障碍”的量表是否具有内容效度，可交由一群专家来评估（如专业的语言治疗师）。,表面效度（,face validity,）一般被视为内容效度的基本且最低的要求。表面效度系指当某些题项被设计来衡量某个概念时，至少要看起来像在衡量此概念。但有些研究者并不认为表面效度可当作内容效度有意义的构成要素。,返回,（,2,）效标关系效度,效标关系效度（,criterion-related validity,）系指建立另一个个体的期望效标，当作衡量是否有效的标准。效标关系度一般可用同时效度（,concurrent validity,）或预测效度（,predictive validity,）来代表。同时效度适用于量表可区别出某些已知有差异的个体时；亦即这些个体在此量表上的得分应该是有差异的，如以下范例之说明。,范例,假设一个关于工作伦理的量表已被发展出来，并交由一群领取社会救济的人来填答，基本上，此量表应能区别出，一群乐于接受工作且由机会不依靠社会救济的人，以及另一群即时提供工作也不想工作的人。因此，这二群人在该量表上应由不同的得分。很明显地，这些具有高度工作伦理价值观的人，不想依靠社会救济且渴望靠自己获取被雇佣的机会。另一方面，那些工作伦理价值观较低的人，将尽可能地争取继续使用社会救济地机会，且视工作为作苦工。故如果此二种类型地人在工作伦理量表上地得分相同，则该份测验就不是衡量到工作伦理，而是其他概念的衡量。,预测效度系指测量工具能在某个未来的效标上，区分出个别差异的能力。例如，在招募员工时，同时也让新近员工填写性格或能力测验，并将此成绩与其未来的工作绩效做比较。基本上，性格测验得分较低的人应该会由较差的工作绩效表现；反之，则由较好的工作绩效表现。由此即可得知，此测验具有较高的预测效度。,返回,（,3,）建构效度,建构效度（,construct validity,）是用来证明，从量表所获得的结果与设计该量表时所依据的理论之间的契合程度。一般来说，建构效度可透过聚合效度（,convergent validity,）与区别效度（,discriminant,validity,）来评估，其意义如下。,聚合效度系指，当采用二种不同的衡量工具来衡量同一个概念时，所获得的分数之间是有高度相关的。而区别效度系指，如果根据理论的预测，二个变项之间时不相关的，则两个变项的实际衡量分数之间，应该也时不相关的。,其实，效度可以透过许多不同的方式来建立。在实务上，那些用来衡量概念且已经发表的各种衡量工具，通常会对衡量工具所建立的各式效度指标加以描述，如此可让使用者或读者判断该量表的适合度。下表,8-2,概要说明了本章讨论过的各种效度。,表,8-2,效度的类型,效度,叙述,内容效度,该份量表有适切地衡量到想要衡量的概念吗？,表面效度,有没有专家认证，该份量表确实能衡量到我们想要衡量的？,效标关系效度,该份量表是否具有预测某一效标变项的能力？,同时效度,该份量表是否具有预测某一现存效标变项的能力？,预测效度,该份量表是否具有预测某一未来效标变项的能力？,构念效度,该衡量工具能够衡量到如理论所提的概念？,聚合效度,二种衡量工具衡量同一个概念时，其结果是否具有高度相关？,区辨效度,该份量表跟理论上无关的变项之间有低度相关？,总而言之，衡量的合适度将可透过不同形式的效度与信度来确立。任何研究要获得好的结果，都必须要求确实有衡量到理论架构种的概念。我们需要使用具有高度效度与高度信度的衡量工具，以确保我们的研究是符合科学标准的。幸运的是，在组织的研究中，一直有研究者在努力研发许多重要概念的衡量工具，而且这些研发者同时也建立了这些工具在心理计量上的特性（,psychometric properties,；例如信度与效度）。因此，研究者通常可以利用既有的，且有良好声誉的量表工具来衡量，这会比自己辛苦开发出来的量表来得合适。然而，在使用这些量表时，研究者应清楚地注解其引用的资料来源（如作者及参考文献），让有需要的读者可以寻找更多资讯。,本章小结,社会科学的许多概念具有复杂的、各式各样的含义。为求涵盖周全，研究者通常要针对具体概念进行多重观察，但是并不是所有的变量都可以这么直截了当测量。因此，研究者需要借助一定的测量工具来实现准确地测量变量，了解变量的涵义和结构。本章所讨论的是研究者变量测量中最常用的工具,量表。本章讨论了量表的类型，如何及何时，使用不同方式的评点量表与等级量表。其次，讨论了量表的制定，介绍了四种最常用的方法：主观决断法、项目分析法、因素法。在研究测量中，精确性和准确性都十分重要，而且是必备的。社会科学研究者建构和评估测量时，采用两项技术性指标,信度和效度,来衡量测量的可信程度。本章详细分析了不同类型的信度和效度的涵义和检验。,本章关键术语,评点量表（,rating scales,）,等级量表（,ranking scales,）,李克特量表,(,likert,scale),复测信度（,test-retest reliability,）,复本信度（,equivalent-form reliability,）,折半信度（,split-half reliability,）,内容效度（,content validity,）,效标关系效度（,criterion-related validity,）,建构效度（,construct validity,）,聚合效度（,convergent validity,）,区别效度（,discriminated validity,）,一、复习思考题,1.,请简短叙述态度评点量表与等级量表的不同，并指出二者在何时适合使用。,2.,为何建立衡量的适合度是很重要的？应如何建立呢？,3.,请建立一个语意差别量表，来评估某一特定品牌的咖啡或茶的属性。,4.,文中建议，尽可能使用已经发展好，且在已发表研究中被重复使用的衡量工具，而尽量不要为自己的研究去开发量表。您同意吗？为什么？,5.,一个有效度的衡量工具一定是有信度的，但一个有信度的衡量工具不一定是有效度的。试评论之。,二、牛刀小试,大家有想念牛老师的复习时间吗？老牛有问题要问各位同学啦！看完各种研究类型，那就要请大家实际应用一下啰！,问题：你曾被要求对一家石油开发公司的一群经理陈述开展一项研究工作地目的。你简要介绍了打算使用的方法以及对问卷进行预先测试的方法。随后提问时，以为经理怀疑预测是否次要，他认为因为时间急迫，无法进行预先测试。请列出要点说明原先测试的重要性。,答案：尽管时间有限，但基于以下原因，问卷还是需要进行预先测试：,了解填写一份问卷需要多少时间,了解被访者理解和遵循问卷指南的程度（包括过滤性问题）,确保所有被访者均能较为一致地理解问题的措词，不存在模糊不清的问题,确保你和被访者对问题的理解是一致的,确保被访者在回答问题时不存在困难，比如：,-,是否包括了所有可能的答案？,-,被访者是否感到有些问题难以回答,/,检查是否有些重大的问题被遗漏了,检查问卷中问题的有效性,通过检查每位被访者对相似问题的回答，确定问题的可靠性,检查问卷布局是否整洁和吸引人,提供必要的测试数据以确定后面分析可以进行,三、拓展性习题,1,、如果测验题目的一个样本恰当地代表了已知科目的主要内容，我们认为这一测验具有好的,_,效度。,a.,概念,b.,预测,c.,内容,d.,同时,2,、为了计算测量的,_,，首先对由个体组成的样本进行测量，而稍后，再对该样本进行同样的测量。,a.,选择形式信度,b.,测验,-,再测验信度,c.,内部连续性,d.,分项分数的信度,3,、为一个研究项目选择一个成绩测验，你首先应该,a.,对自己测验,b.,对你希望进行测量的概念下定义,c.,检查目前可供选择的成绩测验,d.,对与你预想中的样本具有可比性的人群进行测试,4,、项目信度的根据是,a.,对准确回答每个问题的个体的比例计算,b.,个体对一个测验中某个题目的反应与他们在另一次测验中的总分之间的相互关系,c.,个体对一个测验中某个题目的反应与他们在该次测验中的总分之间的相互关系,d.,上述三点,5,、可以通过,_,来提高获得个性测验中诚实反应的可能性。,a.,向个体保证他们的答案绝不向外透露,b.,告诉个体，在评分后他们可以看到他们个性测验的成绩,c.,使用计算机适应测验,d.,使用解释学中的理论,6,、“三角几何共八角，三角三角几何几何？这样一道题出现在数学试卷中，结果血多中学生都不知道几卷的结果。说明这道题：,a.,信度低，效度也很低,b.,信度高，但效度第,c.,信度低，但效度高,d.,信度高，效度也高,7,、一般来说，智商可以属于：,a.,称名量表,b.,比率量表,c.,顺序量表,d.,等距量表,8,、一位管理学讲师想要检验一种新教学的效果。上课第一天，她对全体学生布置了一个,100,道关于心理学主要内容的多选题的测试，在期末时她使用了类似的测试作为期末考试。请列出你认为适用于这项研究的对内在效度的潜在威胁因素。,9,、用你自己的话说出李克特式量表和古特曼式量表的异同之处。,10,、为什么对人们的体重进行的再测信度，可能会高于对他们的人格进行的再测信度？,11,、有什么方法可以提高测量的信度？,12,、用你自己的话来解释聚合效度和判别效度对于研究一个测量的效度的重要性。,Thank You!,

展开阅读全文