资源描述
心理测量学知识复习概要
第一节 概 述……………………………………………………………………………………………………(348)
第一单元 测量与测量量表………………………………………………………………………………………(348)
一、什么是测量
对测量的描述正确的是,测量就是依据一定的法则用数字对事物加以确定。(习题1)0711—50
测量的元素包括:①法则;②数字;③事物。(习题124)
测量所用数字具备自然数的特点,即具备:①辨别性;②等级性;③等距性;④可加性。(习题125)
二、测量要素
任何测量都应当具备的要素是:①参考点;②单位。(习题126)0811—108
(一)参考点:参考点就是确定事物的量时,计算的起点。参考点有两种,即:①绝对零点;②相对零点。参考绝对零点可加减乘除,参考相对零点只能加减(心理测量参考相对零点)。(习题2)(习题127)
(二)单位:好的单位必须具备两个条件:①确定的意义;②相同的价值。心理现象既没有确定的意义,也没有相同的价值。心理测验的成果是有误差的,要用区间来解释,而不是用点来解释。(习题128)
三、测量量表
定义:在一个定有单位和参考点的连续体上把事物的属性体现出来,这个连续体称为量表。
斯蒂文斯(S.S.Stevens)将测量从低级到高级提成4种水平:①命名量表;②次序量表;③等距量表;④等比量表。(习题129)
(一)命名量表:是测量水平最低的量表形式,只是用数字来代表事物或把事务归类。用1代表男,用2代表女等等,这么的量表一般叫命名量表。(习题3)
(二)次序量表:比命名量表水平高,数字不但指明类别,同时指明类别的大小或属性程度。我们一般将学生的考试成果按名次排队,这些名次属于次序变量。在次序量表中,变量具备等级。(习题4)0805—53
(三)等距量表:比次序量表深入,有相等的单位,其数值能够相互做加减运算;但没有绝对零点,因此不能做乘除运算。0℃并不意味着没有温度,这种说法对。(习题6、130)
(四)等比量表:最高水平量表,有相等单位又有绝对零点,所得的数字能够做加减乘除运算。其数值能够进行加、减、乘、除运算的量表是等比变量。(习题7)
一般说来,心理测量是在次序量表上进行的,重要用于分等级和排序。(习题8)
斯蒂文斯的4种量表(水平从低到高)
水平
量表
属 性
可进行
大小关系
相等单位
绝对零点
1
命名量表
无
无
无
标识和分类
2
次序量表
有
无
无
分等级和排序
3
等距量表
有
有
无
加减运算
4
等比量表
有
有
有
加减乘除运算
第二单元 心理测验的基本概念…………………………………………………………………………………(350)
一、心理测验的定义
正确的说法是,心理测验,就是依据心理学理论,使用一定的操作程序,通过观测人的少数有代表性的行为,对于贯通在人的所有行为活动中的心理特点做出推论和数量化分析的一个科学伎俩。(习题9)
①测量对象是人的行为;②选用的是行为样本;③测量要标准化;④测量要有常模
二、心理测验的性质
心理测验具备独特的性质,即具备:①间接性;②相对性;③客观性。(习题131)
影响心理测量客观性的要素是:①测验刺激的客观性;②对反应的量化的客观性;③对测验成果的推论的客观性。测验的客观性不包括绝正确标准的客观性。(习题10)
第三单元 心理测验的分类………………………………………………………………………………………(352)
一、按测验的功效分类
按测验的功效进行分类,可将测验分为:①智力测验;②特殊能力测验;③人格测验。(习题132)
二、按测验材料的性质分类
按测验材料的性质分类,可将测验分为:①文字测验;②操作测验。(习题133)
三、按测验材料的严谨程度分类
按测验材料的严谨程度分类,可将测验分为:①客观测验;②投射测验。(习题134)
刺激没有明确意义,对被试反应没有明确要求的心理测验,称之为投射测验。投射测验的重要特点是刺激材料的意义是不明确的。
四、按测验的方式分类
按测验的方式分类,可将测验分为:①个别测验;②团体测验。(习题135)
团体测验始于第一次世界大战,陆军甲种和乙种智力测验是第一个团体测验。
五、按测验的要求分类
按测验的要求分类,可将测验分为:①最高行为测验;②经典行为测验。(习题136)
心理测验的分类
分类标准
测验种类
测验实例
按功效分类
智力测验
特殊能力测验
人格测验
比内一西蒙智力测验;斯坦福一比内智力量表;韦氏小朋友成人智力量表
升学、职业指引,特殊工种人员筛选,临床较少
MMPI、16PF、EPQ、罗夏、主题统觉(TAT)(0308-3-191)
按材料性质分类
文字测验
操作测验
MMPI、EPQ、16PF、韦氏智力量表中的言语量表
罗夏、TAT、瑞文测验、韦氏智力量表中的操作量表
按材料严谨程度分类
客观测验
投射测验
绝大多数心理测验均属此类
罗夏、主题统觉、自由联想、句子完成
按方式分类
个别测验
团体测验
比内一西蒙智力量表;韦氏智力量表;不能用于团体
陆军甲种乙种测验;教育成就测验;团体测验可个别实行,如MMPI、EPQ、16PF等
按要求分类
最高作为测验
经典行为测验
智力测验、成就测验均属最高行为测验
各种人格测验均属经典行为测验
第四单元 纠正错误的测验观……………………………………………………………………………………(354)
一、错误的测验观
错误的测验观包括:①测验万能论;②测验无用论;③心理测验即智力测验。(习题11)
错误的测验观不包括“以上一个也不是”。
二、正确的测验观
正确的测验观包括:①心理测验是重要的心理学研究措施之一,是决议的辅助工具;②心理测验作为研究措施和测量工具尚不完善。(习题11、137)
第五单元 心理测验在心理咨询中的应用………………………………………………………………………(355)
我国目前心理门诊中利用较多的心理测验有:①智力测验;②人格测验;③心理评定量表。(习题138)
一、智力测验
我国修订后的韦氏智力量表包括:①WAIS-RC;②C-WISC;③C-WYCS1。
二、人格测验(EPQ、MMPI、16PF)
三、心理评定量表
第六单元 心理测验的发展史……………………………………………………………………………………(356)
一、科学心理测验的产生与发展
英国生物学家和心理学家高尔登(F.Galton)的重要贡献有:①提出人的不一样气质特点和智能是按身体特点的不一样而遗传的;②为了研究差异的遗传性,设计了测量差异的措施;③为心理测验奠定了统计学基础,第一个提出了有关的概念。(首先倡导科学心理测验的学者)(习题139)
美国心理学家卡特尔(J.M.Cattell)对促进心理测验发展做出的巨大贡献是:①使心理测验初次出现于心理学文献中;②以为心理学应立足于试验和测验;③以为心理测验应有统一的标准。(习题140)
比内(A.Binet)编制了世界上第一个正式的心理测验。(习题12)
20世纪以后,心理测验在如下几方面取得了长足发展:①操作测验;②团体智力测验;③能力倾向测验;④人格测验。(习题141)
二、当代心理测验在我国的发展
近些年来,我国心理学家正在致力于心理测验的本土化研究。(习题13)
第二节 测验的常模………………………………………………………………………………………………(360)
第一单元 常模团体………………………………………………………………………………………………(360)
一、常模团体的性质
常模团体是由具备某种共同特性的人所组成的一个群体,或者是该群体的一个样本。(习题14)
常模团体的选择一般包括:①确定一般总体;②确定目标总体;③确定样本。(习题142)
二、常模团体的条件
常模团体的条件包括:①群体组成必须明确界定;②对群体具备代表性;③样本的大小要适当;④具备新近性(标准化样组是一定期空的产物)。抽样措施不是常模团体的条件。(习题143)
(一)群体的组成必须明确界定
(二)常模团体必须是所测群体的代表性样本
(三)样本大小要适当
实际工作中,样本量大小适当须从如下几方面考虑:①经济;②实用;③减少误差。(习题144)
常模样本量的大小,一般最低不小于30或 100。0805—54全国性常模,样本量一般要在~3000之间。样本大小适当的核心是样本要有代表性。(习题15、16、17)
(四)标准化样组是一定期空的产物
三、取样的措施
抽样的措施一般有:①简单随机抽样;②系统抽样(等距抽样);③分组抽样;④分层抽样。(习题20、145)
取样是指从目标人群中选择有代表性的样本。(习题18)0811—55
随机号码表法是简单随机抽样。(习题19)
系统抽样要求:①目标总体无序可排;②无等级结构存在。
系统抽样法的核心是计算组距。0711—51
先将群体分组,再在组内进行随机取样的措施是分组抽样。(习题21)
四、常模分数与常模
(一)常模
常模,是一个供比较的标准量数,它是解释心理测验时用于比较和解释测验成果的参考分数标准。(习题22)
对于某些特殊的群体来说,情况很详细而特殊,我们就需要制定特殊常模。
常模按样本的大小和起源,有全国常模、区域常模和特殊常模;(习题146)
依照详细应用标准和分数特性:百分位常模、标准常模
(二)常模分数
定义:常模分数就是施测常模样本后,将被试者的原始分数按一定规则转换出来的导出分数。
常模分数又叫导出分数。(习题23)0805—55
导出分数的特性:①与原始分数等值;②具备意义;③等单位;④具备参考点。(习题147)
第二单元 常模的类型……………………………………………………………………………………………(363)
一、发展常模
发展常模就是年龄量表。在年龄量表中,个人的分数指出了他的行为在按正常途径发展方面处在什么样的发展水平。(习题24)
(一)发展次序量表1005—34
发展次序量表能够告诉人们某小朋友的发育与其年龄相比:①超前;②滞后;③正常。(习题148)
最早的一个发展次序量表的范例是葛塞尔发展程序表。(习题26)
葛塞尔发展程序表,其中按月份显示小朋友在如下几方面的大体发展水平:①运动水平;②适应性;③语言。④社会性。(习题149)
按照葛塞尔研究的婴儿行为变化的次序,16周的婴儿能使头保持平衡。(习题27)
皮亚杰的研究着重于从婴儿到十多岁小朋友认知过程的发展,尤其重视某些特殊概念的形成,其中最知名的工作就是对守恒概念的研究。(习题28)
皮亚杰发觉,小朋友在不一样时期出现不一样的守恒概念,一般小朋友到5岁时才会了解质量守恒;6岁时才会掌握重量守恒;7岁时才具备容量守恒概念。(习题29)
发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地变化。因此,它的基本要素是:①一组能够辨别不一样年龄组的题目;②一个常模团体;③常模表。
最直观的发展常摸是发展次序量表。
(二)智力年龄
比内一西蒙量表中首先使用智力年龄的概念。(习题30)
一个小朋友在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫智力年龄,简称智龄。(习题150)
在吴天敏修订的比内一西蒙量表中,某小朋友通过了 4岁组的所有题目,5岁组通过3题,6岁组通过2题,7岁组通过1题,其智龄为5岁。(4岁+3题*2月+2题*2月+1题*2月)=5岁;(习题31)
在吴天敏修订的比内—西蒙量表做测验,某小朋友6岁组题目所有通过,7岁组通过4题,8岁组通过3题,9岁组通过2题,其智龄为7岁6 个月。
(三)年级当量
常模样本中6年级的算术平均分为35,某小朋友在算术测验中得35分,那就是说,该小朋友的算术年级当量是6年级水平。(习题32)
二、百分位常模
百分位常模包括:①百分等级;②百分点;③四分位数;④十分位数。(习题151)
(一)百分等级
一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。
55的百分等级表示在常模样本中有55%的人比这个分数低。(习题34)1011—57
王红在 30名同学中物理成绩是 80分,排列第五名,则其百分等级为85。(25/30)
(二)百分点
在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。(习题152)
高考的最高分为650,其百分等级为100,最低分为105分,百分等级为1,要录用20%的学生进入大学,百分等级为80的百分位数540。
(三)四分位数和十分位数
四分位数是将量表提成四等份,相称于百分等级的25%、50%和75%对应的三个百分数提成的四段。(习题36)
十分位数1%~10%为第一段。(习题37)
三、标准分常模
标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,因此叫标准分数。常见的标准分数有Z分数和:①Z分数;②T分数;③标准九分数;④离差智商。(习题153)
标准分数能够通过线性转换和非线性转换得到。(习题154)
(一)线性转换的标准分数
Z=(X—)/SD式中 SD为样本标准差。X为任一原始分数,为样本平均数。(习题38)
Z=A+BZ式中Z为转换后的标准分数,A、B为依照需要指定的常数。加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点。(习题39)
(二)非线性转换的标准分数
当原始分数不是常态分布时,也能够使之常态化,这一转换过程是非线性的。(习题45)
常态化过程重要是将原始分数转化为百分等级,再将百分等级转化为常态分布上对应的离均值,并能够表示为任何平均数和标准差。(习题46)
当以50为平均数,以10为标准差来表示时,一般叫T分数。(习题40)0805—56
标准九分是以5为平均数,以2为标准差的一个量表。(习题41)
标准十分,平均数为5.5,标准差为1.5。(习题42)
标准二十分,平均数为10,标准差为3(习题43)
常用标准分数
标准分数
平均数
标准差
Z分数
样本平均数
样本标准差SD
T分数
50
10
标准九分
5
2
标准十分
5.5
1.5
标准二十分
10
3
离差智商
100
15(韦氏)
四、智商及其意义
若小朋友的心理年龄高于其生理年龄,则智力较一般小朋友高,若心理年龄低于其生理年龄,则智力较一般小朋友低。但在实践中发觉,单纯用心理年龄来表示智力高低的措施缺乏不一样年龄小朋友间的可比性。(习题47)
(一)比率智商
比率智商(IQ)被定义为心理年龄与实足年龄之比。比率智商的计算公式是IQ=(MA/CA)×100。(习题48)
不符合比率智商含义的说法是:①心理年龄除以实足年龄所得的商数;②实足年龄除以心理年龄所得的商数;③被试成绩与平均数之差除以标准差所得的商数;④被试成绩除以标准差所得的商数。
因为个体智力增加是一个由快到慢再到停止的过程,即心理年龄与实足年龄不一样时增加,因此比率智商并不适合于年龄较大的被试者。(习题49)
(二)离差智商
韦克斯勒将离差智商的平均数定为100,标准差定为15。(习题50)
离差智商的优点是:①建立在统计学的基础之上;②表示的是个体智力在年龄组中所处的位置;③表示的是智力高低的一个理想的指标。(习题155)
离差智商表示的是个体智力在年龄组中所处的位置。(习题51)
IQ=100十15Z’=100十15(X-)/SD是离差智商的计算公式。(习题52)
从不一样测验取得的离差智商只有当标准差相同或接近时才能够比较。(习题53)
两种智商及其计算公式
智 商
计算公式
比 率 智 商
IQ=(MA/CA)×100
离差智商(韦氏)
IQ=100十15(X-)/SD
第三单元 常模分数的表示措施…………………………………………………………………………………(368)
一、转换表法
最简单并且最基本的表示常模的措施就是转换表,有时也叫常模表。(习题54)
测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数做出故意义的解释。(习题55)
二、剖面图法
剖面图是将测验分数的转换关系用图形表示出来,从而能够很直观地看出被试者在各个分测验上的体现及其相正确位置。(习题56)
第三节 测验的信度………………………………………………………………………………………………(371)
第一单元 信度的概念……………………………………………………………………………………………(371)
一、信度的定义
信度是指在不一样时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得成果的一致程度。信度只受随机误差的影响。随机误差越大,信度越低。(习题57、58、59)
二、信度的指标
(一)信度系数与信度指数
信度是以信度系数为指标,是一个有关系数。(习题60)
信度指数的平方就是信度系数。
(二)测量标准误
SE=Sx公式中SE为测量的标准误,Sx是所得分数的标准差,rxx为测验的信度系数。从公式中能够看出,测量的标准误与信度之间的关系是:①信度越低,标准误越大;②信度越高,标准误越小。(习题158)
第二单元 信度评定的措施………………………………………………………………………………………(372)
估量信度的措施一般有:①重测信度;②复本信度;③内部一致性信度;④评分者信度。(习题159)
一、重测信度
使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的有关系数,叫重测信度,又称稳定性系数。(习题160)
用重测法估量信度,最适宜的时距随测验的目标、性质和被试者的特点而异,一般是2~4周较宜,间隔时间最佳不超出6个月。(习题62)
二、复本信度
复本信度又称等值性系数。它是以两个等值但题目不一样的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的有关系数。复本信度反应的是测验在内容上的等值性。(习题63)
假如复本信度考虑到两个复本实行的时间间隔,并且两个复本的施测相隔一段时间,则称:①重测复本信度;②稳定与等值系数。(习题161)
复本信度的缺陷有:①假如测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;②因为第二个测验只变化了题目标内容,已经掌握的解题标准能够很轻易地迁移到同类问题;③对于许多测验来说,建立复本是十分困难的。(习题162)
三、内部一致性信度
(一)分半信度
分半信度一般是在测验实行后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的有关系数。这个有关系数就代表了两半测验内容取样的一致程度。(习题64)
(二)同质性信度
同质性信度重要代表测验内部所有题目间的一致性。(习题65)
四、评分者信度
一般要求在成正确受过训练的评分者之间平均一致性达成0.90以上,才以为评分是客观的。(习题66)
第三单元 信度与测验分数的解释………………………………………………………………………………(373)
一、解释真实分数与实得分数的有关
rxx为信度系数。下列情况属于极端情况:①rxx=0;②rxx=1.00。(习题164)
二、确定信度能够接收的水平
确定能够接收的信度水平的一般标准是,当rxx<0.70时,测验不能用于对个人做出评价或预测,并且不能作团体比较。0.70≤rxx<0.85时,可用于团体比较;rxx≥0.85可用于个人和团体(习题67)
三、解释个人分数的意义
信度系数在解释个人分数的意义时的作用是:①估量真实分数的范围;②了解实得分数再测时也许的变化情形。(习题165)
“大约有 95%的也许性真分数落在所得分数±1.96SE的范围内,或有5%的也许性落在范围之外”的描述,其置信区间为X-1.96SE < XT ≤X+1.96SE。(习题68)
四、比较不一样测验分数的差异
甲被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和 0.88,那么甲被试的操作智商不明显高于言语智商。(习题69)
第四单元 影响信度的原因………………………………………………………………………………………(375)
一、样本特性
一般而言,若取得信度的取样团体较为异质的话,往往会高估测验的信度。(习题70)
对不一样水平的团体,题目具备不一样的难度,每个题目在难度上的微小差异累计起来会影响信度(习题71)
二、测验长度
一般来说,在一个测验中增加同质的题目,能够使信度提升。
下列描述中正确的是:①测验越长,测验的测题取样或内容取样就越有代表性;②测验越长,被试者受猜测原因的影响就越小;③测验太长,有时反而会引起被试者的疲劳和反感而减少可靠性。(习题166)
增加测验长度的效果应遵照酬劳递减率标准。
三、测验难度
对于不一样平均能力水平的团体,题目标难度会影响信度系数。
难度对信度的影响,只存在于某些测验中,如:智力测验、成就测验、能力倾向测验等;不存在难度的测验:人格测验、兴趣测验、态度量表等。(习题72)
四、时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大。(习题73)
[专栏5-3] 信度的特殊问题
因为信度与测验长度有关,分测验分数几乎能够肯定不如合成份数可靠。(习题75)
第四节 测验的效度………………………………………………………………………………………………(378)
第一单元 效度的概念……………………………………………………………………………………………(378)
一、效度的定义
在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。(习题76)
测验的效度除受随机误差影响外,还受系统误差的影响。可信的测验未必有效,有效的测验必然可信。(习题77)
二、效度的性质
效度具备两个性质:①相对性;②连续性。
效度具备相对性,因此,在评鉴测验的效度时,必须考虑测验的目标与功效。(习题167)0711—102
[专栏5-4] 信度和效度的关系
信度与效度的关系可表述为:①信度是效度的必要而非充足条件;②效度是受信度制约的。(习题168)
第二单元 效度评定的措施………………………………………………………………………………………(379)
美国心理学会在1974年发行的《教育与心理测量之标准》一书中将效度分为几个大类:即:①内容效度;②构想效度;③效标效度。(习题169)
一、内容效度
(一)什么是内容效度
内容效度指的是测验题目对有关内容或行为取样的合用性,即该测验是否是所欲测量的行为领域的代表性取样。(习题79)0911—35
(二)内容效度的评定措施
内容效度的评定措施有:①教授判断法;②统计分析法;③经验推测法。(习题170)0711—103
1.教授判断法
教授判断法,就是请有关教授对测验题目与原定内容的符合性做出判断,看测验的题目是否代表要求的内容。假如教授以为测验题目恰本地代表了所测内容,则测验具备内容效度。因此,内容效度有时又称逻辑效度。(习题80)
为了使内容效度确实定过程更为客观,填补不一样教授对同一测验的判断也许不一致,可采取的步骤是:①定义好测验内容的总体范围;②编制双向细目表;③制定评定量表来测量测验的整个效度。(习题171)
2.统计分析法
除了描述性语言外,内容效度确实定也可采取某些统计分析措施,如:①计算两个评分者一致性;②复本有关;③再测法。(习题172)
3.经验推测法
通过实践来检查效度
(三)内容效度的特性
在编制测验时,效度是重要的要考虑的特性。假如是编制最高行为测验,除了内容效度,也要求有较高的表面效度。相反,经典行为测验却要求较低的表面效度。(习题81)
二、构想效度
(一)什么是构想效度
构想效度是:①构思效度(结构效度);②重要包括的是心理学的理论概念问题;③指测验能够测量到理论上的构想或特质的程度;④测验的成果是否能证明或解释某一理论的假设、术语或构想,解释的程度怎样。(习题173)
(二)构想效度的估量措施
构想效度的估量措施包括:①对测验自身的分析;②测验间的相互比较;③效标效度的研究证明;④试验法和观测法证明。(习题174)0711—105
1.对测验自身的分析
能够作为构思效度证据的有:①测验的内容效度;②测验的内部一致性指标;③分析被试者对题目标反应特点。(习题175)
2.测验间的相互比较
能够作为构思效度的测验间比较的有:①相容效度;②辨别效度;③原因分析法。(习题176)
计算两种测验之间得分的有关,其中一个测验是待研究效度的,另一个是已经有效度证据的成熟的测验,但二者测量的是同一个心理特质,假如有关高,阐明新测验所测量的特质确实是老测验所反应的特质或行为。这种措施叫相容效度。(习题82)
3.效标效度的研究证明
4.试验法和观测法证明
三、效标效度
(一)什么是效标效度
又称实证效度。效标效度反应的是测验预测个体在某种情境下行为体现的有效性程度。它可分为:①同时效度;②预测效度。1011—104
在检查一个测验的效标效度时,难点在于找到适宜的效标。因此效标的选择至关重要,一个好的效标必须具备如下条件:①效标必须能最有效地反应测验的目标,即效标测量自身必须有效;②效标必须具备较高的信度,稳定可靠,不随时间等原因而变化;③效标能够客观地加以测量,可用数据或等级来表示;④效标测量的措施简单,省时省力,经济实用。(习题178)
(二)效标效度的评定措施0805—105
效标效度的重要评定措施有:①命中率法;②辨别法;③有关法。(习题179)
1.有关法
有关法是求测验分数与效标资料间的有关,这一有关系数称为效度系数。依照变量的不一样,可选用的计算措施有:①积差有关法;②点二列有关公式;③二列有关公式;④贾斯朋(Juspen)多系列有关公式。(习题180)
2.辨别法
辨别法是检查测验分数能否有效地辨别由效标所定义的团体的一个措施。(习题83)
3.命中率法
命中率法是当测验用来做取舍的依据时,用其正确决定的百分比作为效度指标的一个措施。命中的情况是指:①预测成功并且实际也成功;②预测失败且实际上也失败。(习题181)
第三单元 效度的功效……………………………………………………………………………………………(385)
一、预测误差
效度系数的实际意义常常以决定系数来表示,如测验的效度是 0.80,则测验的总方差中有64%的方差是测验分数的方差。假如某测验的效度是0.70,则在测验中无法作出正确预测的百分比是0.51。(习题84)
Sest=Sy中,rxy2代表效度系数的平方,即决定系数,Sy为效标成绩的标准差。(习题85)
二、预测效标分散
Y = a + bxyX式中Y是预测的效标分数(习题86)
三、预测效标指数
预测效率指数 E值的大小表白使用测验比盲目猜测能减少多少误差。如一个测验的效度系数为 0.80,E=40,这表白因为该测验的使用,使得我们在估量被试者的效标分数时减少了40%的误差。(习题87)
第四单元 影响效度的原因………………………………………………………………………………………(386)
一、测验自身的原因
要确保测验具备较高效度,测验自身的原因要做到:①测验材料必须对整个内容具备代表性;②测题设计时应尽也许防止轻易引起误差的题型(如是非题);③测题难度要适中,具备较高的辨别度;④测验长度要恰当,测题的排列应先易后难。(习题182)
二、测验实行中的干扰原因
测验实行中的干扰原因包括:①主试者的影响原因;②测验情境;③其他干扰原因;④被试者的影响原因。(习题183)0711—104
三、样本团体的性质
(一)样本团体的异质性
假如其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低。(习题88)
(二)干涉变量
样本团体的性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的特性。因为这些特性的影响,使得测验对于不一样的团体具备不一样的预测能力,故测量学上称这些特性为干涉变量。(习题89)
四、效标的性质
效标测量自身的可靠性即效标测量的信度。(习题90)
第五节 项目分析…………………………………………………………………………………………………(389)
一般来说,测验的项目分析包括定性分析和定量分析。(习题185)
项目标定性分析包括考虑项目标内容效度,题目编写的恰当性和有效性等。(习题186)
第一单元 项目标难度……………………………………………………………………………………………(389)
一、定义
难度是指项目标难易程度。用P代表。P值越大,难度越低。(习题91)
在能力测验中一般反应难度水平的指标,在非能力测验(如人格测验)中,类似的指标称通俗性。(习题92)
难度的指标一般以通过率表示 P=R/N×100%;
在200个学生中,答对某项目标人数为120人,则该项目标难度为0.6。(习题93)
通过人数越多(即P值越大),难度越低。
二、计算措施
(一)二分法记分的项目〔P=(PH+PL)/2〕
计算项目难度的公式如下:①P=R/N×100%;②P=(PH+PL)/2;③P=X/Xmax×100%。(习题187)
在370名被试者中,选为高分组和低分组的被试者各有100人,其中高分组有70人答对第1题,低分组有40人答对第1题,则第1题的难度为0.55。P=(0.7+0.4)/2=0.55(习题94)
(二)非二分记分的项目〔P=X/Xmax×100%〕
数学测验的第7题满分为15分,该题考生的平均得分为9.6分,则该题的难度为0.64。P=9.6/15=0.64(习题95)
三、难度水平确实定
(一)项目标难度
难度P值越接近于0或接近于1,越无法辨别被试者之间能力的差异。相反,P值越接近于0.50,区分力越高。
对选择题来说,P值一般应不小于概率水平;是非题的难度值0.75最为适宜;四选一的题目,难度值0.63最适宜。(习题96)
(二)测验的难度
假如受测者样本具备代表性,对于中等难度的测验,其测验总分应当接近常态分布(习题97)
应选择难度在0.50左右的试题比较适宜,各题难度应在0.50±0.20之间。
第二单元 项目标辨别度…………………………………………………………………………………………(391)
一、定义
项目辨别度也叫判别力,是指测验项目对被试者的心理特性的辨别能力。(习题98)
二、计算措施
(一)判别指数
判别指数的计算步骤为(2-1-3-4):(1)按测验总分高低排列答卷;(2)确定高分组与低分组,每一组取答卷总数的27%;(3)分别计算高分组与低分组在该项目上的通过率或得分率;(4)按下列公式估量出项目标判别指数:D=PH-PL。(习题99)
1965年,美国测验教授伊贝尔(L.Ebel)依照长期的经验提出用判别指数评价项目性能的标准,判别指数D为0.19如下,阐明该项目差,必须裁减;判别指数D为0.4以上,阐明该项目很好(习题100)
(二)有关法
计算辨别度最常用的措施是有关法,常用的有关法有:①点二列有关;②二列有关;③ф有关;(习题188)
辨别度取值范围介于-1与+1之间,(习题101)
假如项目得分与实际能力水平之间负有关,则辨别度为负值;
若呈正有关,辨别度为正值;有关系数越大,辨别度越高。(习题102)
三、辨别度与难度的关系
难度与辨别度的关系,一般来说,较难的项目对高水平的被试者辨别度高,中等难度的项目对中等水平的被试者辨别度高。(习题103)
项目难度的分布一般以常态分布为好,这么不但能确保多数项目具备较高的辨别度,并且能够确保整个测验对被试者具备较高的辨别能力。(习题104)
第六节 测验编制的一般程序……………………………………………………………………………………(394)
第一单元 测验的目标分析………………………………………………………………………………………(394)
一、测验的对象
在编制测验前首先要明确测量的对象,也就是该测验编成后要用于哪些团体。只有对受测者的如下几方面心中有数,编制测验时才能有的放矢:①年龄;②受教育程度;③社会经济水平;④阅读水平。(习题189)
二、测验的用途
测验用途不一样,编制测验时的取材范围以及试题难度等也不尽相同。在测验编制前就应明确所编出的测验是要对被试者做:①描述;②诊疗;③选拔;④预测。(习题190)
(一)显示性测验
显示性测验是指测验题目和所要测量的心理特性相同的测验。古德纳夫曾经将其分为样本测验和标识测验。(习题191)
(二)预测性测验
三、测验的目标
心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特性。
心理测验的目标分析以测验不一样而异,一般可分为:①工作分析;②对特定概念下定义;③确定测验的详细内容。(习题192)
对于选拔和预测功用的预测性测验,它的重要任务就是要对所预测的行为活动作详细分析,我们称之为任务分析或工作分析(job analysis)。这种分析包括如下步骤:①确定哪些心理特性和行为能够使要预测的活动达成成功;②建立衡量被试者是否成功的标准,这个标准我们称之为效标。(习题193)
第二单元 测题的编写……………………………………………………………………………………………(401)
一、搜集资料
心理测验题目标起源应当排除直接翻译国外测验的题目。题目起源分为三方面:①已出版的标准测验;②理论和教授的经验;③临床观测和统计。(习题108)
二、命题的一般标准
心理测验命题的一般标准能够从几方面来考虑:①内容;②文字;③了解;④社会敏感性。(习题194)
(一)内容方面
心理测验命题在内容方面的重要要求是:①内容符合测验的目标;②防止贪多而乱出题;③内容取样要有代表性;④题目间内容相互独立。(习题195)
(二)文字方面
心理测验命题在文字方面的重要要求是:①使用准确的当代语言;②语句简明扼要;③排除与答案无关的原因;④最佳是一句话阐明一个概念。(习题196)
(三)了解方面
心理测验命题在了解方面的重要要求是:①有确切的答案;②除创造力测验和人格测验外不应具备引起争议的也许;③内容不要超出受测团体的知识水平和了解能力;④格式要不被人误解。(习题197)
(四)社会敏感性方面
有些测验必须包括某些社会敏感性问题,菲力普(Phillips,D.L)列举了值得参考的几个方略:①命题时假定被试者具备某种行为;②命题时假定规范不一致;③指出该行为是常见的,虽然是违规的。(习题198)
三、测题的编制要领
(一)选择题
选择题要编好题干,也要编好选项,必须注意:①题干问题明确,防止与选项用词一致;②选项简明扼要,长度相等;③每题只给一个正确答案;④选项最佳用同一形式。(习题199)
(二)是非题
编制是非题应注意:①内容以故意义的概念、事实或基本标准为基础;②每道题只能包舍一个概念;③尽也许避兔否定的论述,尤其是双重否定;④“是”、“非”题的数目应基本相等,随机排列。(习题200)
(三)简答题
编制简答题的标准包括:①宜用问句形式;②填充形式的空格不宜太多;③每题应只有一个正确答案。
编制简答题的标准不包括将其操作化。(习题109)
(四)操作题
编制操作测验的标准有:①明确所要
展开阅读全文