资源描述
心理测量学知识
第一节 概述
第一单元 测量与测量量表
一、什么是测量:
1、测量概念:测量是依据一定的法则用数字对事物加以确定。
2、测量三要素:
1)事物:指我们要测量的对象(就是心理能力和人格特点)。
2)数字:是代表某一事物或事物的某一属性的量。
这些数值具有自然娄的特点:区分性;序列性(等级性);等距性;可加性
3)法则:代表的是测量所依据的规则和方法
法则有好坏之分。
二、测量要素:
1、参照点(零点):指计算的起点:
1)绝对零点:意义为“无”
2)相对零点:指人定的参照点 理想的参照点是绝对零点;
很难找到绝对零点,多采用人为标定相对零点。
2、单位:是测量的基本要求。好的单位的条件:1)有确定的意义;2)有相同的价值。
心理测量的单位不够完善,既无统一的单位,也不符合等距的要求。
三、测量量表:
1、量表:是一种尺度,是测量的工具,是测验的表现形式;
心理测验是心理测量的一个部分。
2、测量的本质:1)是根据某地法则将事物数量化;2)定有单位和参照点的连续体称为量表;
3、量表的种类:
1)命名量表:是最低水平的一种量表形式。
(1)概念:只是用数字来代表事物或把事物归类。
(2)分类:代号——用数字来代表个别事物(如学生编号)
类别——用数字代表某一具有某种属性的事物的全体
(3)数字只能用作标记和分类,不能作数量化分析。
2)顺序量表:比命名量表水平高。在心理测量中最常用。
(1)概念:数字不仅指明类别,同时指明类别的大小或含某种属性的程度。
(2)特点:无相等单位、无绝对零点、数字仅表示等级,并不表示某种属性的真正量或绝对值。
3)等距量表:比顺序量表高级。
(1)特点:
A、不但有大小关系,还有相等的单位和相对零点,但只能做
加、减运算(不能乘除)
B、其数值加或减一个数值或用一个常数乘或除,不会破坏原来
数据之间的关系
(2)常用于感觉测量
4)等比量表:为最高水平的量表。 特点:有相等单位和绝对零点;可做加、减、乘、除
第二单元 心理测验的基本概念
一、心理测验的定义:
1、定义:心理测验,就是依据心理学理论,使用一定的操作程序,通过观 察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。
2、特点:
1)心理测验测量的是人的行为;即一个人对测给题目的反应;
2)心理测验在测量个别差异的时候,往往对是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。不免有某种程度的偏差;(样本——是指有代表性的样本)。
3)测验的条件对所有的被试者都必须是相同的(测验的标准化);
4)个人在测验中所得的原始分数,只有下其他人的分数或常模比较才有意义;(常模——指一般人即正常人的平均水平);
二、心理测验的性质:
1、间接性——即通过对测验项目的反应来推论他的心理特质。
2、相对性——每个人的测得结果都是与所在的团体或大多数人的行为或某种人为确定的标准相比较而言的。
3、客观性——即测验的标准化问题,包括:
1)测验用的项目或作业、施测说明、施测者的言语态度及施测时的物 理环境等,均经标准化,测验的刺激是客观的;
2)评记分的原则和手段经过了标准化,对反应的量化是客观的;
3)分数转换和解释经过了标准化,对结果的推论是客观的。
第三单元 心理测验的分类
一、按测验的功能分类:
1、智力测验——Binet-Simon智力测验
Stanford-Binet智力量表
Wechsler儿童和成人智力量表
2、特殊能力测验
3、人格测验——问卷法:MMPI、16PF、EPQ 投射法:罗夏测验、主题统觉测验(TAT)
二、按材料的性质分类:
1、文字测验——MMPI、EPQ、16PF、Wechsler儿童和成人智力量表中的文字 部分
1)优点——方便 2)缺点——容易受被试者文化程度的影响3)应用——团体测验较多用
2、操作测验(非文字测验):图片类操作——罗夏测验、TAT、Raven测验、Wechsler儿童和成人智力量表中的操作量表
1)优点——不受文化因素的影响 2)缺点——不适宜团体实施,费时
3、有时二类测验常常结合作用,如: Binet-Simon智力量表原主要是文字测验,修订后则增加了操作测验成分; Wechsler的三套智力量表(幼儿、儿童、成人)每套均有文字和操作二类测验。
三、按测验材料的严重程度分类:
1、客观测验——绝大多数的心理测验都属些类测验
2、投射测验:
1)特点:刺激没有明确意义,问题模糊;对被试的反应没有明确规定;
2)常用测验:罗夏测验、主题统觉测验(TAT)、 自由联想测验、句子完成测验。
四、按测验的方式分类:
1、个别测验:如:Binet-Simon智力量表、Wechsler智力量表个别测验材料不能以团体的方式进行。
2、团体测验——最早使用,著名的有陆军甲种和乙种测验;团体测验材料也可作个别实施如MMPI、EPQ、16PF等。
五、按测验的要求分类:
1、最高作为测验:要求被试者尽可能做出最好和回答,主要与认知过程 有关,有正确答案。如:智力测验、成就测验。
2、典型行为测验:要求被试者按通常习惯方式做出反应,没有正确答案。如:各种人格测验。
第四单元 纠正错误的测验观
一、错误的测验观:
1、测验万能论 2、测验无用论 3、心理测验即智力测验
二、正确的测验观:
1、心理测验是重要的心理学方法之一,是决策的辅助工具。
2、心理测验作为研究方法和测量工具尚不完善。
3、心理测验的最大问题是基础理论不够坚实。
第五单元 心理测验在心理咨询中的应用
一、智力测验
——吴天敏修订的中国内比量表
龚耀先等人修订的韦氏成人智力量表(WAIS-RC)
韦氏儿童智力量表(C-WISC)和韦氏幼儿智力理表(C-WYCSI)
林传鼎等人修订的韦氏儿童智力量表(WISC-CR)
张厚粲主持的瑞文标准型测验(SPM)
李丹等修订的联合型瑞文测验(CRT)
二、人格测验——艾森克人格问卷(EPQ)
卡特尔16人格因素问卷(16PF)
明尼苏达多项人格调查表(MMPI)——为临床诊断量表
三、心理评定量表——精神评定量表
躁狂状态评定量表
抑郁量表
焦虑量表
恐怖量表
心理测验是分析求助者心理问题的工具,它不但可以检验咨询人员的判断是否正确,还能帮助其对求助者的问题进行深入的分析。在咨询和心理治疗过程中并不是必不可少的一个环节。一般来讲,心理测验应在咨询关系尚未建立之前实施,也可在咨询无法进行下去时实施。
第六单元 心理测验的发展史
一、科学心理测验的产生与发展:
1、心理测量及统计学的奠基人——高尔顿:测量智力的个体差异; 为心理测验奠定了统计学基础;第一个提出了相关的概念
2、皮尔逊——创立积差相关法 智力年龄(用年龄作智力的准则)
3、卡特尔——主张测验手续和考试方法就有统一规定要有常模比较
4、比内、西蒙——最早提出智力测验——智力量表(1905年)
19世纪80年代是高尔顿的十年;
90年代是卡特尔的十年;
20世纪头十年是比内的智力测验的十年
5、此后心理测验的主要发展:
1)操作测验的发展 2)团体智力测验的发展 3)能力倾向测验的发展
4)人格测验的发展——先驱:克雷丕林——自由联想测验 罗夏测验——投射测验的发端
二、现代心理测验在我国的发展:
我国近代心理测验大约源于1914年前后。二十世纪二、三十年代,我国心理学家曾二次修订过比内-西蒙量表。
第二节 测验的常模
第一单元 常模团体
一、常模团体的性质
1、常模团体:是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
2、常模团体在某方面的心理特质:常模是用一个标准的、规范的分数表示出来,以提供对个体作比较或评价的基础。
3、任何一个测验都有多个可能的常模团体。如智力测验分儿童智力测验和成人智力测验。
4、对测验编制者来说,常模的选择主要基于对所要施测的总体的认识。团体常模团体必须能够代表所要研究或施测的总体,具体工作包括:确定一般总体、确定目标总体、确定样本
5、对测验的使用者来说,要考试的问题是,现有的哪个常模团体最适合。标准化测验通常提供许多原始分数与各种常模的比较转换表。有时能够适用的常模团体不止一个。
6、常模团体的成员。
二、常模团体的条件
1、群体的构成必须明确界定;定义常模团体的标准(变量)有:性别、年龄、职业、教育水平、社会经济地位、种族等。
2、常模团体必须是所测群体的代表性样本;
3、样本大小要恰当:取样误差与样本的大小成反比; 样本大小一般30—100,全国性2000—3000,最好为题量的5倍;样本大小适当的关键是样本要有代表性。
4、标准化样组是一定时空的产物
三、取样的方法
1、取样:是指从总体(目标人群)中选择有代表性的样本。
2、分类:1)随机取样2)非随机取样
3、具体取样方法:
1)简单随机取样:
概念:总体中每个个体均有独立的等概率被被抽取的可能。常用方法:抽签法和随机数字法(如从50 随机选取10人)。
2)系统取样:
概念:假设总体数目为N,选择1/K的被试作为样本,则样本的大小(n)为:n = N×1/K(K = N/ n)给被试编号,按组距K分段,每段取1人注意事项:要求目标总体无序可循,也无等级结构存在例如:从40人中抽取5人,从第3号开始抽取,为3、11、19、27、35
3)分组取样:如:按个方面条件基本相同的学校取样适用于:总体数目大,而且群体有多样性,将群体分组,在组内随机取样。注意事项:要求尽可能减小组间差异,尽量加大组内差异
4)分层取样:
方法:将目标群体按某种变量(如年龄)分成若干层次,再从各层次中随机抽取若干被试。
特点:使各层次差异显著。同层次保持一致,增加了样本的代表性
注意事项:要求尽可能加大层次间的差异,尽量减小层次内的差异
分类: (1)分层比例取样: (2)分层非比例取样:各层次的差异很大时采用
四、常模分数与常模
1、常模分数:就是施测常模样本后,将被试者的原始分数按一定规则转换出来的导出分数。
原始分数:是指被试者的反应与标准答案相比较而获得的测验分数。
导出分数:原始分数本身没有多大意义,必须有一个参照标准才行,在心理测验中,这种标准是由原始分数构成的分布转换而来的分数,叫导出分数。导出分数具有一定的对照点和单位,它实际上是一个有意义 的测验量表,它与原始分数等值,可以进行比较。
2、常模:就是常模分数构成的分布,它是解释心理测验分数的基础。一般常模:常为测验指导书上列出的常模。特殊常模:为非典型群体建立的,如某个单位。特殊常模的建立方法:根据样本的原始分数制作次数分布图,再计算出导出分数,最后制成转换表。
第二单元 常模的类型
一、发展常模(年龄量表):
就是根据不同年龄上各种发展水平的人的平均表现(如智力、技能、感觉运动等方面的发展水平)所制定的量表。
1、发展顺序量表:与发育正常的儿童相比,按年龄评定一个儿童的心理发展水平。
1)葛尔塞发展程序量表:按月份显示发育正常儿童在运动水平、适应性、语言、社会性四个方面的发展水平,以此作为标准,评定个体的发展水平。强调儿童早期行为的发展是有规律的。
2)皮亚杰的发展理论——对守恒概念的研究:5岁时才会理解质量守恒; 6岁才会掌握重量守恒; 7岁时才有容量守恒概念。守恒:是指二种等量的物体,只要无增无减,无论怎么组合,它们在质量、重量、长度、数量及容量等方面仍然是相等的。
2、智力年龄(个体的智力所达到的年龄水平——智龄)
1)比内-西蒙智力量表——首先使用智力年龄的概念;智龄是年龄量表上度量智力的单位。编制出可区分各年龄儿童的智力水平的测l题,这些测题的难度随年龄而逐渐加大,
2)为每个年龄水平都编制一些适当的题目,其中的每个测题是该年龄组l大部分儿童都能完成的。以智力年龄(智龄)作为度量智力的单位。智力年龄是指一个儿童在年龄量表上所得的分数。
3)智力年龄的计算方法:
范例:吴天敏修订的比内-西蒙智力量表:每个年龄组各有6个测题,每答对一题增加智龄2个月先确定基础年龄(智力量表中全部被通过的那一组测题所l代表的年龄)。
例如:六岁组的测题全部答对,更高年龄组的测题只有部分答对,或都未通过,则基础年龄为六岁,再求答对的更高年龄组上的测题数量,每答对一题增加智龄2个月。智力年龄=基础年龄+更高年龄组上通过的测题数量所代表的智龄增长的月数l
3、测定智力年龄的另一种方法——测题不分年龄组以标准化样本中每个年龄组的平均分数作为年龄常模l将个人的原始分数与年龄常摸作比较,计算其智力年龄l
4、年级当量——实际上就是年级量表。将一个学生和同年级学生相比。年级量表的单位通常为10个月间隔(故10个月为一个学年)。
二、百分位常模
1、百分等级:
1)是应用最广的表示测验分数的方法;
2)一个测验分数的百分等级是指在常模样本中低于该分数的人数百分比;即百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低;
3)分类:
(1)未分组资料的百分位数:计算:PR = 100 -(100R-50)/N R是原始分数排列顺序,N是指总人数(样本的总人数)
(2)分组资料的百分等级:
2、百分点(百分位数):是计算处于某一百分比例的人对应的测验分数是多少;是分数量表上相对于某一百分等级的分数点,又称百分位数(PP)可根据直线内插法计算(举例:高考成绩):l(100-百分等级)/(最高分-PP)=(百分等级-1/PP-最低分)原始分数和百分等级可互相转换,由此编制的原始分数与百分等级的对照表,称为百分位常模。
3、四分位数和十分位数
1)四分位数:将分数量表分成四等份,相当于百分等级的25%、50%和75%三个百分点分成的四段;
2)十分位数:将分数量表分为十段:10%、20%等
三、标准分数(标准分数):
1、是将原始分数与平均数的距离以标准差为单位表示出来的量表;
2、其基本单位是标准差;
3、常用的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。
4、分类:
1)线性转换的标准分数:
(1)适用于正态(常态)分布的数据资料;
(2)z分数为最典型的线性转换的标准分数;
(3)z分数:z =(X-M)/SD X为任一原始分数,M为样本平均数,SD为样本标准差。
z分数可以用来表示某一分数与平均数之差是标准差的几倍。
(4)转换后的Z分数:Z=A+Bz Z为转换后的标准分数,A、B为根据需要指定的常数;加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小而去掉小数点;加或乘一个常数并不改变原来分数间的关系。
2)非线性转换的标准分数:
(1)原始分数不是常态分布——使之常态化(常态化过程是非线性的);
(2)常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均差,并可以表示为任何平均数和标准差。
(3)计算步骤:
A、对每个分数值计算累积百分数
B、在常态曲线面积中,求出对应的该百分比的z分数所得的z分数可将分布分成几部分,称之为z'分数,以区别由线性转换所求得的z分数。与线性导出分数一样,常态化标准分数也可以被转化为任何方便的形式,并可用以下表示:
C、T分数——以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数理10),即: T= 50 +10 z' (平均数为50,标准差为10)
D、标准九分:其量表是个9级分数量表(平均数为5,标准差为2)
E、标准十分——平均数为5,标准差为1.5;标准二十分——平均数为10,标准差为3。(使用最广、影响最大的一种常态化标准分数是离差智商)
四、离差智商及其含义:
在最早的比内—西蒙智力测验中没有智商的概念,只用“心理年龄”(MA)来表示被试智力的高低。目前一般都用比率智商和离差智商来表示智力的高低。
1、比率智商(IQ):为心理年龄(MA)与实足年龄(CA)之比。为避免小数,将商数乘以100。计算公式IQ = MA/CA×100如果一个儿童的心理年龄等于实足年龄,他的智商就 为100。IQ等于100代表正常的或平常的智力。比率智商并不适合于年龄较大的被试。
2、离差智商:是一种以年龄组为样本计算而得的标准分数;韦克斯勒将离差智商的平均数定为100,标准差为15;离差智商表示的是个体智力在年龄组中所处的位置;是表示智力高低的一种理想指标。
计算公式:IQ=100+15z'=100+15(X-M)/SD X表示被试的量表分数,M表示被试所在年龄水平的平均量表分数, SD表示这一年龄水平被试的量表分数的标准差。将原始分与IQ值的对应关系计算出来作为常模表(P344表)。
韦克斯纳:平均数定为100,标准差为15
斯-比测验:平均数为100,标准差为16
第三单元 常模分数的表达方法
一、转换表法(常模表)——是最简单而且最基本的表示常模的方法。
1、一个转换表显示出一个特定的标准化样组的原始分数与其对应的等值分数——百分位、标准分数、T分数或其他任何分数。利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。
2、简单的转换表就是将单项测验的原始分数转换成一种或几种导出分数(P346表5—2)。复杂的转换表通常包括几个分测验或几种常模团体的原始分数与导出分数的对应关系(P347表达—3)
二、剖面图——是将测验分数的转换关系用图形表示出来。可以很直观地看出被试在各分测验上的表现及其相对位置(P346 表5—1)。
标准差代表一组数据的离散程度,如一个班内学生数学成绩的离散程度从理论上说,心理测量数据一般服从为正态分布,或接近正态分布正态分布曲线的形状取决于标准差,但曲线下的面积始终为1个单位在心理测量中,个体在团体中的相对位置,以Z分数的大小表示,而Z分数是标准差作为单位,既以包含几个标准差表示个体分数与总体平均分数的距离,而不是用两者的绝对分数之差表示表示个体在团体中的相对位置根据Z分数可确定低于或某或高于某个分数的人数比例,也可以对不同的测量结果进行比较心理统计基本知识
第三节 测验的信度
第一单元 信度的概念
一、信度的定义:
1、信度:是指同一被试者在不同时间内用同一测验(或一个同等形式的测 验)重复测量,所得结果的一致程度。
2、信度是评价一个测验是否合格的重要指标之一;也是标准化心理测验的基本要求之一。
3、信度只受随机误差的影响。随机误差越大,信度越低。
4、实得分数(X)总是由真实分数(T)和误差(E)二部分构成的:X=T+E
5、如果我们讨论一组测验分数的特性时,可用方差代表具体分数;公式如下:S平方x=S平方T+S平方E S平方x是测验实得分数的方差; S平方T是测验真分数的方差; S平方E是测验误差的方差。在测量理论中,信度被定义为:一组测量分数的真分数方差现总方差(实得分数的方差)的比率。即:rxx=S平方T/S平方x此公式还可以转化为:rxx=S平方x-S平方E/S平方x=S平方E/S平方x因此,信度也可以看作在总的方差中非测量误差的方差所占的比例。
二、信度的指标
1、信度系数与信度指标:
1)大部分情况下,信度是以信度系数为指标的,它是一种相关系数。是同一被试样本所得的两组资料的相关,理论上说就是真分数方差与实得分数的方差的比值;
公式是:rxx=r平方XT=S平方T/S平方X
2)公式中的r平方TX是真分数标准差与实得分数的标准差的比值,称信度指数;
3)信度指数的平方就是信度系数。
2、测量标准误:
1)信度系数仅表示一组测量的实得分数与真分数的符合程度,但并没有直接指出个人测验分数的变异量。由于存在误差,一个人所得分数有时比真分数高,有时比真分数低,有时二者相等。
2)如用一组被试二次测验结果来代替对同一人的反复测试,于是就有了信度的另一个指标——测量的标准误。公式是:SE=S根号1- r 公式中SE为测量的标准误,Sx是所得分数的标准差,rxx为测验的信度系数。信度越高,标准误越小;信度越低,标准误越大。
第二单元 信度的评估方法
一、重测信度(稳定性系数):
1、方法:采用重测法。即使用同一测验,在同样条件下以同一组被试者前后施测二次测验,求二次得分间的相关系数。
2、优点:能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据。
3、缺点:是易受练习和记忆的影响。
4、二次测验的最适宜时距一般是二周到四周较宜。
二、复本信度(等值性系数)
1、方法:以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在二个测验上得分的相关系数,反映的是测验在内容上的等值性。在应用上,应该有关数的被试先做A本再做B本,另一半被试先做B本再做A本。
2、要考虑两个复本实施测试的时间,若相隔一段时间,称稳定与等值系数
3、优点:能免避免重测信度的一些问题;
4、缺点:
1)测量行为易受练习的影响,复本信度只能减少而不能完全消除这种影响;
2)由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。
三、内部一致性信度
——内部一致性系数主要反映是的题目之间的关系,表示测验能够测量相同内容或特质的程度。包括:
1、分半信度:
1)概念:指采用半分法估计所得的信度系数。
2)方法:只需一种测验形式,实施一次测验。按奇、偶题分为等值的两部分,分别计算在二半测验上的分数,求出二半分数的相关系数。这个相关系数就代表了二半测验内容取样的一致程度,因而属于内部一致性信度系数。
3)采用积差相关方法计算信度系数。在其他条件相同的情况下,测验越长,信度越高。半分法经常会低侉信度必须修正。修正公式:斯皮尔曼-布郎公式。公式下下:rxx=2rhh/1+rhh式中rhh为一半分数的相关系数,rxx为测验在原长度时的信度会计值。
2、同质信度:同质性主要代表测验内容所有题目间的一致性。
同质:指各测题的得分有实高的正相关,不论题目的内容和形式如何;异质:指各测验的得分相关很低或为负相关,即使所有题目看起来好象测量同一特质。
计算公式:库德-理查逊公式:最常用的是K—R20公式(测量同质性信度)克伦巴赫系数α系数
四、评分者信度:
少用。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。 多人评定信度的估计,可采用肯德尔和谐系数(W)。
第三单元 信度与测验分数的解释
一、解释真实分数与实得分数的相关:
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
二、确定信度可接受的水平:
一般原则是:
1)当r<0.70时,测验不能用于对个人做出评价或预测,且不能作团体比较;
2)当0.70≤r <0.85时,可用于团体比较;
3)当r≥o,85时,才能用来鉴别或预测个人成绩或作为。
三、解释个人分数的意义;一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。
真分数的置信区间,一般采用95%的或然水平,其置信区间为:
X-1.96SE<X ≤X+1.96SE
也就是说,大约有95%的可能性真分数落在分数±1.96SE的范围内,或有5%的可能性落在范围之外。实际上也表明了再测时分数改变的可能范围。
四、比较不同测验分数的差异:
包括二个人不同分数的差别和同一被试在二个测验上的差别,这就是差异分数的标准误问题,其公式为:SEd=根号2-rxx-ryy
式中SEd为差异的标准误,S代表二个测验使用的标准差。要求两测验的标准差相同;
在统计上,经常要求二个分数在差异程度达到0.05显著性水平,才能承认不是误差的影响。
第四单元 影响信度的两个重要因素
一、样本特征:
1、样本团体异质性的影响:一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。
2、样本团体平均能力水平的影响
二、测验长度:
1、在一个测验中增加同质的题目,可以使信度提高;
2、测验越长,测验的测题取样或内容取样就越有代表性;
3、测验越长,被试的猜测因素影响越小;
4、测验的长度——最少应增加的题数:斯皮尔曼-布郎公式
三、测验难度——理想平均难度为:五择一题,0.70;
四择一题,0.74;
三择一题,0.77;
是非题,0.85。
四、时间间隔——对重测信度和不同时测量的复本信度有影响;二次测验间隔时间越短,其信度系数越大;间隔时间越久,信度系数便载低。
第四节 测验的效度
第一单元 效度的概念
一、效度的定义:
效度是指一个测验实际测量的与所要测量的心理特点之间符合的程度,也就是指一个心理测验的准确性。
测量的效度除受随机误差的影响外,还受系统误差的影响。可信的测验未必有效,而有效的测验必定可信。信度是效度的必要条件。
二、效度的性质:
1、效度具有相对性 2、效度具有连续性
第二单元 效度的估计方法
一、内容效度:
1、定义:内容效度是指测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
2、编制要求:
1)要对所测量的心理特征有个明确的概念,并划定出哪些行为与这种心理特性有关,以较密切;
2)测验题目应是界定的内容范围的代表性取样。
3、评估方法:
1)专家判断法:步骤:(1)定义好测验内容的总体范围;(2)编制双向细目表;(3)制定评定量表。
2)统计分析法:步骤:(1)计算两个评分者之间评定的一致性;(2)同一组被试在两个复本上得分的相关;(3)再测法-求相关。
3)经验推测法:调查、观察等。
4、内容效度的特性: 1)不是普遍适用的 2)常与表面效度混淆
二、构想效度(构思效度、结构效度)
1、定义:测验能够测量到理论上的构想或特质的程度。
即:测验的结果是否能证实或解释某一理论的假设,术语或构想,解释的程度如何。
2、构想效度的估计方法:
1)对测验本身的分析:通过研究测验内部结构来界定理论构思,从而为构思效度提供证据。
(1)测验的内容效度分析;(2)测验的同质性指标;(3)被试对测题的反应特点。
2)测验间的相互比较:(1)相容效度(与成熟的测验比较);(2)区分效度(与不同构思的测验比较);(3)因素分析法。
3)效标效度的研究证明:一个测验若效标效度理想,那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标。
(1)采用效度理想的效标;(2)心理特质的发展变化基本规律。
4)实验法和观察法证实
三、效标效度(实证效度)
1、概念:效标效度是预测个体在某种情景下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标。
2、分类:
1)同时效标:即测验所得的分数可与效标同时验证,通常与心理特征的评估及诊断有关。
2)预测效度:其效标资料需要一段时间才可搜集到,通常用于选拨、分组。
3)一个好的将近标必须具备的条件:
(1)必须最有效在反映测验的目标; (2)必须具有较高的信度,稳定可靠;
(3)可以客观地加以测量,可用数据或等级来表示; (4)测量方法简单、经济实用。
3、评估方法:
1)相关法:最常用。求测验分数与效标资料之间的相关——称效度系数效度系数的计算方法:积差相关法点二列相关公式二列相关公式
2)区分法:是检验测验分数能否有效地区分由效标所定义的团体(t检验)的一种方法。组间平均数差异在统计表的显著决策 取决于团体大小。当团体实大时,平均数间的小差异在统计上也变得有意义,但测验区分这些团体的实际价值很小。为了避免这一点,应该分析高分组(前27%)与低分组(后27%)分布的重叠量。重叠量越大,说明二组分数差异越小,即测验的效度越差。
3)命中率法:是当测验用来做取舍的依据时,用春正确决定的比例作为效度指标的一种方法。方法:(1)确定一个临界值:高于临界值者预测其成功;低于临界值者预测其失败。(2)预测是否成功:正确的预测——命中;不成功的预测——失误。
第三单元 效度的功能
一、预测误差
1、效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。
2、另一种表达方法是估计的标准误(Sest),它是指所有某一测验分数的被试其效度分数(Y)分布的标准差,也即预测误差大小的估计值,是真正分数估计的误差大小。计算公式:Sest = Sy根号1–r平方xy式中:r平方xy代表系数的平方,即决定系数;Sy为效标成绩的标准差。估计的标准误可如同其他标准误一样解释。真正效标分数落在预测分数±1Sest的范围内,有68%的可能性;落在预测效标±1.96%Sest的范围内,有95%的可能性;落在预测效标分数±2.58Sest的范围内,有99%的可能性。
二、预测效标分数:建立回归方程,从测验分数预测效标分数
三、预测效率指数:E=100(1- K), K=根号1-r平方xy=Sest/ Sy ,根号1–r平方xy为无关系数
四、信度和效度的关系——信度是效度的必要条件而不是充分条件效度受信度的制约一个好的效标必须具备的条件:能有效地反映测验目标具有高的信度可以客观测量测量方法要简单
第四单元 影响效度的因素
一、测验本身的因素:
1、测验取材必须对对整个内容具有的代表性 2、测题设计时应尽量避免容易引起误差的题型(如是非题) 3、测题难度要适中,具有较高的区分度 4、测验长度要恰当,即要有一定的测题量 5、测题的排列按先易后难顺序编排
二、测验实施中的干扰因素: 1、主试的影响因素 2、被试的影响因素
三、样本团体的性质: 1、样本团体的异质性:一般来说,样本团体越异质,分数分布范围越大,测验效度就越高。 2、干涉变量
四、效标的性质:
1、效标效度是以测验分数与效标测量的相关系数来表示的; 2、效标本身测量的可靠性
3、效标与测验分数之间的关系是否线性关系
第五节 项目分析
第一单 元项目的难度
一、定义:
项目难度指项目(题目)的难易程度。常以通过率表示:P=R/N×100% P代表项目的难度,N为全体被试者人数,R为答对或通过该题目的人数。
二、计算方法
1、二分法计分的项目:
1)项目为选择题,通过记1分,错误记0分,直接用:P =(R/N)100%
2)被试人数较多时,则可根据测验总成绩将被试分成三组:
高分组——27%,低分组——27%,中间组——46%
用公式:P=(PH+PL)/2
P表示难度,PH为高分组,PL为低分组
难度校正公式:CP=(KP-1)/(K-1)
CP为校正后通
展开阅读全文