资源描述
第三节第三节 测验的信度测验的信度第一单元 信度的概念一、信度的定义 P348v信度信度(reliability):是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。用于考察测验结果的稳定性和可靠性。v信度只受随机误差的影响。随机误差越大,信度越低。系统误差产生恒定效应,不影响信度。v每个测验的实得分数(X),总是由真实分数(T)和误差(E)两部分构成的,用公式表示如下:v根据经典测验理论,得到类似公式:其中,是测验实得分数的方差,是测验真实分数的方差,是测验随机误差的方差。2.测量标准误测量标准误v标准误,即真分数的变异,公式是:公式中,SE为测量的标准误,是所得分数的标准差,为测验的信度系数。v测量的标准误与信度之间有一种互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。第二单元 信度评估的方法信度评估的方法 P350v1.重测信度v2.复本信度v3.内部一致性信度v4.评分者信度一、重测信度v又称稳定性系数稳定性系数v优点v缺点v最适宜的时距二、复本信度v又称等值性系数等值性系数v复本信度反映的是测验在内容上的等值性v优点v局限性三、内部一致性信度v内部一致性信度系数主要反映的是题目之间的关系。v主要包括:1.分半信度;2.同质性信度。四、评分者信度 P351v一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上,才认为评分是客观的。v当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数(W)作为评分者信度的估计。第三单元 信度与测验分数的解释 (信度的用途)信度的用途 P352v一、解释真实分数与实得分数的相关v二、确定信度可以接受的水平v三、解释个人分数的意义v四、比较不同测验分数的差异第四单元 影响信度的因素一、样本特征 P354v1.样本团体异质性的影响 一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反在同质团体中则会低估测验的信度。v2.样本团体平均能力水平的影响 对年幼者和能力水平较低者,其信度相对较低。二、测验长度v一般来说,在一个测验中增加同质的题目,可以使信度提高。v1.测验越长,测验的测题取样或内容取样就越有代表性。2.测验越长,被试的猜测因素影响就越小。v在此需要注意的是,增加测验长度的效果应遵循报酬递减率原则,测验过长是得不偿失的,有时反而会引起被试的疲劳和反感而降低可靠性。v斯皮尔曼-布朗公式的导出公式三、测验难度v难度对信度的影响,只存在于某些测验中,如智力测验、成就测验、能力倾向测验等。v对于人格测验、兴趣测验、态度测验等不存在难度问题,因为这些测验的题目没有正确或错误答案之分。v就难度与信度间的关系而言,并没有简单的对应关系。从理论上说,只有平均难度水平为50%时,才能使测验分数分布范围最大,求得的信度也最高。四、时间间隔v时间间隔只对重测信度和不同时测量时的复本信度(重测复本信度)有影响,对其余的信度来说不存在时间间隔问题。第四节第四节 测验的效度测验的效度第一单元 效度的概念一、效度的定义 P357v效度效度(validity):是指所测量的与所要测量的心理特点之间符合的程度,或者简单的说是指一个心理测验的准确性。效度是科学测量工具最重要的必备条件,用来考察测验的准确性、有效性。v测量的效度除受随机误差影响外,还受系统误差的影响。二、效度的性质 P357v1.效度具有相对性效度具有相对性v2.效度具有连续性效度具有连续性第二单元 效度评估的方法效度的三大类 P359v1.内容效度v2.构想效度v3.效标效度一、内容效度 P359(一)什么是内容效度v内容效度内容效度:指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。又叫“逻辑效度”。(二)内容效度的评估方法v1.专家判断法 (最常用)v2.统计分析法v3.经验推测法(三)表面效度二、构想效度 P361(一)什么是构想效度v构想效度构想效度,又叫构思效度、结构效度、构念效度、建构效度。(二)构想效度的估计方法v1.对测验本身的分析v2.测验间的相互比较 1)相容效度 2)区分效度 3)因素分析法v3.效标效度的研究证明v4.实验法和观察法证实三、效标效度 P363(一)什么是效标效度v效标效度效标效度又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标效标。v在检验一个测验的效标效度时,难点在于找到合适的效标。因此,效标的选择至关重要。v一个好的效标必须具备以下条件:P363 (二)效标效度的评估方法v1.相关法(最常用)v2.区分法v3.命中率法第三单元 效度的功能效度的功能 P365v一、预测误差v二、预测效标分数v三、预测效率指数 第四单元 影响效度的因素 一、测验本身的因素一、测验本身的因素 P366 二、测验实施中的干扰因素二、测验实施中的干扰因素v 1.主试主试的影响因素 2.被试被试的影响因素 三、样本团体的性质三、样本团体的性质v 1.样本团体的异质性样本团体的异质性:如果其他条件相同,样本团体越异质,测验效度就越高;样本团体越同质,效度就越低。v 2.干涉变量干涉变量 四、效标的性质四、效标的性质第五节第五节 项目分析项目分析 P368第一单元 项目的难度一、难度的定义 P368v难度难度(difficulty):是指项目的难易程度。v难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。P值大小与难度高低程反比,所以也有人将其称作易度。v难度的取值范围,在0-1.00之间。二、难度的计算方法 P3681.二分法记分的项目二分法记分的项目v心理测验的项目大多为选择题,通过记1分,错误记0分,即二分法记分。v当被试人数较多时,可通过测验总成绩将被试分成三组:分数最高的27%被试为高分组,分数最低的27%为低分组,中间46%的被试为中间组。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。v难度校正公式2.非二分记分的项目非二分记分的项目v当测验项目为问答题或不能用二分法记分的形式时,一般用下面的公式计算难度。为全体被试者在该题上的平均分,为该题的满分。三、难度水平的确定 P369 1.项目的难度项目的难度v项目的难度多高合适,取决于测验的目的、性质以及项目的形式。v为了使测验具有更大的区别力,各题难度最好在0.500.20之间。2.测验的难度测验的难度v测验的难度直接依赖于组成测验的项目的难度。v大多数测验在设计时希望分数呈现常态分布的模型。如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分布。第二单元 项目的区分度一、区分度的定义 P370v项目区分度项目区分度(item discrimination):也叫鉴别力,是指测验项目对被试的心理特性的区分能力。v区分度取值范围,介于-1至+1之间。二、区分度的计算方法 P371v1.鉴别指数鉴别指数v2.相关法相关法
展开阅读全文