资源描述
心理测量学
测量:
依据一定的法则用数字对事物加以确定。
测量的三个元素:
1.事物,就是测量的对象,心理测量的实际是心理现象的外显行为。
2.数字,代表某一事物的“量”,区分性,序列性,等级性,等距性,可加性。
3.法则,测量所依据的规则和方法。
测量的两个要素:
l 参照点:计量的起点。绝对零点,相对零点。心理测量没有绝对零点。
l 单位:好的单位的两个条件1.确定的意义,2.相同的价值
心理测量的单位不够完善,1是没有同一单位,2是不符合等距的要求。
测量量表:
l 命名量表;
l 顺序量表;
l 等距量表;
l 等比量表;
心理测验:
依据心理学原理,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数字化分析的一种科学手段。
l 测量的是人的行为;
l 测量的是有代表性的样本;
l 标准化;
l 原始分数没有意义,只有与其他人的分数,或者与常模相比才有意义。
心理测验的性质:
l 间接性;
l 客观性;
l 相对性;
心理测量标准化:
l 施测指导标准化;
l 评分记分原则和手续标准化;
l 分数转换和解释标准化;
心理测验的分类:
l 按照功能分:智力测验,人格测验,特殊能力测验;
l 按测验材料:文字测验,操作测验;
l 按严谨程度:客观测验,投射测验(罗夏测验,主题统觉,自由联想,句子完成);
l 按测验方式:团体测验,个别测验;
l 按测验要求:最高作为测验,典型行为测验;
错误的测验观:
l 测验万能论;
l 测验无用论;
l 心理测验即智力测验;
正确的测验观:
l 心理测验是心理学的研究方法之一,是决策的辅助工具;
l 心理测验作为研究方法和测量工具尚不完善;
心理咨询常用的心理测验:
l 智力测验;
l 人格测验;
l 心理评定量表;
中国古代的科举取士制度是世界上最早的心理测验的实践。
心理测验简史
l 首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿。提出人的气质特点。。。。是遗传的;设计了测量差异的方法,可是为心理测验的开端;为心理测验奠定了统计学的基础;第一个提出相关的概念;
l 1890年,卡特尔在《心理》杂志上发表“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中;实验与测量;统一的标准;
l 比内(A.Binet)与其助手西蒙(T.Simon) 研究制作了世界上第一个正式的心理测验。
20世纪心理测验的发展:
l 操作测验的发展;
l 团体智力测验的发展;
l 能力倾向测验的发展;
l 人格测验的发展;克雷丕林,最早将自由联想测验施测于精神病人;
近年来我国致力于心理测验的本土化;
测验的常模
常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。他用一个标准的、规范的分数表示出来,以提供比较的基础;
常模的选择:
l 确定一般总体;
l 确定目标总体;
l 确定样本;
常模团体的条件:
l 群体的构成必须明确;
l 常模团体必须是代表性样本
l 样本的大小要适当;(经济、实用、减少误差的原则),一般不少于30或100,全国:2000-3000;
l 就近性,定期更新;
取样方法:
l 简单随机取样;
l 系统抽样;(目标总体无序,也无等级结构)
l 分组抽样;
l 分层抽样;
常模分数:
施测常模样本被测后,将被试者的原始分数按照一定的规则转换出来的导出分数。
原始分数没有多少意义,导出分数有意义,具有参照点和单位,与原始分数等值,可以进行比较。
常模分数构成的分布,就是通常所说的常模。
常模分为:一般常模、特殊常模;
常模的类型
发展常模
(年龄量表)
发展顺序量表
---最早的是葛塞尔发展顺序量表,按月份显示儿童的运动水平、适应性、语言、社会性四方面的发展水平;4周控眼,16周头平衡,28周抓握,40周,坐爬,52周站立行走;
---皮亚杰的发展理论,最著名的是守恒概念:5岁质量守恒,6岁重量守恒;7岁容量守恒
智力年龄(智龄)
比内—西蒙量表最早使用智力年龄的概念;
年级当量
百分位常模
百分等级
在常模样本中低于这个分数的人数百分比
PR=100—(),R名次,N总人数,PR:百分等级
百分点
计算处于某一百分比例的人对应的测验分数是多少
四分位和十分位
标准分常模
将原始分数和平均数的距离以标准差为单位表示出来的量表。
:z分数,Z分数,T分数,标准九分数,离差智商(IQ)
线性转换
SD:标准差
Z=A+Bz ,AB是常数,A是为了去掉负数,B是为了去掉小数、
非线性转换
当原始分数不是常态化,可以通过非线性转换使之常态化。
原始分数---百分等级---常态分布上相应的离均值
T=50+10 z’
标准九分:5为平均数,2为标准差
标准十分:5为平均数,1.5为标准差
标准二十分:10为平均数,3为标准差
智商
比率智商
心理年龄(MA)与十足年龄(CA)之比。
,不适合年龄较大的被试
离差智商
离差智商建立在统计学的基础上,表示个体智力在年龄组中所处的位置,是表示智力高低的理想指标 。
最简单最基本的表示常模的方法是转换表,有时也叫常模表。
测验的信度
信度 是指同一被试者在不同时间内用同一测验(或另一套相等的测试)重复测量,所得结果的一致程度。
信度反应的是随机误差的影响。
实得分数X=T+E,T:真实分数,E:误差
实得分数方差(总方差):
信度:真分数方差与总方差的比率。
信度的指标:
l 信度系数和信度指数,信度系数是rxx,,,信度指数:
l 测量标准误:,Sx是所得分数的标准差,rxx是信度系数
信度越高,标准误越小,信度越大,标准误越大。
信度的评估方法:
l 重测信度,又叫稳定性系数
采用重测法,使用同一测验,在同样条件下,对同一组被试者前后施测两次测验,求两次得分间的相关系数。
测验时距2-4周,最好不超过6个月。
l 复本信度,又叫等值性系数
以两个等值(内容上等值)但是题目不相同的测验来测量同一群体,然后求的被试者在两个测验上得分的相关系数。
如果两个复本施测相隔一段时间,则称:重测复本信度 或 稳定与等值系数。
l 内部一致性信度
反映的是题目之间的关系,表示测验能够测量相同内容或者特质的程度。
n 分半信度,按照奇偶分成两半,分别计算两半的得分,求出两半分数的相关系数。在相同的条件下,测验越长,信度越高,分半法会低估信度,必须修正。
斯皮尔曼-布朗公式:,rhh是一半分数的相关系数。
n 同质性信度。主要代表测验内部所有题目间的一致性。
l 评分者信度
测量不同评分者之间的误差。要求达到0.9以上,才认为评分是客观的。
肯德尔和谐系数。
n rxx<0.7,测验不能做个人和团体评价;
n 0.7≤rxx<0.85,可用于团体;
n rxx≥0.85,可用于鉴别和预测个人成绩。
影响信度的因素:
l 样本特征
n 样本团体异质性的影响:异质:高估信度,同质:低估信度;
n 样本团体平均能力水平的影响:年幼和能力水平低者,信度值较低。
l 测验长度
增加同质题目,会提高信度。
,K:改变后的长度和原长度之比,rxx,原来信度,rkk:新的信度
n 测验越长,内容取样越有代表性;
n 测验越长,猜测因素影响越小;
n 报酬递减原则,过长得不偿失。
l 测验难度:太难或者太容易,信度要降低,难度50%信度最高,但是对于选择题存在猜测成分,难度应加大。
l 时间间隔;:时间越短,信度越大。时间越长,信度越低。
测验的效度
效度是指所测量的与所要测量的心理特点之间符合的程度。或者叫准确度。受随机误差和系统误差的影响。可信的测验未必有效,有效的测验必定可信,信度是效度的必要非充分条件。效度受信度制约。
真实方差:,前者是有关(有效)方差,后者是系统误差。
所以,,
效度系数:
效度的性质:
n 相对性;
n 连续性;
效度的评估方法:
n 内容效度;
n 构想效度;
n 效标效度;
内容效度
指的是测验题目对有关内容或行为取样的适用性。从而确定测验是否是所欲测量的行为领域的代表性取样。
内容效度的评估方法:
n 专家判断法;
n 统计分析法;
n 经验推测法;
内容效度的特性:
n 不是普遍适用的;
n 有时间上的特定性;
n 经常与表面效度混淆。表面效度是外行对测验做表面的检查确定的。最高行为测验要求有较高的表面效度。
构想效度
也叫构思效度,结构效度。
构思效度的估计方法:
1. 测验本身的分析
构思效度的证据:
l 测验的内容效度;
l 测验的内部一致性指标;
l 被试者对题目的反应特点;
2. 测验间的相互比较
l 相容效度
l 区分效度
l 因素分析法
3. 效标效度的证明;
4. 实验法和观察法;
效标效度 (实证效度)
反映的是测验预测个体在某种情境下行为表现的有效性程度,被预测的行为是检验效度的标准,简称 效标。
分为:同时效度 和 预测效度
好的效标的条件:
l 效标本身必须有效;
l 效标必须具有比较高的信度;
l 效标可以客观测量;
l 方法简单,省时省力,经济实用;
效标效度的评估方法:
l 相关法:积差相关法,点二列相关,二列相关,贾斯朋公式;
l 区分法:两组分布的交叉越多,说明差异越小,效度越差;
l 命中率法;当测验作为取舍的依据时,用其正确决定的比例作为效度指标额一种方法。
效标成绩
测验预测
失败
成功
成功
A:失误
B:命中
失败
C:命中
D:失误
总命中率:
正命中率:
效度的功能:
l 预测误差
l 预测效标分数;
l 预测效率指数;
影响效度的因素:
测验本身的因素
l 测验材料具有代表性;
l 测试题目避免容易引起误差的题型;
l 难度要适中,具有较高的区分度;
l 题目数量要恰当;
l 排列顺序先易后难;
测验实施中的干扰因素
l 主试因素的影响;
l 被试因素的影响;
样本团体的性质
l 异质性:越异质,效度越高;越同质,效度越低;
l 干涉变量;
效标的性质
l 效标与测验分数之间是否是线性关系是很重要的一个因素。皮尔逊积差相关系数的前提是假定线性关系。
l 效标测量本身的可靠性,即,效标测量的信度
项目分析
难度:
项目的难易程度。非能力测验中,类似的指标是“通俗性”.
难度的指标是通过率:
P:通过率(难度),N:全体被试人数,R:答对的人数
P越大,难度越低
计算方法:
l 二分法计分:
PH和PL分别是高分组和低分组的通过率
吉尔福特修正公式:
CP是校正后的通过率,P是实际通过率,K为备选答案的数目
l 非二分法
平均分除以满分
难度水平的确定:
l 项目的难度:
应选择难度在0.5左右的试题,在选择题中,最好试题的难度平均在0.5左右,每道题的难度在
当选拔或诊断时,应该比较多的选择难度值接近录取率的项目。
l 测验的难度
测验的难度,直接取决于组成测验的项目的难度。
偏态分布分为,正偏态分布(大多数得分低,难度大),负偏态分布(大多数得分高,难度小)
项目的区分度:
项目的区分度,也叫鉴别力,是指测试项目对被试的心理特性的区分能力。
鉴别指数:
分别是高分组和低分组在该项目上的通过率。
。。。。。。
第七节 心理测验的应用
(略)
展开阅读全文