1、心理测量学要点 Hannibal心理测量学测量与测量量表一。测量:依据一定法则用数字对事物加以确定。 三元素:事物(测量对象属性特征) 数字(某一属性的量,特征:区分性+序列性或等级性+等距性+可加性) 法则二。测量要素: 1.参照点:计算的起点-相对零点 2.单位:测量的基本要求,条件:有确定意义+有相同价值三。测量量表:斯蒂文斯 按量表精确程度从低到高分成4水平1。命名量表:只用数字代表事物,把事物归类(代号+类别) 数字只作标记和分类 不能作数量化分析2。顺序量表:指明类别,类别大小或某种属性程度 无相等单位,无绝对零点,仅表示等级不表示属性真正量,绝对值3.等距量表:不但有大小关系,还
2、有相等单位,数值可作加减运算,但无绝对零点,不能作乘除运算4。等比量表: 有相等单位,有绝对零点,可作加减乘除运算 心理测量一般在顺序量表上进行心理测量:依据心理学理论,使用一定操作程序,观察少数人有代表性的行为,对贯穿人全部行为活动中的心理特点作出推论和量化分析的一种手段特点:1。间接性:无法直接测量,测量外显行推论心理特质(描述一组内部相关,联系行为时使用的术语,对刺激作反应的一种内在倾向) 2。相对性:对人行为比较时,没有绝对标准 3.客观性:标准化(项目,计分原则和手续,分数转换和解释)按功能分:1。智力测验 2。特殊能力测验 3人格测验:问卷法(MMPI 16PF EPQ)+投射法(
3、罗夏测验,主题统觉TAT)材料性质:1。文字测验 2.操作测验材料严谨程度:1。客观测验(直接理解,无须猜测遐想) 2.投射测验(问题模糊,须用想象力,投射被试者思想情感,经验)测验方式: 1.个别测验 2。团体测验测验要求: 1。最高作为测验(作出最好回答,有正确答案) 2。典型行为测验(按习惯方式反应,无正确答案)错误测验观: 测验万能论 测验无用论 心理测验即智力测验正确测验观: 是决策的辅助工具 不完善三类心理测验:1.智力测验:吴天敏-中国比内量表 龚耀先-韦氏成人智力量表(WAIS-RC),韦氏儿童(CWISC),韦氏幼儿(CWYCSI) 林传鼎-韦氏儿童(WISC-CR) 张厚粲
4、-瑞文标准型测验(SPM) 李丹联合型瑞文测验(CRT)2。人格测验: 艾森克人格问卷(EPQ) 卡特尔16人格因素问卷(16PF) 明尼苏达多项人格调查表(MMPI)3。心理评定量表: 精神病评定量表, 躁狂状态。 抑郁. 焦虑. 恐怖。心理测验发展: 高尔顿奠定统计学基础,提出气质特点和智能的遗传性,设计测量遗传差异的方法 卡特尔-心理测验第一次出现在心理学文献中 比内-世界第一正式心理测验测验常模常模团体:具有共同特征的人组成群体,或该群体的一个样本。条件:1。群体构成明确界定 2。所测群体的代表性样本 4.标准化样组是一定时空产物(随时间,空间变更而失去意义)3。样本大小适当(经济实用
5、,减少误差 30或100,全国性20003000)取样:目标人群中选择有代表性样本抽样方法:1.简单随机抽样 2。系统抽样(整体无序,无等级结构) 3。分组抽样 4.分层抽样(先按某变量分类,再随机抽取)常模分数:施测样本被试后,将被试者的原始分数按规则转换出来的导出分数(有参照点和单位,与原始分数等值比较)常模:常模分数构成的分布 心理测验分数的基础:一般常模+特殊常模(非典型团体建立)一。发展常模(年龄量表):1.发展顺序量表(最直观),多大的儿童具备什么能力和行为表示其发育正常。 葛塞尔发展程序表 按月份显示儿童运动水平,适应性,语言,社会性。16W-头平衡 28W手握 40W坐立爬 5
6、2W-行走 皮亚杰 守恒理论 5Y质量守恒 6Y重量守恒 7Y-容量守恒 2。智力年龄 比内-西蒙量表 最早使用智力年龄概念-儿童在量表上得分,代表他的智力水平的年龄智龄 基础年龄+3.年龄当量(年级量表) 教育成就测验中最常用二。百分位常模 百分等级 百分点 四分位数 十分位数1。百分等级(PR) 应用最广 指在常模中低于这个分数的人数百分比PR=100-(100R-50)/N R排名2.百分点(百分位数PP) (100-PR)/(SPP)=(PR-1)/(PP-s)3.四分位数 十分位数三。标准分常模 将原始分数与平均数的距离以标准差为单位表示出来 z分数 Z分数 T分数 标准九分数 离差
7、智商1。线性转换的标准分数 z分数 z=(XX)/SD, SD-样本标准差 X-原始分数 X样本平均数 Z分数 Z=A+Bz 2。非线性转换的标准分数 原始分数不常态分布时,将其常态化将原始分数转换为百分等级T=50+10z 麦柯尔最早用T分数:平均数-50 标准差-10; 标准九分:平均数-5标准差-2;标准十分:平均数5 标准差1。5; 标准二十分 平均数-10 标准差3四。智商及意义 最早的比内-西蒙智力测验无智商概念,只用”心理年龄”(MA)表示智商高低 现在比率智商,离差智商1。比率智商(IQ): IQ= MA(心理年龄)/CA(十足年龄)*1002.高差智商(离差智商):以年龄组为
8、样本计算而得的标准分数。 韦克斯勒 平均数100,标准差15 IQ=100+15z=100+15(XX)/SD 不同离差智商只有在标准差接近或相同时才可以比常模分数表示法1. 转换表法:最简单最基本-常模表2. 剖面图法直观看出各部分测验表现的相对位置信度同一被试者在不同时间内用同一测验(或相同测验)重复测量,所得的结果的一直程度只受随机误差影响,误差越大,信度越低 实得分数(X)=真实分数(T)+误差(E) SX2=ST2+SE2信度;一组测量分数的真分数方差与总方差的比率 rxx= ST2/ SX2=1 SE2/ SX2信度指标: 信度系数+信度指数信度系数: rxx= ST2/ SX2=
9、rxt2 信度指数:rxt=ST/SX测量标准误 SE= SX (1- rxt)1/2 信度越高,标准误越小.一.重测信度 稳定性系数 采用重测法 前后实施两次测验,求两次得分的关系系数 时间间隔 2-4W,不超过6M缺点:易受记忆和练习影响 相隔时间太长,则易受身心发展和学习经验积累的影响二.复本信度 等值性系数 两个等值但题目不同的测验(复本)来测量同一群体,求得分间相关系数(不掺时间影响)重测复本信度/稳定与等值系数 两复本施测相隔一段时间优点: 能避免重测信度的问题 缺点:1.只能减少练习影响 2。掌握解题原则三。内部一致性信度:反映题目间的关系,表示测验能测量相同内容或特质的程度1。
10、半分信度:用半分法估计所得的信度系数。 按奇偶将测题分成等值两半,求两半分数的关系系数-两半测验一致程度斯皮尔蛮布朗公式 rxx= 2 rhh / (1+ rhh) rhh为一半分数的关系系数 rxx为测验在原长度时的信度估计值2。同质性信度 同质性:代表测验内部所有题目一致性。 各测题得分较高正相关,不论题目内容形式,测验为同质。库德查理逊公式 常用KR20. 在各测量难度相同或近似的情况下,用K-R21 只适用答对一题记一分,答错无分克伦巴赫系数:适用多重记分:多选人格量表 态度量表等四.评分者信度: 成对受过训练的评分者间平均一致性达0.9以上,才认为评分客观 多个评分对象,以等级法记分
11、时,采用肯德尔和谐系数(W)作为评分者信度估计信度与测验分数的解释rxx=0。9 测验有90变异是真分数造成,10来自误差.信度可接受水平一般原则: rxx一个标准差(SD),才表明有显著差异影响信度的因素:1.样本特征:样本团体异质性影响(异质性高-高估测验信度)+样本团体平均能力水平(难度影响信度) 2.测验长度:测验越长-结果越可靠,猜测因素影响越小 斯皮尔曼-布朗公式导出:长度倍数:K= rkk(1 rxx)/ rxx (1 rkk)3。测验难度:难度太大或太小,则分数范围缩小,信度降低 洛德 选择题平均难度 5/1-0。7, 4/1-0.74, 3/1-0。77, 2/10.854。
12、时间间隔:重测信度和不同测量时的复本信度影响 间隔短,信度系数大; 时间间隔久,变因介入可能性大,信度低测验效度:所测量的与所要测量的心理特点之间符合程度心理测验的准确性 信度是效度的必要条件真实方差=有关方差+无关方差ST2=SV2+SI2 SX2= SV2+SI2+SE2 效度系数=真实方差/总方差rxy2= SV2/ SX2效度的性质:1.相对性:对一定的目标 2。连续性:效度用相关系数表示,只有程度上不同效度评估: 内容效度 构想效度 较标效度1。内容效度(逻辑效度):测验题目对相关内容或行为取样的适应性,从而确定测验是否所欲测量行为领域的代表性取样评估法:1。专家判断法:定义测验内容
13、总体范围-编制双向细目表(确定内容和技能所占比例)制定评定量表 2。统计分析法 3。经验推测法特性:内容范围,时间特性 表面效度:外行对测验表面检查确定. 最高行为测验表面效度,典型行为测验-低表面效度2.构想效度(结构效度):测量结果能否证实或解释某理论的假设,术语,构想, 解释的程度如何评估法:1.对测验本身分析 研究测验内部结构来界定理论构想3.效标效度的研究证明:(对照组) 2。测验间比较:相容效度(同类相关性)+区分效度(不同类测验相异性)+因素分析法 4.试验法和观察法证实3。效标效度(证实效度):测验预测个体在某情景下行为表现的有效性程度. 被预测的行为是检验效度的标准效标同时效
14、度(诊断现状) 预测效度(预测将来结果的测验) 效标条件 1。有效反映测验目的 2。较高信度,稳定可靠,不随时间变化 3.可客观观察,用数据或等级表示 4。简单,经济评估法:1。相关法(求测验分数与效标资料间关系) 2。区分法(测验分数能否有效区分效标定义的团体。重叠量大,分数差异小,效度差) 3。命中率法效度的功能:1.预测误差 2。预测效标分数 3。预测效率指数影响效度因素:一.测验本身因素: 材料代表性 测验长度 试题类型 难度 区分度 编排方式(先易后难)二。测验实施中干扰因素:1.主试影响因素(实施标准与否,引导语,时限,评分,测验情境,材料准备,其他干扰因素) 2。被试影响因素(兴
15、趣,动机,情绪,态度,身心状况,是否合作)三.样本团体性质:1。样本异质性,异质性高,效度高(1.测验团体经选拔,2。选拔标准太难,都会造成同质) 2。干涉变量:团体特征(年龄,性别,职业,智力,教育水平,动机,兴趣等)使测验对不同团体预测能力不同四。效标的性质:效标与测验分数之间是否线性相关(重要因素)。皮尔逊积差相关系数的前提假设两变量线性相关项目分析一.项目难度 难易程度 用通过率表示 P=R/N100 P越大,通过率越大,难度越低 (在非能力测验中“通俗性)计算方法:1.二分法记分项目(选择题,对1分,错0分) 27高分组,27低分组,46中间组 P=(PH+PL)/2 平衡机遇对难度
16、影响大 吉尔福特校正公式:CP=(KP1)/(K-1) K-备选答案数 P-通过率 CP校正后通过率 2。非二分记分法:不能用二分法计算时: P=X/XMax100%难度水平确定:1。项目难度P接近0或1,无法区分差异;P接近0。5,区别力最好。 最佳平均难度 0。50.2之间 2。测验难度:可从测验分数分布直接检验 一般呈常态分布 过难或过易:偏态分布(正偏态+负偏态)二.项目区分度(鉴别力):测验项目对被试的心理特征区分能力 评价项目质量和筛选项目重要指标,影响测验效度因素计算方法:1。鉴别指数:按总分排列-确定高分低分组(分别总数27)高低分组通过率计算鉴别指数 D=PHPL 伊贝尔 鉴
17、别指数性能标准 D: 0。4很好;0。30。39良好;0。2-0.29尚可,需修改;0。19差2.相关法: 点二列相关(二分名变量+连续变量) 二列相关(两连续变量) 相关法(两二分名变量)区分度与难度关系:高难度对高水平者区分度高,中难度对中水平者区分度高.难度以常态分布为好测验编制程序一.测验目标分析:1.明确测验对象 2。测验用途:显示性测验(样本测验样本取自明确总体+标记测验取自开放总体) 预测性测验(预测没被测量的行为)3.测验目标:用来测验何种心理变量或行为特征 工作分析+对特定概念下定义(流畅性 灵活性等)+确定测验具体内容二。试题编写:1.搜集材料:已出版的标准测验+理论和专家
18、经验+临床观察和记录2.命题原则:1。内容(符合测验目的,代表性,内容不牵连) 2。文字(准确,简明) 3.理解(无争议,易理解) 4.社会敏感性(禁忌)3。编制要领:提供型(论文,简答,填充) 选择型(选择,是非,匹配) 简答题:宜用问句,填充空格不宜太多,只一个正确答案三.编排和组织:难度逐步上升,同类测题组合一起,根据各类测题本身特点排列 常见(并列直进式+混合螺旋式)心理测验的使用一.主试的资格1。知识结构 2专业理论知识和技能 3.职业道德(测验的保密和控制使用,被试隐私的保护)二。测验选择 1.适合测量目的 2.符合测量学要求(标准化,信度,效度,是否符合测试对象)三.测验前准备:
19、准备工作(预告测验 准备材料 熟悉指导语 熟悉具体程序) 建立协调关系:主试和被试间友好,合作,能促使被试最大限度作好测验的一种关系四.实施及要素1。指导语(如何选择反应形式 如何记录 时限 如不能确定该如何操作 例题 告知测验目的) 2。时限(典型行为测验无时限;最高作为测验中,速度时重要因素) 3。测验环境五.误差及控制1。应试技巧(对程序,技能熟悉程度)+练习效应(教育差,经验少,智力高;重测验速度,重复相同测验,时距)2.应试动机+测验焦虑(适度焦虑提高反应速度,高智力测验,成就测验,能力测验成绩,倒U型)3.反应定势(反应风格) 独立于测验内容的反应倾向,由于回答问题习惯不同,能力相
20、同得到不同测验分数 1。求快-求精 2。喜好正面叙述 3。喜好特殊位置 4.喜好较长选项 5。猜测六。测验评分:1.获得原始分(及时清楚记录反应情况 标准答案计分键 将反应和计分键比较) 2。原始分转换七。测验结果报告:1。测验分数综合分析(1。据测验特点分析 2。勿将分数绝对化,轻易下结论(测前经历,测验情境) 3.信度效度资料(最匹配情境,最相近团体) 4。来自不同的测验分数不能直接比较)2。报告分数的具体建议:1。不把结果直接告诉本人或其他人,应告诉测验分数的解释和建议 2。避免使用术语 3.保证当事人知道测量目的 4。使当事人知道和什么团体比较 5。使知道如何运用分数 6。考虑到测验分数给当事人的影响 7。让当事人积极参与测验分数解释6