资源描述
第一章
一.什么是测量?测量的三个要素是什么?
测量就是根据一定的法则给事物指派数字。事物及其属性——测量的对象
法则——指导测量的规则和程序,数字——测量结果的表示方式。
二.测量有哪四种水平?其各自的特点是什么?
(1)类别测量
根据法则指派给事物的数字仅是事物的符号或称呼,没有任何数量大小的含义。
这种测量又可分为两类:代号,类别
所适用的统计方法主要是次数统计,如频数、众数、百分比、卡方检验等。
(2)等级测量指派给事物的数字具有等级性和序列性,但不表示数与数之间的差距是相等。
适用的统计方法有中位数、百分位数、等级相关等。
(3) 等距测量数字不但有大小关系,而且具有相等的单位,但没有绝对的零点。
可以做加减运算,但不能做乘除运算。适用的统计量有平均数、标准差、积差相关、t检验、F检验等。
(4) 比率测量 数字不但具有相等的单位,而且具有绝对的零点。所得的值可以进行加减乘除运算,适用的统计量除以上几种外还可以计算几何平均数、变异系数等。
三.什么是心理测量?理解心理测量的性质(特点)
所谓心理测量,就是根据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。
1、心理测量的间接性2、心理测量的相对性3、心理测量的时空性4、心理测量的客观性
四.什么是心理测验?心理测验的三个要素是什么?
心理测验实质上是对行为样组的客观和标准化的测量。行为样本
标准化:测验的一致性 测验内容的标准化,施测条件的标准化,评分规则 的标准化,测验常模的标准化 客观性:科学性
五.极限行为测验、典型行为测验、常模参照测验、标准参照测验?
极限行为(最高行为)测验:要了解个体在某种心理特质或行为表现上的最佳表现水平。
典型行为测验:要了解被试在某种心理特质或行为上最一般、最具有代表性的表现。
常模参照测验:将被试测验结果的分数与常模分数相比较来解释被试的成绩。
标准参照测验:将被试测验结果的分数与一个既定的标准比较来解释被试的成绩。
第二章 信度
一.什么是测量误差?什么是系统误差与随机误差?
测量的误差是指在测量过程中由那些与测量的目的无关的变化因素所产生的一种不准确或不一致的测量效应。1、随机误差:指那种与测量目的无关的偶然因素引起的而又不易控制的误差。2、系统误差:指那种与测量目的无关的变因而引起的一种恒定而有规律的效应。
二.真分数和实测分数?理解真分数理论的数学模型和基本假设?
真分数:测量中不存在测量误差时的真值或客观值。真分数的操作性定义是无数次测量结果的平均值。实测分数:测量中真正得到的分数。CTT理论假定,观测分数与真分数之间是一种线形关系,并只相差一个随机误差,即:X =T + E X:实测分数T:真分数 E:误差
1、在讨论范围内,真分数具有某种程度的稳定性,是常数。
2、若一个人的某种心理特质可以用平行测验反复测量足够多次,则其观测分数的平均值会接近真分数,即误差分数的平均数为零。
3、误差分数与真分数相互独立,即相关为零。4、各平行测验上的误差分数之间的相关为零。
三.什么是信度?
可靠性,指在不同时间,使用同一测验,或使用两个不同项目的等值测验,抑或在其他不同的测试条件下,对同一组被试实施两次测验所得分数的一致性。信度就是一组测验分数中真分数方差与实测分数方差的比率。
四.掌握重测,副本,同质性信度,评分者信度的涵义及特点
(一)重测信度(再测信度)
重测信度指用同一个量表对同一组被试施测两次所得结果的一致性程度。
用同一测验前后两次测试同一组被试的分数的相关系数,即代表了重测信度。
(1)所测量的特性必须是稳定的。(2)被试遗忘与练习的效果相同。
(3)在两次施测期间被试的学习效果没有区别。优点:简便易行。
能提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为表现的依据。
缺点:易受练习和记忆的影响。
(二)复本信度指两个平行测验测量同一批被试所得结果的一致性程度。
同一批受试者接受两个复本测验得分的相关系数,即代表复本信度。
取得复本信度的两种方法:连续施测,间隔一段时间分两次施测
(1) 复本可能只能减少而不能排除练习和记忆的影响。(2)测验的性质会由于重复而有所改变。(3)对于许多测验,建立复本是十分困难的。
(三) 同质性信度,指测验内部所有题目间的一致性程度。
1、分半法 将测验题目分成对等的两半,根据各人在这两半的分数,计算其相关系数,作为信度的指标。分半的方法:前后分半,奇偶分半 优点:简单方便
不足:(1)把测验分成两半计算,减少了测验的长度,实际上只计算出半个测验的信度。
rnn:估计的信度系数 rtt:实得的信度系数 n:测验增长或缩短的倍数
(2) 分成两半的测验两部分会相似,但不可能完全相等。
(3) 当测验为速度测验时,分半信度就不可用了。
(四) 评分者信度 评分者信度是由多个评分者给一组测验结果评分,所得各个分数之间的一致性程度。 主要适用:被试的得分会受评分者主观判断影响的测验。
评分者信度的指标:两个评分者:积差相关或等级相关系数
三个以上的评分者:肯德尔和谐系数
注意:重测信度往往只适用于测量稳定特质的测验。
复本信度重视测验内容的覆盖面和项目取样的代表性,往往适用于对测量的内容容易界定的测验。当要求测验的项目具有较高的同质性时,宜采用分半信度。
五.掌握信度系数的应用和要求
1、 利用信度系数,可以确定测量的标准误。测量的标准误(SEM)指实际测验中所得的测值偏离真分数的程度。
Sx:被试在此测验得分的标准差
2、 解释测验的分数差异
两个分数之间差异的标准误
因为:
所以
可以写成
六.理解影响信度的因素:信度与测验的随机误差关系密切,随机误差越大,信度越低。(一)被试的因素
就个体而言,被试的身心状态、动机、应试态度等都会影响测验结果的一致性。
就团体而言,被试团体的离散性(异质性)会影响测验的信度。
被试团体的年龄和能力水平也会影响分数的分布,从而影响信度。
(二) 主试的因素:施测、计分是否规范、统一对信度有影响。
(三)测验过程的因素:测验情境的一致 是否安静、没有干扰
是否让被试感觉舒适 重测的间隔时间
(四) 测量工具的因素1、测验的长度:一般来说,测验越长,可以减少测量中的随机性,增加测验的稳定性,因而测验的信度就越高。
2、测验的难度:要使测验信度达到最高,应该有一个适当的难度水平,以产生最广的分数分布3、题目取样的适当性:测验内部的试题同质性较高,能提高测验的内部一致性系数。
第三章效度
一.什么是效度?理解信度与效度的关系。
效度也叫有效性或正确性,指测验能有效地测量到它所要测量的东西的程度,既测验目的的达成程度。1、高信度是高效度的必要而非充分条件。低信度一定低效度,但高信度也可以低效度。 2、测验的效度受它的信度制约 。信度系数大于等于效度系数的平方
二.什么是效标与效标效度?什么是内容效度和结构效度?
效标是指用来衡量测验效度的尺度,或指用来衡量测验有效性的一个参照标准。
效标效度是指一个测验的结果与另一个可以作为标准的衡量结果(即效标)的一致性程度。
内容效度指的是测验题目对有关内容或行为范围取样的适当性。
构想效度就是指测验结果可根据该测验的构想来解释的程度,即用测验结果与理论构想的符合程度来检查测验的效度。
三.理解效度系数的作用。
1、决定系数 效度系数的平方称为决定系数,它表明由测验正确预测或解释的效标方差的比例。
2、 预测效标分数
Zy:效标成绩的标准分数估计值 rxy:效度系数Zx:测验分数的标准分
3、 人员选拔决策 人员选拔决策中的几个概念:
基础率:在总体中自然存在着的合格人员的比例。基础率=(A+D)/(A+B+C+D)
录取率:指采用测验作为筛选工具时所录取人员的比例。录取率=(A+B)/ (A+B+C+D)
成功率:录取且成功者的比率。 成功率=A/(A+B)
在基础率一定的情况下,成功率受测验效度和录取率的影响。
假设基础率在一定的人群中是常数,则效度、录取率、成功率的关系为:
(1)效度高,录取率低时,成功率高。
(2)如果录取率提高而效度系数不变,则成功率降低。
(3)如果录取率保持不变而效度系数提高,则成功率提高。
四.理解影响效度的因素。(一)测验本身的因素
内容取样要适当,具有代表性。文字表述清晰易懂,题目编排合理
测题不能提供额外的线索或有明显的规律,测题的难度适当,测验的信度,测验的长度
(二)测验的实施、计分是否实现标准化(三)效标的因素
(四)被试的因素被试样本的代表性被试样本的规模,被试样本的异质性,被试的状态
第四章 项目分析
一.什么是难度?掌握难度的计算方法和难度校正的计算方法。
难度,即项目的难易程度,通常以一项目的通过人数的比率来表示。难度的计算:(一)二分法计分的题目
1、 P:难度 R:通过该项目的人数 N:全体受测者人数
2、P:难度 PH:在一题目上高分组的通过率
PL:在一题目上低分组的通过率
P:难度 RH:在一题目上高分组答对的人数
RL:在一题目上低分组答对的人数 n:高分组(或低分组)的人数
3、 二分法计分的题目的难度校正
CP:校正后的难度 P:未校正的难度 K:备选答案的数目
(二) 非二分法计分的题目
P:难度X:全体被试在该题上的平均得分
W:该题的满分值
整个测验的难度,可以用组成测验的所有项目难度的算术平均数或加权平均数表示。
二.理解难度对测验的影响。
1、影响测验分数分布的形态。(成为偏态,高低限)
2、影响测验的信度。3、影响测验的鉴别力。(无法体现差异性)
三. 什么是区分度?掌握区分度的计算方法。
区分度又叫鉴别力,指一个测验能正确地区分被试间心理差异的效力。1、极端分组法(项目鉴别指数)D=PH-PL(-1相反0无关1完全区分)
D:项目鉴别指数 PH:高分组通过率 PL:低分组通过率
0.40以上:非常优良0.30—0.39:良好0.20—0.29:尚可,需修改0.19以下:劣,必须淘汰2、方差法 被试在某一试题上的得分越分散,则该题鉴别力越大。
3、 内部一致性分析法 当一个项目与总分相关高,那么这个项目的鉴别力也高。
第五章 测验分数的解释
一.什么是常模?常模具有哪些特性?
常模是指同一情况被试在某种行为上的分数结构模式。
常模是比较的标准,是解释测验结果的依据。
常模分数来自对常模团体的测量。1、相对性2、时空性3、特殊性
二.什么是常模团体?在选择常模团体时应注意什么?
常模团体是指具有某种共同特征的人所组成的群体中的一个样本。(1)群体的构成必须明确界定。(2)常模团体必须是所要测量群体的一个代表性取样。
(3)取样的过程要有明确说明。(4)常模团体要有一定的数量。
(5)常模团体的近时性。
三.什么是发展性常模?发展性常模有哪些主要的类型?
发展性常模就是某类个体正常发展进程中各特定阶段的一般水平。1、智力年龄将各年龄的儿童所大部分能通过的题目分配到不同的年龄组的题目中,被试能通过某年龄组的题目,则以该心理年龄作为反映其心理特质水平的指标,称为智力年龄。2、年级当量 在教育成就测验中,我们常常以被试在测验中的表现相当于某年级学生的一般表现为指标,来反映被试的教育成就,称为年级当量。
3、顺序量表 通过描述儿童在诸如运动、感觉辨别力、言语、概念形成等方面随年龄发展的典型行为,将儿童的行为与这些典型行为相比较来鉴别儿童所达到的发展阶段,这样得到的量表就是顺序量表。
四.什么是组内常模?组内常模有哪些主要的类型?
组内常模就是以常模组的测验分数分布状态作为参照系的常模。1、百分等级
百分等级分数是一种相对位置量数,某一分数的百分等级可以解释为常模团体中得分在该分数以下的被试的百分数。2、标准分数 标准分数Z是原始分数与平均分数的离差以标准差为单位的分数
第六章 心理测验的编制
一.测验编制的一般程序包括哪些?
1.确定编制测验的目的
2.制定编题计划:指出测验所包含的内容和所要测定的各种技能,以及对每一个内容、技能的相对重视程度。编题计划一般以双向细目表的形式出现。
3.编辑题目:搜集题目素材:来源:理论分析,文献,量表,开放式问卷;要求
选择项目形式:团体特定,实际因素,目的和材料性质;固定应答,自由应答
编写和修订:命题原则(取样代表性,格式,文句简明,答案公认,题目独立,不超出团体知识范围,避免禁忌,省时)编题原则(范围与计划一致,数量比所需多一倍以上,难度适中,说明清楚)
4. 题目的试测和分析:试测(样本代表性,情景近似,时限稍宽,记录被试反应)
项目分析:质(取样,题目表达)量(难度,区分度,答案合适度),复核
5. 合成测验:项目的选择,编排(并列直进,混合螺旋),编制复本
6.将测验标准化:内容(等值),评分(及时记录,计分键,反应归类),施测过程(时限,指导语)
7.对测验的鉴定:信效度8.制定常模 9.编写测验说明书
二.确定编制测验的目的包括哪些方面?
(一)确定测量对象:年龄 教育水平 文化背景
(二) 分析测量目标
1、 确定能表征所欲测量的心理结构的行为
如何使我们所选择的行为样本更具代表性:
(1)回顾以往的研究成果(2)考虑时代特点
(3)了解受测者的实际情况(4)向专家和资深者质询、请教
2、确定每一类行为的项目比例
(三)确定测验的功能:选拔、预测or诊断 ,常模参照测验or标准参照测验
三. 固定应答型和自由应答型的题目的优缺点是什么?
(1)固定应答型(封闭性)题目让受测者从测验编制者事先定好的答案中辨认出正确答案,包括选择题、是非题、匹配题等。优点:
单位时间内可以施测很多项目,从而能保证取样的广泛性,使测验更有效。
评分客观,加上题目数量多,可以减少随机因素的影响,从而能保证测验的可靠性。 可以通过改变错误答案的迷惑性来调整题目的难度。
阅卷方便迅速。 保密性好,好的题目可存入题库重复使用。
缺点:有固定答案,难以测量材料组织力、创造力等高级心理机能。
编写困难费时,需要一定技巧。
(2) 自由应答型(开放性)题目
让受测者用自己的语言或行动来对某一问题作出回答,包括填充题、简答题、应用题、论文题、联想题、操作题等。
优点:反应自由,可获得较丰富的反应。可测量高级的心理机能。
缺点:题目数量一般较少。评分难以客观化、标准化。
第七章 智力测验
一.什么是智力测验?
智力测验是在一定条件下,使用特定的标准化测验量表对被试施加刺激、从被试的一定反应中测量其智力高低的过程。也指这种标准化的测验量表本身。
二.什么是智商?表示智力水平的三个指标各有什么优缺点?
智商是用来衡量一个人智力水平高低、反映一个人聪明程度的概念,是用来解释智力测验结果的指标。
智龄,比率智商: 离差智商:
三.什么是年龄量表?什么是项目量表?
年龄量表,即测验是将题目按照所适应的年龄段进行分组的,在一个组的题目中,可能包括有各种不同内容、不同形式的测验题目。
项目量表,即将测验的题目以测试的内容为依据组织成不同的分测验,分别对不同的智力内容进行测试。
四.什么是适应性测验?其优点是什么?
适应性测验即对每个被试只进行与其水平最相适合的一些题目的测试,而不是要求每个被试都完成一样的全部题目。
适应性测验的优点:
(1)这样的测验不会一开始就让被试觉得很难而产生挫败感,也不会让被试觉得很容易而不认真对待测验;
(2)它能让测验者用最少量的时间收集到最大量的信息;
(3)它能尽量减少测验者因为操作过多的项目而可能出现的测验疲劳等现象。
五. 掌握S-B IV的理论基础?S-B IV的特点是什么?
S-B第四版的理论基础是一种智力分层模型。该理论把智力界定为三种不同层次的能力,第一层是一般能力(g),第二层是三种主要能力:晶体能力、流体分析能力和短时记忆,第三层是三种特殊能力:言语推理、数量推理和抽象视觉推理。
(1)测量的内容更加全面,包括了言语、数量、空间及短时记忆等方面,言语内容的比例有所降低,改变了了早期版本较偏重言语内容的倾向,
(2)测验的组织结构形式有了根本的改变 ,采用了项目量表的组织形式。
(3)在施测程序上,仍然保存了原先适应性测验的特点,即每个人只接受那些难度水平适合于他自身实际表现水平的题目的测试。
(4)测验能提供更全面而详细的信息 。除了提供代表一般推理能力的总分(即总智商)之外,还可获得四个领域的分数,以及15个分测验的个别分数。
六.掌握韦氏智力量表的特点。
(一)组成方面的特点
韦克斯勒智力测验是由一系列的测验所组成的测验家族,由各自独立又相互衔接的、适用不同年龄阶段的三套量表组成。
WPPSI(韦氏幼儿智力量表),适用于4~6.5岁。
WISC(韦氏儿童智力量表),适用于6~16岁。
WAIS(韦氏成人智力量表),适用于16岁以上。
(二)测验结构的特点:采用项目量表的结构形式。整个测验分为若干分量表,每个分量表由若干个分测验构成。
(三)分数解释上的特点
韦氏测验最早引入了离差智商的概念。能提供被试智力的多方面、多层次的信息。
七.掌握WISC IV的基本结构和内容。
WISC IV 采用结构量表的形式,由四个分量表构成(言语理解指数,知觉推理指数,工作记忆指数,加工速度指数),共有14个分测验(其中10个正式测验,四个备用测验:类同、词汇、理解、常识;积木、图画概念、矩阵推理、填图;背数、字母数字序列、算术;译码符号搜索、划消)
八.韦氏智力量表的优缺点是什么?
(一)优点
1、可对人的智力进行多方面的反映。
2、采用了成套式的结构。 3、率先引入离差智商的概念代替了比率智商。
4、整个韦氏测验的3套量表互相衔接,适用的年龄范围广。
(二)缺点
1、在预测被试的学业成绩方面效度不如斯—比量表。
2、韦氏量表对于测量智力极高和极低的被试不大合用。3、施测程序复杂费时。
九.团体智力测验的优缺点是什么?
优点:(1)程序简便、效率高,实用性强。 (2)测验更容易实现标准化。
缺点:(1)主试无法直接观察被试的反应,对于疾病、疲劳、焦虑等可能暂时影响成绩的因素不易觉察。
(2)题目类型受到限制。(3)对每个被试都施测全部题目,缺乏灵活性。
十.如何看待传统智力测验的争议和价值?
(一)争议:智力测验的正确性,智力测验是否测到了与智力无关的东西,
智力测验是否测到了智力的全部,智力测验的公平性
(二) 价值
智力测验分数的稳定性是不具有争议的。
智力测验的结果能有效地预测人的某些成就。
IQ分数能解释个人学业成就1/4的变异量,能预测个人社会地位1/3的变异量、1/5的经济收入变异量。
智力测验结果能帮助人们更好地进行人员的选拔、安置、教育、训练。
第八章 人格测验
展开阅读全文