心理测量学基础知识培训.ppt

资源描述

,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,三级基础理论试卷构成,科目,基础心理学,社会心理学,发展心理学,变态心理学,测量心理学,咨询心理学,心理诊断技能,心理咨询技能,心理测验技能,心理测量学知识,第一节概述,第二节测验的常模,第三节测验的信度,第四节测验的效度,第五节项目分析,第六节测验编制的一般程序,第七节心理测验的使用,第一节概述,第一单元测量与测量量表,第二单元心理测量的基本概念,第三单元心理测验的分类,第四单元纠正错误的测验观,第五单元心理测验在心理咨询中的应用,第六单元心理测量的发展史,真题（,2007年11月,）,50、关于测量，正确的说法是（）。,（A）测量就是心理测量,（B）就是依据一定的法则用数字对事物加以确定,（C）就是用数字来描述事物的法则,（D）就是用一些题目或数字来描述事物的属性,真题（,2009.5,）,91,测量所用数字具有自然数的特点，即具有（,）。,A,区分性,B.,等级性,C,等距性,D,可加性,真题（,2008.11,）,108,测量的主要元素包括（,）。,A,事物,B,数字,C,法则,D,描述,二、测量要素,(一)参照点,确定事物的量，必须有一个计算的,起点。,参照点有两种：,绝对零点,相对零点,即人定的参照点,心理测量中多为相对零点,(二)单位,好的单位必须具备,两个条件,：,确定的意义,相同的价值,心理测量中单位不够完善。,真题（20,11,年11月）,101、任何测量都应该具备的要素是（）。,（A）量表,（B）参照点,（C）等级,（D）单位,三、测量量表（必考）,斯蒂文斯(S,S,Stevens)将测量,从低级到高级,分成四种水平，即,命名量表、顺序量表、等距量表和等比量表,(一)命名量表,测量水平,最低,的一种量表形式。,如1代表男，2代表女；刘翔的,1356,(二),顺序量表,数字仅表示等级,，并不表示某种属性的真正量或绝对值。,既无相等单位又无绝对零点,。,如学生的考试名次、工资级别、能力等级、对某事物的喜爱程度等。,真题（,2006年11月,）,55、我们通常将学生的考试结果按名次排除，这些名次属于（）变量。,（A）命名,（B）顺序,（C）等距,（D）等比,真题（,2008.5,、,2009.11,、,2011.5,）,在顺序量表中，变量具有（,）。,A,相等单位,B,等级,C,绝对零点,D,等比,(三)等距量表,有相等的单位，没有绝对的零点,数值,可以相互做加、减运算,0度并不意味着没有温度,真题（,2009.5,）,118,等距量表中的数值可以进行（,）运算。,A,加,B,减,C,乘,D,除,(四),等比量表,最高水平的量表,有相等的单位，没有绝对的零点,可以做加、减、乘、除运算,。,一般来说，心理测量是在,顺序量表,上进行的。可以通过统计整理为,等距量表,。,50、其数值可以进行加、减、乘、除运算的量表是（）。,真题（2006年11月）,（A）命名量表,（B）顺序量表,（C）等距量表,（D）等比量表,第二单元心理测验的基本概念,一、心理测验的定义,所谓心理测验，就是依据,心理学理论,，使用一定的,操作程序,，通过观察人的少数有,代表性的行为,，对于贯穿在人的,全部行为,活动中的,心理特点,做出,推论和数量化分析,的一种科学手段。,二、心理测验的性质,二、心理测验的性质,(一)间接性,无法直接测量心理活动，只能通过对测验项目的反应来推论。,(二)心理测量的,相对性,无绝对标准，都是与团体或大多数人群的行为或人为标准相比较。,(三)客观性,即测验的标准化。,测验的刺激,是客观的。,对反应的量化（评分记分）,是客观的。,对结果的推论,是客观的。,真题,(2008.11),107,心理测验具有（,）。,P356,A,外显性,B,间接性,C,相对性,D,客观性,116.,关于心理测量的客观性，下列说法正确的包括（,）,P357,真题,(2011.11),(A),测验的刺激是客观的,(B),对反应的量化是客观的,(C),测量没有绝对的标准,(D),对结果的推论是客观的,第三单元心理测验的分类,一、按测验的功能分类,二、按测验材料的性质分类,三、按测验材科的严谨程度分类,四、按测验的方式分类,五、按测验的要求分类,一、按测验的,功能,分类,(一)智力测验,(二)特殊能力测验,(三)人格测验,真题,(2009.11),91,、按测验的功能，可将测验分为,(),。,(A),智力测验,(B),特殊能力测验,(C),人格测验,(D),投射测验,二、按测验,材料的性质,分类,(一)文字测验,(二)操作测验,也称非文字测验。,不受文化因素限制,学前儿童、不识字的成人,真题,(2009.11,、,2010.11),107.,按测验材料的性质，可将测验分为（）。,（,A,）文字测验,（,B,）智力测验,（,C,）主题统觉测验,（,D,）操作测验,三、按测验材科的,严谨程度,分类,(一)客观测验,绝大多数测验为客观测验。,(二)投射测验,罗夏墨迹测验、主题统觉测验、自由联想测验、句子完成测验,四、按测验的,方式,分类,(一)个别测验,一对一,(二)团体测验,一对多或多对多,真题,(2008.11),106,按测验的方式分类，可将测验分为（,）,A,操作测验,B,文字测验,C,个别测验,D,团体测验,五、按测验的要求分类,(一)最高作为测验,要求受测者尽可能做出最好的回答。,智力测验，成就测验,为最高行为测验。,(二)典型行为测验,此类测验无正确答案，各种人格测验属于典型行为测验。,真题（2006年5月）*,110,.,按测验的要求分类，可将测验分为（）。,（A）最高作为测验,（B）典型行为测验,（C）主观测验,（D）客观测验,第四单元纠正错误的测验观,一、错误的测验观,二、正确的测验观,错误的测验观,万能论,无用论,等同智力测验,正确的测验观,研究方法之一,决策辅助工具,尚不完善,真题（,2006年5月,）,58、错误的测验观不包括（）。,（A）测验万能论,（B）测验无用论,（C）心理测验即智力测验,（D）测验是辅助工具,真题（,2007年5月,）,103、正确的测验观包括（）。,（A）心理测验是重要的心理学研究方法之一，是决策的辅助工具,（B）做心理测验时态度要正确,（C）心理测验作为研究方法和测量工具尚不完整,（D）,“,一考定,终身,”,说明心理测验非常重要,第五单元心理咨询中的应用,心理门诊中运用较多的三类心理测验,:,智力测验,人格测验（,EPQ,、,16PF,、,MMPI,）,有助于对求助者人格特征的了解,咨询和治疗更有针对性。,心理评定量表,(SAS,SDA,等,),检查对方某方面心理障碍的存在与否或其程度如何，并可反映病情的演变。,真题（2007年5月）,104、人格测验包括（）。,（A）EPQ （B）MMPI,（C）16PF （D）CRT,真题（200,9.11,）,34.,人格测验不包括,(),。,(A)EPQ,(B)16PF,(C)CRT,(D)MMPI2,第六单元心理测验的发展史,一、科学心理测验的产生与发展,高尔顿(F,Galton),A.,为研究差异的遗传性，设计测验差异的方法,B.,奠定了统计学基础，第一个提出相关概念,C.,由,他的学生皮尔逊,创立积差相关法,卡特尔,A.,使心理测验首次出现于心理学文献中,B.,认为心理学应立足于实验和测验,C.,认为心理测验应有普遍的常模,D.,心理测验要有常模以便比较,比内(A,Binet),A.,比内,-,西蒙量表,B.,世界上第一个正式的心理测验,真题,(2009.11),75,、编制世界上第一个正式的心理测验的学者是,(),。,(A),高尔登,(B),比内,(C),卡特尔,(D),奥蒂斯,二、现代心理测验在我国的发展,近些年来我国的心理学家正在致力于测验的,本土化。,第二节测验的常模,第一单元常模团体,第二单元常模的类型,第三单元常模分数的表示方法,第一单元常模团体,一、常模团体的性质,常模团体,是由具有,某种共同特征,的人所组成的,一个群体，或者是该群体的一个样本。,常模的选择主要是基于对测验将要施测的总体的认识，常模团体必须能够,代表,该总体。,确定常模团体的步骤包括：,确定一般总体、确定目标总体、确定样本。,真题,(2010.5,、,2011.5),56,、具有某种共同特征的人所组成的一个群体或者是该群体的一个样本，叫做（,）。,（,A,）团体（,B,）常模团体,（,C,）样本（,D,）受测人群,二、常模团体的条件,(一)群体的构成必须明确界定,(二)常模团体必须是所测群体的代表性样本,(三)样本的大小要适当,在实际工作中，应从,经济的或实用的,可能性和,减少误差,这两方面来综合考虑样本的大小,总体数目小，,100%,样本。数目大，一般最低不小于,30或100个,。全国性常模，一般应有,20003000,人为宜。,样本大小适当的关键是样本要有,代表性,。,(四)标准化样组是一定时空的产物,在选择合适常模时，要注意选择,较为新近的常模。,真题（,2007,.,5,2007,.,11,2008.5,）,50、常模样本量一般不小于（）。,（A）100或500 （B）800或1000,（C）20或25 （D）30或100,51、样本大小适当的关键是样本要有（）。真题（2006,.,11）*,（A）代表性（B）特殊性,（C）相关性（D）可比性,三、取样的方法,取样即从,目标人群,中选择有代表性的样本。,真题,(2008.11),55,取样是指从（,）中选择有代表性的样本。,A,总体,B,群体,C,目标人群,C,样本,下列几种抽样方法：,(一)简单随机抽样,(二)系统抽样,(三)分组抽样,(四)分层抽样,真题（2006年5月）*,58、常用的抽样方法不包括（）。,（A）简单随机抽样,（B）系统抽样,（C）分层抽样,（D）标准化抽样,(一),简单随机抽样,按照,随机表顺序,选择被试构成样本,或者将抽样范围内的每个人或每个抽样单位进行,编号,再进行随机选择。每个人或抽样单位都有相同的机会被抽中。,真题,(2009.5),56,随机号码表法是（,）。,A,简单随机抽样,B,系统抽样,C,分组抽样,D,分层抽样,(二)系统抽样,:,又称等距抽样，就是将已编好号码的个体排成顺序，然后每隔若干个号码抽取一个。,系统抽样的关键是计算,组距,：,K=N/n,系统抽样要求,目标总体无序可排，也无等级结构存在。,真题（2007年11月）,51、系统抽样法的关键是计算（）。,（A）样本量,（B）总体,（C）随机数,（D）组距,真题（2006年11月）*,103、系统抽样要求（）。,（A）目标总体有序可排,（B）存在等级结构,（C）目标总体无序可排,（D）无等级结构存在,(三)分组抽样,：,先将群体进行分组，再在组内进行随机取样。,(四)分层抽样,确定常模时最常用,按某种变量把目标总体,分层,，,层内随机,，最后组合成常模样本,92.,抽样的方法一般包括（,）。,真题,(2010.5),（,A,）分层抽样,（,B,）系统抽样,（,C,）分组抽样,（,D,）简单随机抽样,四、常模与常模分数,(一)常模分数（,导出分数,）,常模分数就是施测常模样本被试后，将被试者的原始分数按,一定规则,转换出来的,导出分数,。,导出分数的特性：,与原始分数等值,有意义,等单位,带参照点,真题（2007年05月）*,105、导出分数的特性是（）。,（A）与原始分数等值,（B）等单位,（C）具有意义,（D）具有参照点,真题（200,8.5 55,、,2008.11 56,）*,常模分数又叫（）。,A,导出分数,B,原始分数,C,总体分数,D,粗分数,(二)常模,常模分数构成的分布，就是通常所说的,常模,(norm)，它是,解释心理测验分数的基础,。,常模有,一般常模,与,特殊常模,之分。,对于,某些特殊的群体,来说，情况很具有特殊,性,，我们就需要制定,特殊常模,真题（20,10.5,）*,35,、在心理测验中，对于非典型群体需要制定（,）。,（,A,）普通常模,（,B,）特殊常模,（,C,）一般常模,（,D,）发展常模,真题（20,10.5,）*,76,、解释心理测验分数的比较基础是（,）。,（,A,）常模分数,（,B,）常模,（,C,）导出分数,（,D,）分数,第二单元常模的类型一、发展常模,亦称年龄量表,。,在,年龄量表,中，个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。,发展顺序量表可以告诉人们某儿童的发育与其年龄相比,正常,超前,滞后,真题（20,08.11,）*,105,发展顺序量表可以告诉人们某儿童的发育与其年龄相比（,）。,A,超前,B,滞后,C,正常,D,以上都不是,真题（20,10.5,）*,34.,发展常模就是（,）。,（,A,）团体的分数,（,B,）百分位数,（,C,）个人的分数,（,D,）年龄量表,(一)发展顺序量表,最早的一个范例是,葛塞尔发展程序表,按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。,比如，,16,周的婴儿可以保持头部平衡,皮亚杰对守恒的研究,5,岁理解质量守恒，,6,岁掌握重量守恒，,7,岁才有容量守恒概念,(二)智力年龄,比内-西蒙量表,首先使用,智力年龄,的概念。,一个儿童在年龄量表上所得的分数，就是最能代表他的智力水平的年龄。这种分数叫做,智力年龄，简称智龄。,真题,(2009.11),56,、首先使用智力年龄概念的是,(),量表,.,(A),比内,西蒙,(B),韦克斯勒,(C),斯坦福,比内,(D),瑞文,(三)年级当量,也称年级量表，测验结果说明被试属于哪一年级的水平。,常模样本中6年级的算术平均分为35，某儿童在算术测验中也得35分，那么就有,“,该儿童的算术是,6年级水平,”,二、百分位常模,百分位常模包括：,百分等级,百分点,四分位数,十分位数,真题（200,8,年,5,月）,107,百分位常模包括（,）。,A,百分等级,B,百分点,C,四分位数,D,十分位数,(一)百分等级,一个测验分数的百分等级是指在常模样本中,低于这个分数的人数百分比,。,55的百分等级表示在常模样本中有55%的人比这个分数,低,是应用最广的表示测验分数的方法。,百分等级越低，个体所处的位置越低。,真题（20,11.11,）,41,、在百分位常模中，应用最广的是,(),。,(A),百分等级,(B),百分位数,(C),四分位数,(D),十分位数,真题（,2007年11月,）,52、百分等级55的分数表示在常模本中有55的人比这个分数（）。,（A）低,（B）相等,（C）高,（D）以上都不正确,(二)百分点（百分位数）,又称,百分位数,，计算方法是计算处于某一百分比例的人对应的,测验分数,是多少。,(三)四分位数和十分位数,四分位数和十分位数是百分位数的,变式,。,四分位数是将量表分成四等份，相当于百分等级的,25%、50%和75%,对应的三个点分成的四段。,十分位数是将一组数据由小到大（或由大到小）排序后，用9个点将全部数据分为10等份，与9个分割点上相对应的数据称为十分位数。,三、标准分常模,将原始分数与平均数的距离以标准差为单位表示出来的量表，基本单位是标准差，所以叫标准分数,常见的标准分数有：,Z分数、T分数、标准九分、标准十分、标准二十分、离差智商(IQ),等。,标准分数可以通过,线性转换,，也可以通过,非线性转换,得到,真题（200,9,年,11,月）,105,、属于标准分数常模的是,(),。,(A),百分等级,(B)T,分数,(C),比率智商,(D),离差智商,真题（200,9,年,5,月）,105,标准分数可以通过（,）得到。,A,线性转换,B,非线性转换,C,分析,D,变化,(一)线性转换的标准分数,其中X为任一原始分数，为样本平均数，,SD为样本标准差,。,Z=A+Bz(公式5-3),加上一个常数（A）是为了去掉,负值,，乘以一个常数（B）是为了使单位变小从而去掉,小,数点,。,=,真题（,2006年11月,）,52、式中SD为（）。,（A）任一原始分数,（B）样本平均数,（C）样本标准差,（D）标准分数,真题（,2006年5月,）,60、Z=A+BZ式中为转换后的标准分数，A、B为根据需要指定的常数。加上一个常数是为了去掉（），乘以一个常数是为了使单位变小从而去掉小数点。,（A）整数,（B）小数,（C）负值,（D）分值,当以50为平均数(即加上一个常数50)，以10为标准差(乘以一个常数10)来表示时，通常叫做,T分数,，即：,T50+10,最早使用T分数的是,麦柯尔,名称,平均数,标准差,T,分数,50,10,标准,9,分数,5,2,标准,10,分数,5.5,1.5,标准,20,分数,10,3,离差智商,100,15,真题（200,8,年11月）*,57,标准二十分的标准差为（,）。,A,5 B,4,C,3,D,2,真题（2006,.,5、,2010.5,）,61、标准十分，平均数为（），标准差为（）。,（A）6：2,（B）5,.5,：1.5,（C）6：1.5 （D）7：1.5,真题（200,8.,5、,2009.5,、,2011.11,）,56,以,50,为平均数，,10,为标准差表示的标准分，通常叫（,）。,A,Z,分数,B,标准九分数,C,T,分数,D,离差智商,(二)非线性转换的标准分数,当原始分数不是常态分布时，也可以使之常态化，这一转换过程就,是非线性的,常态化,过程主要是将,原始分数,转化为,百分等级,，再将百分等级转化为常态分布上相应的标准分数。,真题（2006年11月）*,52、当原始分数不是常态分布时，也可以使之常态化，这一转换过程是（）。,（A）线性的,（B）非线性的,（C）直接的,（D）间接的,四、智商及其意义,若心理年龄（,MA,）高于其生理年龄，则智力较一般儿童高，若心理年龄低于其生理年龄，则智力较一般儿童低。,但在使用中发现，单纯用心理年龄来表示智力高低的方法缺乏不同,年龄,儿童间的可比性,。,(一)比率智商（,推孟：斯坦福比内量表,）,比率智商(IQ)被定义为,心理年龄,(MA)与,实足年龄,(CA)之比。,由于个体智力增长是一个由快到慢再到停止的过程，即心理年龄与实足年龄,并不同步,增长，所以比率智商并不适合于年龄较大的被试。,真题（,2009.5,）,76,比率智商（,IQ,）是（,）与实足年龄之比。,A,生理年龄,B,真实年龄,C,心理年龄,D,智力商数,(二)离差智商,是一种以年龄组为样本计算而得的标准分数,韦克斯勒将离差智商的平均数定为,100,，标准差定为,15,。,离差智商,建立在统计学的基础之上,，,离差智商,表示的是,个体智力在年龄组中所处的位置，因而是表示智力高低的一种理想的指标,=,=,+,+,*,*,-,离差智商提出后，过去许多测验都改用了离差智商，,1960,年修订的,斯坦福,-,比内测验,，使用了,平均数,100,，标准差,16,的离差智商,从不同测验获得的离差智商只有当,标准差,相同或接近时才可以比较,真题（2007,.,5、,2008.11,）,51、韦克斯勒将离差智商的平均数定为100，标准差定为（）。,（A）17,（B）15,（C）11 （D）13,真题（2007,.,05，,2010.11,）*,50、（）表示的是个体智力在年龄组中所处的位置。,（A）离差智商,（B）比率智商,（C）百分等级（D）标准九分数,真题（,2006年5月,）,62、,是（）的计算公式。,（A）比率智商,（B）标准分数,（C）标准差,（D）离差智商,第三单元常模分数的表示方法,一、,转换表法,最简单而且最基本的表示常模的方法就是,转换表,，有时也叫常模表。,测验的使用者利用,转换表,可将原始分数转换为与其对应的导出分数，从而对测验的分数作出有意义的解释。,二、,剖面图,剖面图,是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。,真题（2006年5月）,63、最简单而且最基本的表示常模的方法是（），有时也叫常模表。,（A）转换表,（B）分布表,（C）对照表（D）都不是,真题（2007,.,11、,2010.11,）,53、（）可以将测验分数的转换关系用图形表示出来，便于直观地看出被试者在各个分测验上的表现及其相对位置。,（A）条形图（B）直方图,（C）剖面图,（D）饼状图,补充,常模的构成要素为：,原始分数、导出分数、对常模团体的有关描述,。,发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地改变。所以，它的基本要素是：,一组可以区分不同年龄组的题目、一个常模团体、常模表,。,真题（,2010.5,）,121,、常模的构成要素包括（,）。,（,A,）抽样分数,（,B,）原始分数,（,C,）导出分数（,D,）对常模团体的具体描述,第三节测验的信度第一单元信度的概念第二单元信度评估的方法第三单元信度与测验分数的解释第四单元影响信度的因素,第一单元信度的概念,一、信度的定义,信度,是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量，所得结果的,一致程度,。,真题（,2009.11,）,76,、在不同时间内用同一测验重复测量同一被试者，所得结果的一致程度称为,(),。,(A),信度,(B),效度,(C),难度,(D),区分度,信度只受,随机误差,的影响。,真题,(2011.5),55,、影响信度的是,(),。,(A),系统误差,(B),随机误差,(C),恒定效应,(D),概化理论,真题（2007,.,5、,2008.5,、,2010.11,、,2011.5,）,55、信度只受（）的影响。,（A）系统误差（B）随机误差,（C）恒定效应（D）概化作用,二、信度的指标,(一)信度系数与信度指数,我们常用信度系数（信度）,它是一种,相关系数,，常常是同一受测者样本所得的两组资料的相关。,(二)测量标准误（所有样本均值的标准差）,理论上对一个人无数次施测可以求得平均数和标准差，平均数就是真分数,信度越高，标准误越小；信度越低，标准误越大（互为消长）。,真题（2006年11月）*,104、公式中SE为测量的标准误，S,X,是所得分数的标准差，r,xx,为测验的信度系数。从公式中可以看出，测量的标准误与信度之间的关系是（）。,（A）信度越低，标准误越小,（B）信度越低，标准误越大,（C）信度越高，标准误越大,（D）信度越高，标准误越小,第二单元信度评估的方法,一、重测信度,二、复本信度,三、内部一致性信度,四、评分者信度,一、重测信度,使用,同一测验,，在,同样条件,下对,同一组被试者,前后施测两次测验，求两次得分间的相关系数,叫,重测信度,，又称,稳定性系数,。,由于人的多数心理特征如智力、性格、兴趣等，具有相对的稳定性，间隔一段时间，不会有很大变化。,真题（2006年11月）,102、使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数同，叫（），又称（）。,（A）复本信度（B）重测信度,（C）稳定性系数（D）分半信度,真题（,200,9.5,）,77,重测信度即（,）。,A,等位性系数,B,稳定性系数,C,相关系数,D,X,系数,二、复本信度(alternateform liability)以,两个等值但题目不同的测验(复本),来测量,同一群体,，然后求得被试者在两个测验上得分的相关系数,复本信度反映的是测验在,内容上,的等值性，故又称,等值性系数,。,真题（2006年5月）*,59、复本信度又称等值性系数。它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在（）上的等值性。,（A）时间（B）题目,（C）评分（D）内容,如果两个复本的施测相隔一段时间，则称,重测复本信度或稳定与等值系数,。,优点：避免重测信度的一些问题（记忆、学习效应等）,复本信度局限性：,其一，如果测量的行为易受练习的影响，则复本信度只能减少而不能完全消除这种影响；,其二，由于第二个测验只改变了题目的内容，已经掌握的解题原则，可以很容易地迁移到同类问题。,最后，对于许多测验来说，建立复本是十分困难的。,真题,(2009.5),35,以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越（,）。,A,大,B,低,C,小,D,不确定,三、内部一致性信度,(一)分半信度(splithalf reliability,),通常是在测验实施后将测验按奇、偶数分为等值的两半，并分别计算每位被试在两半测验上的得分，求出这两半分数的相关系数。这个相关系数就代表了,两半测验,内容,取样的一致程度。,分半信度往往会,低估,信度。,(二)同质性信度,代表测验内部,所有题目,间的一致性。,各题目得分有较高,正相关,时，测验是,同质,的；即使所有题目看起来好像测量同一特质，但,相关很低或为负相关,时，则测验为,异质,的。,真题（2006年11月、,2007.11,、,2008.5,、,2011.5,）,53、同质性信度主要代表测验内部（）间的一致性。,（A）两半测验,（B）所有题目,（C）题目与分测验（D）分测验,四、评分者信度,随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个分数计算相关，即得评分者信度。,一般要求在成对的受过训练的评分者之间平均一致性达,0.90,以上，才认为评分是客观的。,52、一般要求在成对的受过训练的评分者之间平均一致性达到（）以上，才认为评分是客观的。真题（2007年5月）,（A）0.70（B）0.80（C）0.90（D）1.00,第三单元信度与测验分数的解释,一、解释真分数与实得分数的相关,二、确定信度可以接受的水平,三、解释个人分数的意义,四、比较不同测验分数的差异,一、解释真分数与实得分数的相关,在,极端的情况,下，如有,rxx1.00,，则表示完全没有测量误差，所有的变异均来自真实分数；若有,rxx0,，则所有的变异和差别都反映的是测量误差。,rxx0,.90,时,90%,变异是真分数造成的,10%,来自测验的误差。,二、确定信度可以接受的水平一般原则是：,当,rxx0.70,时，测验不能用于对个人做出评价或预测，而且不能作团体比较；,当,0.70rxx 0.85,时，可用于团体比较；,当,rxx0.85,时，才能用来鉴别或预测个人成绩或作为。,三、解释个人分数的意义,两个作用,其一是估计真实分数的范围；,其二是了解实得分数再测时可能的变化情形。,人们一般采用95%的或然率（概率）水平，其置信区间为：,大约有95%的可能性真分数落在所得分数1.96Se的范围内，或有5%的可能性落在范围之外。,-,+,四、比较不同测验分数的差异,差异分数的标准误公式为：,甲被试在韦氏成人智力测验中言语智商为102，操作智商为110。已知两个分数都是以100为平均数，15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88，那么其操作智商,不显著高于,言语智商,=,-,-,第四单元影响信度的因素,分数分布范围越大，相关越高，信度越高。,一、样本特征,一般而言，若获得信度的取样团体较为,异质,的话，往往会,高估,测验的信度，相反则会低估测验的信度。,(一)样本团体异质性的影响,(二)样本团体平均能力水平的影响,对于不同水平的团体，题目具有不同的,难度,，每个题目在难度上的微小差异累计起来便会影响信度。,真题（2006,.,11，2007,.,05,2007,.,05）*,55、若取样团体较为异质的话，一般会（）测验的信度。,（A）高估,（B）低估（C）提升（D）降低,52、对于不同平均能力水平的团体，题目的（）会影响信度系数。,（A）难度,（B）长度,（C）信度（D）效度,二、测验长度,一般来说，在一个测验中增加同质的题目，可以便信度提高。,第一，测验越长，测验的测题取样或内容取样就越有代表性。,第二，测验越长，被试的猜测因素影响就越小。,增加测验长度的效果应遵循报酬递减率原则,有时反而会引起被试的疲劳和反感而降低可靠性。,真题（200,9.,5）,92,关于心理测验，下列说法中正确的是（,）。,A,测验越长，测验的测题取样或内容取样就越有代表性,B,测验越长，被试者受猜测因素的影响就越小,C,测验越长，越遵循报酬递增率原则,D,测验太长，有时会引起被试者的疲劳和反感而降低可靠性,三、测验难度,难度,太大或太小,使得,分数范围缩小,信度会,降低,。,平均难度,0.5,信度最大。,洛德(Lord)提出在学绩测验中，为了保证其可靠性，各类选择题的理想平均难度为：,五择一测题，0.70；四择一测题，0.74；三择一测题，0.77；是非题，,0.85,。,四、时间间隔,以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越,大,；,第四节测验的效度第一单元效度的概念第二单元效度评估的方法第三单元效度的功能第四单元影响效度的因素,第一单元效度的概念一、效度的定义,效度是指所测量的与所要测量的心理特点之间符合的程度，或者简单地说是指一个心理测验的,准确性,。,效度受,随机误差和系统误差,影响！,真题（200,8.,05、,2011.5,）*,58,在心理测验中，效度是指一个心理测验的（,）。,A,稳定性,B,准确性,C,可信度,D,区分性,二、效度的性质,(一)效度具有相对性,在评鉴测验的效度时，必须考虑其,目的与功能,。,(二)效度具有连续性,用效度是较高还是较低来评价,真题（2007,.,11、,2010.5,、,2010.11,）,102、效度具有相对性，因此在评鉴测验的效度时，必须考虑测验的（）。,（A）信度（B）目的（C）功能（D）长度,专栏,:,信度和效度的关系,一、信度是效度的必要而非充分条件,可信的测验未必有效,有效的测验必定可信。,二、效度是受信度制约的,第二单元效度评估的方法,美国心理学会在1974年所发行的教育与心理测量之标准一书中将效度分为三大类：,内容效度,构想效度,效标效度。,一、内容效度,(,一)什么是内容效度,内容效度,指的是,测验题目,对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。,真题（200,9,年11月）*,35,、测验题目对有关行为取样的适用性是,(),。,(A),内容效度,(B),构想效度,(C),效标效度,(D),区分效度,(二)内容效度的,评估方法,1.专家判断法,最常用的方法是请,有关专家,对测验题目与原定内容的符合性做出判断，看测验的题目是否代表规定的内容。又称,“,逻辑效度,”,。,真题（2007年11月）*,55、内容效度有时又称（）。,（A）构想效度,（B）效标效度,（C）区分效度,（D）逻辑效度,为了使内容效度的确定过程更为客观，弥补不同专家对同一测验的判断可能不一致，可采用如下几个步骤：,(1)定义好测验内容的总体范围,(2)编制双向细目表（内容,+,比例）,(3)制定评定量表来测量测验的整个效度,2统计分析法,例如计算两个评分者之间评定的一致性,两个测验复本上得分之相关,再测法（学习前测，学习后再测）,3经验推测法,通过实践来检验效度,如儿童发展量表，通过率随年龄增高而增高。,真题（2007年5月,2007年11月,2008,年,5,月）,105、内容效度的评估方法有（,ACD,）。,（A）专家判断法,（B）双向细目表法,（C）统计分析法,（D）经验推测法,(三)内容效度的特性,表面效度是由外行对测验作表面上的检查确定的。,在编制测验时，表面效度是一个,必须考虑,的特性。,例如，,最高行为测验,要求有,较高的表面效度,典型行为测验,则要求有,较低的表面效度。,54、在编制测验时，表面效度是要考虑的重要特性。如果编制最高行为测验，除了内容效度，也要求有（）。真题（2006年11月）,（A）较高的表面效度,（B）较好的专家判断,（C）较好的外行判断,（D）主观性,二、构想效度,(一)什么是,构想效度,构思效度,，也叫,结构效度,。,它主要涉及的是心理学的,理论概念,问题,指测验能够测量到,理论上的构想或特质的程度,测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。,(二)构想效度的估计方法,1对测验本身的分析,构思效度的证据,a.,测验的内容效度,b.,测验的内部一致性指标,c.,分析被试者对题目的反应特点,（社会赞许问题）,2测验间的相互比较,a.,相容效度,(,相同类测验,),b.,区分效度,(,不同类测验,),c.,因素分析法,3效标效度的研究证明,先据效标分组,然后看测验分数能否很好将两组区分,4实验法和观察法证实,真题（,2007年11月,）,105、构想效度的估计方法包括（,ABCD,）。,（A）对测验本身的分析,（B）测验间的相互比较,（C）效标效度的研究证明,（D）实验法和观察法证实,三、,效标效度,(,实证效度,),(一)什么是效标效度,反映测验预测个体在某种情境下行为表现的有效性程度。,被预测的行为,是检验效度的标准，简称,效标,。,根据效标资料是否与测验分数同时获得，又可分为,同时效度,和,预测效度,两类。,104,、效标效度可分为（）。真题,(2010.5),（,A,）相容效度（,B,）区分效度,（,C,）同时效度（,D,）预测效度,一个好的效标必须具备以下条件：,（1）效标必须能最有效地反映测验的目标，即效标测量本身必须有效；,（2）效标必须具有较高的信度，稳定可靠，不随时间等因素而变化；,（3）效标可以客观地加以测量，可用数据或等级来表示；,（4）效标测量的方法简单，省时省力，经济实用。,(二)效标效度的评估方法,1相关法：,评估效标效度最常用的方法，求测验分数与效标资料的相关,2区分法：,区分法是检验测验分数能否有效地,区分,由效标所定义的团体的一种方法。,3,命中率,法：,当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的一种方法,正确预测为命中不正确预测为失误,命中的情况包括：,预测成功而且实际也成功,预测失败且实际上也失败,真题（2006年5月）,64、（）是检验测验分数能否有效地区分由效标所定义的团体的一种方法。,（A）相关法,（B）区分法,（C）命中率法,（D）失误法,真题（200,9,年5月）,57,检验测验分数能否有效地划分由效标所定义的团体的一种方法是（,）。,A,相关法,B,区分法,C,命中率法,D,失误法,真题（200,8,年5月）,105,效标效度的主要评估方法有（,）。,A,相关法,B,区分法,C,失误法,D,命中率法,真题（2006,.,11、,2008.5,）,105、效标的主要评估方法有（）。,（A）命中率法（B）区分法,（C）失误法（D）相关法,第三单元效度的功能,一、预测误差,效度

展开阅读全文