资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,心理测验技能,心理测验技能,第1页,2,一、概述,测量与测量量表,测量:就是依据一定法则用数字对事物加以确定.,主要元素:1 事物 2 数字 3 法则.,测量要素:1 参考点 2单位,参考点:1 绝对零点 2 相对零点,单位 1 确定意义 2 相同价值,心理测验技能,第2页,3,(,一)、测量量表,测量本质是依据某一法则将事物数量化,即在一个定有单位和参考点连续体上把事物属性表现出来,这个连续体称为量表.,命名量表,次序量表,等距量表,等比量表,心理测验技能,第3页,4,命名量表:,这是测量水平最低一个量表形式,只是用数字来代表事物或者将事物分类.,次序量表:,比命名量表水平高,其中数字不但指明类别,同时指明类别大小或者含有某中属性程度.,等距量表:,比次序量表又深入,不但有大小关系,而且含有相等单位,其数值相互做加、减运算,但没有绝正确零点,所以不能做乘、除运算.,等比量表:,是最高水平量表,现有相等单位又有绝对零点,所得数值能够做加、减、乘、除运算.,心理测验技能,第4页,5,(二)、心理测验基础概念,1、,心理测验定义:依据心理学理论,使用一定操作程序,经过观察人少数有代表性行为,对于贯通在人全部行为活动中心理特点做出推论和数量化分析一个科学伎俩.,2、,心理测验性质:间接性、相对性、客观性,心理测验技能,第5页,6,(三)、心理测验分类,1、按测验功效分:智力测验、特殊能力测验、人格测验,2、按测验材料性质分:文字测验、操作测验,3、按测验材料严谨程度分:客观察验、投射测验,4、按测验方式分类:个别测验团体测验,5、按测验要求分类:最高作为测验、经典行为测验,心理测验技能,第6页,7,(四)、纠正错误测验观,1)错误测验观:测验万能论、测验无用论、心理测验即智力测验,2)正确测验观:心理测验是主要心理学研究方法之一,是决议辅助工具;心理测验作为研究方法和测量工具尚不完善,心理测验技能,第7页,8,(五)心理测验在心理咨询中应用,智力测验:,WAIS、SPM、CRT,求援者特殊要求或对方有可疑智力障碍,人格测验:,MMPI、16PF、EPQ,有利于了解人格特征,对问题深入了解,针对性开展咨询,MMPI了解对方精神是否异常,心理评定量表:,精神评定量表、躁狂状态评定量表,抑郁量表、焦虑量表,恐怖量表等,了解心理障碍存在是否及程度,心理测验技能,第8页,9,(六)心理测验发展史,法国心理学家比内(A.Binet)经过与助手西蒙(T.Simon)精心研究,发表了一篇文章,题为:,是世界上第一个正式心理测验.,综观心理学发展,有以下几点:,1)操作测验发展,2)团体智力测验发展,3)能力倾向测验发展,4)人格测验发展,心理测验技能,第9页,10,二、测验常模,心理测验技能,第10页,11,统计学基础知识,总体、样本与个体,总体,含有某种特征一类事物全体(母体),总体特征无法进行一一测量,只能经过样原来推测。,个体,组成总体每一个单元,个体特征能够测量,但因其随机性太大,经常不能准确地反应总体特征。,样本,组成总体一个部份,常见,“,n,”,或,“,N,”,来表示。,能够被测量,常将其特征来代表总体特征。,样本从总体中抽出,存在抽样误差,一些抽样误差能够控制,但随机误差不能控制。,在心理统计中,n30称为小样本,n30称为大样本。,心理测验技能,第11页,12,次数、频率和概率,次数(频数),指某一事件出现回(次)数简单计数,常见,f,来表示。,频率,指相对次数,所观察发生某一事件与总体事件比率,常见,来表示。,概率,又称机(会)率,用,P,来表示。,预计概率和真实概率,预计概率:由一定数量观察中得到频率,真实概率:事物真实发生频率,当观察数量无限增大时,预计概率越靠近真实概率。,概率,(P)=fN,心理测验技能,第12页,13,统计量(特征数),反应一组数据统计特征数字,例:3组20岁男性体重(千克),1组:45、50、55、58、60、60、62、65、70、75,2组:50、55、55、60、60、60、60、65、65、70,3组:40、45、50、55、60、60、65、70、75、80,常见统计量,反应数据集中性质或集中程度(,平均数,、中位数等),反应数据离中(离散)性质或离中(离散)程度(,标准差,、,方差,、全距等),反应两种特征之间关系(,相关系数,),心理测验技能,第13页,14,算术平均值,平均值,(数)中一个,英文mean,用M来表示,或用,X,来表示。反应数据集中趋势。,计算公式,X=X,i,N,X,i,为全部数据和,,X,i,=X,1,+X,2,+X,n,N,为数据个数,计算举例,(上例1组),X,1,=(45+50+55+58+60+60+62+65+70+75)10=60,心理测验技能,第14页,15,方差和标准差,反应数据离中(离散)趋势两种指标。英文,variance(方差)用S,2,或,2,来表示;standard deviation(标准差),用S或SD来表示,亦可用表示。,对离中趋势进行度量意义,全方面反应事物面貌:,平均值只反应了事物经典情况,标准差可反应事物特殊性。,判断集中量数(如平均值)代表性:,在一组数据中,离中趋势越小,集中趋势量数代表性就越好,相反就越差。,心理测验技能,第15页,16,基础公式,方差计算公式,S,2,=(X,i,-X),2,N,X,i,为每个数据,从X,1,、X,2,X,n,(X,i,-X)为离均差,(X,i,-X),2,为离均差平方,(X,i,-X),2,为离均差平方和,N,为数据个数,标准差计算公式,S=S,2,心理测验技能,第16页,17,正态分布,正态分布,又称,常态分布,,统计学中一个主要理论分布,在自然界、人类社会、心理与教育中大量现象和特征均按正态形式分布,如能力、人格特征、学习成绩、社会态度、行为表现以及身高、体重等。,正态分布曲线,心理测验技能,第17页,18,心理测验技能,第18页,19,正态分布特点,正态分布形式是对称,正态分布曲线两端与基线趋于无穷远,但不会相交。,正态分布曲线与基线之间面积等于1(100),代表了总体事件。,从正态分布曲线最高点作垂直线,形成正态分布中轴,将面积分为相等两半,各占50。,平均值位于正态分布中轴上。,正态分布曲线下各对应横坐标(即标准差)处与平均数之间面积可用积分公式计算,也可查正态分布表取得。,正态分布曲线下,标准差与概率(面积)之间关系举例:,平均值(加减),Z,个SD,包含,A,面积(概率,),平均值(加减)1个SD,包含68.26面积(概率),平均值(加减)1.96个SD,包含95面积(概率),平均值(加减)2.58个SD,包含99面积(概率),平均值(加减)2个SD,包含95.45面积(概率),平均值(加减)3个SD,包含99.73面积(概率),心理测验技能,第19页,20,正态分布理论在心理测验应用,化等级评定为测量数据,测定题目标难易度,利用正态分布将原始分转变为标准分,在评定时确定人数(概率),心理测验技能,第20页,21,常模团体,常模团体性质:,常模团体是由含有某种共同特征人所组承德一个群 体,或者是该群体一个样本,对测验编制者而言,常模选择主要是基于对将要 施测总体认识,常模团体必须能够代表该总体,对测验使用者而言,要考虑是现有常模团体哪一个最适当:受测者分数必须与适当常模进行比较,心理测验技能,第21页,22,常模团体对于编制测验时意义,常模选择基于对实测对象总体认识,普通程序:,确定普通总体确定目标总体确定样本,普通总体:准备评价对象群体,目标总体:准备采样范围人群,常模样本:依据总体性质(如性别、年纪、文化程度等)确定、有代表性样本,常模样本应能够代表普通总体,即含有充分代表性。,常模团体对于使用测验时意义,准备测评对象性质最近似哪个常模样本特征(例:职业测评),哪个常模分数最适合被测评对象(例:WAIS-RC或C-WISC),心理测验技能,第22页,23,常模团体条件,常模团体界定必须明确:,常模团体是由含有某种共同特征人所组成一个群体,或者是该群体一个样本。确定常模时,必须清楚地说明所要测量群体性质与特征,一个测验可能有多个常模团体,WAIS-RC:分城镇、分年纪共16个常模团体,MMPI:分男、女性别两个常模团体,EPQ(成人):分性别、分年纪12个常模团体,常模团体必须是所测群体代表性样本,心理测验技能,第23页,24,建立常模时注意事项,本大小适当。,因为抽样误差与样本大小成反比,理论上样本越大越好,但也要考虑详细条件允许。,样本数量,总体数目小,全部作为样本。,总体数目较,制订常模时,须清楚地说明所要测量,群体性质与特征,,依据不一样性质(变量)确定群体,便可得到不一样常模。,大,样本也要大,30100人。,全国常模3000人。,样本代表性,样,系统抽样要求目标总体无序可排,也无等级结构存在。,普通常模和特殊常模,心理测验技能,第24页,25,取样方法,取样即从目标人群中选择有代表性样本,随机取样,依据随机标准选择样本,在该范围内每个人被抽到机会相等。,常见抽样方法,简单随机抽样:,利用随机数字表抽样、抽签,系统抽样,在总体项目为N情况下,选择K分之一作为样本。,K=Nn,K为组距,N为总样本人数,n 拟抽取样本量,举例:,K为2:两个中抽1个,随机确定首个是谁,隔一个抽1个,K为20:每隔20位抽1个,从121名学生中抽40人作为调查样本,K=121403,若首位是第8号,则每隔3位抽一个,即8、11、14,心理测验技能,第25页,26,分组抽样,当总体数目较大,无法进行编号,而群体又具多样性时采样,先分组,再在组内随机抽样,分层抽样,制订常模是最常见方法,先按某种(或几个)变量分层,然后在每层中随机抽取一定样本,组合成常模样本。,分层百分比抽样,心理测验技能,第26页,27,分层非百分比抽样,当各层次差异很大时,有些层次主要性大于其它层次,这时应采取非百分比抽样,以降低各层标准差。,n,i,=nN,i,S,i,(N,i,S,i,),心理测验技能,第27页,28,常模与常模分数,常模,:是一个供比较标准量数,由标准化样本测试结果计算而来,是心理测验用于比较和解释测验结果参考分数标准,按照样本大小和起源:全国常模,区域常模,特殊常模,常模分数,:就是施测常模样本后,将受测者原始分数按一定规则转换出来导出分数(含有一定参考点和单位),心理测验技能,第28页,29,常模类型,发展常模分数计算及解释,许多心理特质是随时间(年纪)改变而发展。,将被测者成绩与各种发展水平人群平均表现相比较,这种常模即,发展常模,,该量表亦称,年纪量表,。,发展次序量表,测验条目(能力或行为)按出现早晚排列,完成该条目说明到达对应年纪水平。,葛塞尔婴幼儿发育量表:,包含运动水平、适应性、语言、社会性四个方面。,心理测验技能,第29页,30,智力年纪,一个人在采取年纪量表方式编制智力测验上得到分数,简称智龄。,计算方法,每个条目代表一定年(月)龄,将所经过条目折算出月龄,然后相加计算出智力年纪。如比内量表。,以标准化样本每个年纪组平均原始分数作为常模,被试者从测验中得到原始分数与其比较,从而确定智龄。,比内量表智龄计算举例,计算公式,IQ=MA(心理年纪)/CA(实足年纪)100,计算举例(例1),心理测验技能,第30页,31,心理年纪分数计算,确定起始年纪,起点:从实际年纪低1岁组开始测验,回头测试标准:若被试在某类型条目失败时,需回头做低年纪组类似条目,直至成功经过为止。,确定最高年纪:,某年纪组6个条目均失败时停顿,继续标准:尽管已确定止点,但该年纪段不含某类型条目,此时应继续做高年纪组类似条目,直至失败为止。,确定心理年纪,25岁组条目,每经过1条取得1个月心理年纪;,6SA组条目,每经过1条取得2个月心理年纪;,SA组条目,每经过1条取得5个月心理年纪;,SA组条目,每经过1条取得6个月心理年纪;,起始年纪以下条目,假定被试完全经过,取得对应心理年纪。,心理测验技能,第31页,32,举例(例1):某10岁儿童心理年纪计算,年纪水平,经过测验数目,每项测验,得到月数,全部得分,年,月,8岁,6(起始年纪),8,9岁,5,2,10,10岁,6,2,12,11岁,5,2,10,12岁,3(在5个测验中),2.4,7.2,13岁,2,2,4,14岁,1,2,2,AA,1,2,2,SA,0,0,SA,1,5,5,SA,0(最高年纪),6,0,总分,8,52.2,心理年纪(MA),12岁4月2天,心理测验技能,第32页,33,年级当量,年级当量:就是年级量表。说明测验结果属于哪个年级水平,年级量表单位为十个月,十个月为一个年级,心理测验技能,第33页,34,百分位常模分数计算及解释,百分位常模包含百分等级、百分点、四分位数和十分位数。,百分等级,百分等级是应用最广泛表示测验分数方法,百分等级指出是个体在常模团体中所处位置,百分等级计算,未分组资料,PR=100-(100R-50)N,R 指某人原始分排列次序数,N 指样本总人数,举例,:小东在30名同学中语文成绩是80分,排列第5名,其百分等级多少?,PR=100-(1005-50)30=85,计算步骤,公式:,PR=100N(xl)f,p,h+c,f,N=164,x=38,l=36,f,p,=23,h=12,c,f,=123,PR=100164(3836)2312+123,PR=100164126.83,PR=77.34,心理测验技能,第34页,35,百分点,百分点用于计算处于某一百分百分比人相对应测验分数是多少,计算方法(直线内插法),举例:,已知高考最高分为695,其百分等级为100,最低分为103分,百分等级为1,求百分等级80所对应分数是多少?,公式:,C 指上限百分等级,S,C,上限百分等级对应分数,F 指下限百分等级,S,F,下限百分等级对应分数,X 已知百分等级,PP 依据已知百分等级,要求对应分数,心理测验技能,第35页,36,计算部骤(因式分解),20(695-PP)=79(PP-103),79(695-PP)=20(PP-103)(等号两侧交叉相乘),54905-79PP=20PP-2060,54905+2060=20PP+79PP,56965=99PP,PP=5696599,PP=575.4,心理测验技能,第36页,37,四分位数和十分位数,四分位数和十分位数只是百分位数(百分等级)两个变式。,举例,百分位数(百分等级),:将量表分成100等份,四分位数:,将量表分4等份,125、2650、5175和76100四段。,十分位数:,将量表分成10份,110为第一段,91100为第十段。,心理测验技能,第37页,38,标准分计算及解释,标准分,是将原始分数与平均数距离以标准差为单位表示出来量表。,标准分基础单位是,标准差,。,常见标准分数有z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。,依据转换方式不一样,标准分可分为:,线性转换标准分:,z分数、Z分数、T分数,非线性转换标准分:,z,分数,当原始分不成常态分布,需进行转换使之成为常态分布,转换方法,(百分等级法),对每个原始分计算累计百分比,在常态曲线面积表中,求出对应于该百分比z分数,转换后z分数称为,z分数,心理测验技能,第38页,39,常见标准分形式,基础形式,z分,:,z=(XX)/SD,X 为任一原始分,X 为样本平均数,SD 为样本标准差,常见标准分,Z分数,Z=A+Bz,A 为量表平均数(依据需要指定常数),B 为量表标准差(依据需要指定常数),z 为基础形式z分,举例:,韦氏智力量表智商平均值为100(A),标准差为15(B)。某人全量表分高于常模1个标准差,问其FIQ应为多少?,115(IQ)=100+151,心理测验技能,第39页,40,T分数,T分数由麦克尔于1939年提出,有纪念推孟和桑代克之意,T分数当前表示任何长期化和非长期化转换标准系统,量表分平均值固定为50,量表分标准差固定为10。,许多人格问卷均采取T分量表,如MMPI、EPQ,T=50+10(XX)/SD,或,T=50+10z,50(A)为T分数(量表分)平均值,10(B)为T分数(量表分)标准差,标准九分,19分九级分数量表,平均值为5、标准差为2。,标准9分=5+2(XX)/SD,或,标准9分=5+2z,心理测验技能,第40页,41,标准十分,110分十级分数量表,平均值为5、标准差为1.5。,卡特尔16PF,标准10分=5+1.5(XX)/SD,或,标准10分=5+1.5z,举例:,(16PF,),30岁女性被试乐群性得分为15分,常模平均值为10.90、标准差3.23,其量表分是多少?,标准二十分,119分分数量表,平均值为10、标准差为3。,韦氏智力量表,标准20分=10+3(XX)/SD,或,标准20分=10+3z,举例:,(,WAIS-RC),16岁被试算术分测验得分为15分,常模平均值为12.73、标准差3.55,其量表分是多少?,心理测验技能,第41页,42,智商计算及其意义,最早比内,西蒙量表专心理年纪来表示智力高低,测验题目标安排完全按难度排列,某条目在某年纪组中50能经过,该条目就被当成该年纪组题目。,比率智商,比率,IQ=MA(心理年纪)/CA(实足年纪)100,比率智商不足之处,个体智力增加与年纪关系并非一直呈直线关系,所以不适合于成人。,比率智商分数在不一样年纪组含有不一样意义。,心理测验技能,第42页,43,离差智商,是一个以年纪组为样本计算而得标准分数,为了使其与传统比率智商基础一致,普通研究者将离差智商平均值定为100。,韦克斯勒智力量表标准差定在,15,IQ=100+15(XX)/SD,或,IQ=100+15z,斯坦福-比内量表标准差定在,16,IQ=100+16(XX)/SD,或,IQ=100+16z,常模标准分转换表,在实际工作中,测验编制者会采取某种标准分公式计算出与原始分相对应标准分,并编制成原始分转换标准分等值表,附在手册上方便使用。,每个测验采取何种标准分,以及量表分平均值和标准差均可从测验手册中查到。,举例(C-WYCSI),4岁城市儿童,言语分量表得分42分,常模平均值为49.94、标准差11.58,其言语IQ是多少?,心理测验技能,第43页,44,注意事项,发展常模换算及解释时需要注意问题,只适合用于所测特质随年纪发生系统改变情况,只适合用于在经典环境下生长儿童,发展量表单位在各年纪并不相等,因为各年纪发展速度不一样,百分位常模换算及解释时需要注意问题,各百分位单位不相等,不能加、减、乘、除,原始分转换为百分等级时,靠近中央分数其差异被夸大,靠近两极分数其差异被缩小。(见后附表),不一样被试之间不能准确比较,标准分常模换算及解释时需要注意问题,计算非线性转换标准分数时,要求所测特质本质上应是常态分布。,来自不一样测验离差智商,只有标准差相同或相近时,才可进行比较,心理测验技能,第44页,45,常模分数表示法,转换表表示法,又称常模表,最简单、基础表示方法。,将测验原始分转换成相对应常模分数(如百分位、标准分、T分等),举例,简单转换表:,将单一测验原始分转换成一个或几个分数。如:瑞文推理测验、全量表IQ,复杂转换表:,包含几个分测验或几个常模团体原始分与导出分数对应关系。如:韦氏智力测验粗分等值量表分转换表、MMPI T分转换表等。,心理测验技能,第45页,46,剖面图表示法,剖面图是将分数转换关系用图形表示出来,剖面图能直观地表示出被试在各分测验上表现及相对位置,有剖面图直接可作为粗分等值量表分转换表用,如韦氏成人智力测验统计纸剖面图,WISC-R剖面图举例,总智商在平均值以上,言语智商相当高,操作智商普通。,心理测验技能,第46页,47,三、测量信度、,心理测验技能,第47页,48,(一)信度分析,定义,信度(,reliability,)是指同一被试在不一样时间内用同一测验(或另一套相等测验)重复测量所得结果一致程度。,(本教材),信度指测验或量表可靠性(可靠程度)。,(龚耀先),信度就是对测量一致性程度预计。,(金喻),在编制或修订心理测验时,信度研究是必须步骤,信度资料是测验手册里必备测量学指标。,在使专心理测验时,没有信度资料测验不能使用。,心理测验技能,第48页,49,信度指标,1、信度系数与系度指数:是一个相关系数,同一受测者样本所得两组资料相关,信度指数平方就是信度系数,2、测量标准误:测量误差分布标准差,用来表示误差大小。,公式:,SE=S,x,1r,xx,S,x,分数标准差,r,xx,测验信度,心理测验技能,第49页,50,测量误差与真分数,测量误差是由与测验目标无关偶然原因引发,使得几次测量结果不一致,且这种不一致是非系统、随机。,真分数指测量中不存在测量误差时真值或客观值。,真分数操作定义就是无数次测量平均值,常见,X,来表示。,表示真分数公式:,X,i,=X,+X,e,X,i,指实测分数,X,指真实分数,X,e,指误差分数,实测分数是真分数与误差分数函数。,在进行心理测量时,,X,被视为是稳定不变,所以,X,i,改变由,X,e,所引发。,据此,,S,i,2,=S,2,+S,e,2,因为测量误差随机性,误差分数平均数为,0,。,心理测验技能,第50页,51,信度表示式,信度,定义能够了解为一组测验分数中真分数方差与实测分数方差比率,在实际工作中,“真分数(,X,)”是极难取得,咱们通常将实测分数(,X,i,)作为真分数“预计值”。,因为真分数(,X,)难以取得,所以,S,2,也极难取得,但后者能够经过其与实测分数方差和误差关系推出来。,依据,r,xx,=r,x,2,=S,2,S,i,2,和,S,i,2,=S,2,+S,e,2,两式,信度(,r,xx,)则作为反应实测分数作为“真分数”预计值准确程度指标。,例:假如某测验信度为0.9,其误差则为0.1。,心理测验技能,第51页,52,测验误差起源,测验本身引发测量误差,测验题目抽样误差,测验题目标形式,测验题目标难度过高或过低,测题或指导语用词不妥,测验时限过短,测验实施引发测量误差,物理环境,主试方面,意外干扰,评分不客观,计算、登记、转换犯错,被试引发测量误差,动机影响,测验焦虑,生理原因,学习、发育和教育,测验经验,心理测验技能,第52页,53,(二)信度类型及预计方法,重测信度,(test-retest reliability),又称稳定性系数(stability),主要用于评价时间误差。,方法:,皮尔逊积差相关,公式,:,r,xx,相关系数,X,1,、X,2,同一被试两个分数,N,样本例数,X,1,、,X,2,两次测验组平均数,S,1,、,S,2,两次测验组标准差,心理测验技能,第53页,54,相关分析,计算两种含有相关关系不一样现象之间关系程度统计学方法,直线相关与曲线相关(见图),直线相关关系分三种情况,正相关:,两列变量变动方向相同,负相关:,两列变量变动方向相反,零相关:,两列变量之间无相关,相关分析方法,计量资料相关分析方法:积差相关(皮尔逊相关),等级资料相关分析方法:肯德尔友好系数,质与量相关分析方法:点二列相关、二列相关,相关系数:,表示相关程度统计学指标,相关系数取值于,1.00+1.00之间。负值表示负相关,正值表示正相关。,“,0,”,表示两个变量之间完全没相关系,,“,1,”,表示两个变量之间展现一对一关系。,相关系数不是等距度量值,所以在比较时只能说绝对值大者比绝对值小者相关更亲密一些。,相关系数与其它统计量一样也存在抽样误差,所以其统计学意义也应进行显著性检验。,心理测验技能,第54页,55,复本信度,(alternate-form reliability),又称等值性系数,以两个等值但题目不一样测验(复本)来测量同一群体,然后求被试者在两个测验得分相关,用于评价两个测验内容一致性。,实施两个测验间隔时间长短可能影响复本信度,复本信度计算方法同重测信度,内部一致性信度,(internal consistency reliability),分半信度(split-half reliability),用于评价同一测验内部条目抽样误差。,方法:将测验条目按单双号分为两组,计算出两组得分,然后进行相关。,在一样情况下,信度高低与条目数量成正比,分半信度只计算了二分之一条目标信度,所以要用斯皮尔曼,布朗公式进行校正。,校正公式:,r,hh,为两半分数相关系数,r,xx,为校正后(原测验长度时)信度预计值,心理测验技能,第55页,56,同质性信度(homogeneity reliability),评价测验内题目间一致性(内容抽样误差),库德理查逊公式(K-R20公式),:适合用于0、1记分测验,N 为测验题目数,P,i,经过某题目标人数百分比,q,i,未经过该题目标人数百分比,S,x,2,测验总分数变异(方差),举例(例4),心理测验技能,第56页,57,举例(例4),:,10名被试在一个有8个条目标测验中得分以下,求其信度?,被试,测验题目得分,1,2,3,4,5,6,7,8,总分,1,0,0,0,0,0,0,0,0,0,2,1,0,0,0,0,0,0,0,1,3,1,0,1,0,0,0,0,0,2,4,1,1,0,0,1,0,0,0,3,5,0,1,0,1,0,0,1,0,3,6,1,1,1,0,1,0,1,0,5,7,1,1,1,1,1,1,0,0,6,8,1,1,1,1,1,1,0,0,6,9,1,1,1,1,0,1,0,1,6,10,1,1,1,1,1,1,1,1,8,累计,8,7,6,5,5,4,3,2,40,P,i,0.8,0.7,0.6,0.5,0.5,0.4,0.3,0.2,p,i,q,i,0.16,0.21,0.24,0.25,0.25,0.24,0.21,0.16,1.72,心理测验技能,第57页,58,公式:,N=8,p,1,=810=0.8,q,i,=10.8=0.2,p,1,q,1,=0.80.2=0.16,p,i,q,i,=p,1,q,1,+p,2,q,2,+p,n,q,n,=1.72,S,x,2,=(0-4),2,+(1-4),2,+(2-4),2,+(3-4),2,+(3-4),2,+(3-4),2,+,(5-4),2,+(6-4),2,+(6-4),2,+(6-4),2,+(8-4),2,10,=6.0,心理测验技能,第58页,59,库德理查逊公式(K-R21公式),X 为测验总分平均值,S,x,2,测验总分数变异(方差),举例(上例),:平均值=4,心理测验技能,第59页,60,克伦巴赫系数:适合用于各种分数形式,N,为测验题目数,S,i,2,为某一题目,分数变异(方差),,S,i,2,为全部题目方差之和,当题目以1、0记分时,S,i,2,=p,i,q,i,,所以,r,KR20,公式能够看成,系数特例,S,x,2,测验总分数变异(方差),举例(例5):,心理测验技能,第60页,61,举例(例5):,10名被试者在一个有10个条目标测验中得分以下,求该测验,系数?,被试,测验题目得分,得分,1,2,3,4,5,6,7,8,9,10,1,2,2,2,1,2,2,1,0,0,1,13,2,2,1,1,2,1,0,0,1,0,0,8,3,2,2,2,2,1,2,1,1,1,1,15,4,1,0,0,1,0,0,0,0,0,0,2,5,1,2,0,1,0,0,0,0,0,0,4,6,2,2,1,2,2,1,1,1,1,0,13,7,2,2,1,2,1,1,0,0,0,0,9,8,2,2,2,2,0,1,1,0,1,0,11,9,2,2,2,2,2,1,1,0,0,0,12,10,2,2,1,1,2,1,1,0,0,1,11,平均值,1.8,1.7,1.3,1.5,1.1,0.9,0.6,0.3,0.3,0.3,9.8,S,i,2,0.16,0.41,0.41,0.45,0.69,0.49,0.24,0.21,0.21,0.21,3.48,心理测验技能,第61页,62,公式:,N=10,S,1,2,=(2-1.8),2,+(2-1.8),2,+(2-1.8),2,+(1-1.8),2,+(1-1.8),2,+(2-1.8),2,+(2-1.8),2,+(2-1.8),2,+(2-1.8),2,+(2-1.8),2,10=0.16,S,i,2,=3.48,M=XN=9810=9.8,S,x,2,=(139.8),2,+(89.8),2,+(159.8),2,+(29.8),2,+,(49.8),2,+(139.8),2,+(99.8),2,+(119.8),2,+,(129.8),2,+(119.8),2,10,=15.36,心理测验技能,第62页,63,评分者信度,(scorer reliability),评价不一样评分者之间一致性指标(不一样评分者之间误差),方法:,随机抽取若干份测验卷,有两位或多位评分者按标准评分,计算每两个评分者对同一被试答卷所评分数之间相关,普通要求评分者之间一致性达0.9以上,计算方法,两个评分者之间一致性用皮尔逊积差相关方法或等级相关方法计算,多个评分者之间一致性:等级资料时用肯德尔友好系数来评价,公式,R,i,为每一对象被评等级总和,N 被评对象人数或答卷数,K,评分者人数,举例(例6),三位教授给6篇论文评等级,结果见表,求评分者信度?,心理测验技能,第63页,64,三位教授给6篇论文评定(例6),教授,1,2,3,4,5,6,1,2,4,1,5,6,2,2,3,4,1,5,5,2,3,3,4,1,4,6,2,R,i,8,12,3,14,17,6,心理测验技能,第64页,65,计算,公式:,N=6,K=3,R,i,=8+12+3+14+17+6=60,R,i,2,=8,2,+12,2,+3,2,+14,2,+17,2,+6,2,=738,心理测验技能,第65页,66,相关信度评定一些问题,重测信度间隔时间,两次测验间隔时间长短影响重测信度,间隔多久适宜因测验目标、性质和被试特点而异,普通,为24周,最好不超出6个月,。,复本信度,计算复本信度时,二分之一被试先做A本再做B本,另二分之一被试则相反,由此抵消测验次序效应。,副本两个测验必须在项目标内容、形式、数量、难度、时限、指导语等方面相同或相同。,分半信度测量其它方法,异质心理学变量测量问题,对于一些复杂、异质心理学变量(如智力、人格),单一测验无法处理,可用几个异质分测验来分别测量各个方面,保持分测验内部同质性。,心理测验技能,第66页,67,(三)信度与测验分数解释,解释真实分数与实得(测验)分数关系,信度系数能够用于解释总方差中有多少百分比是由真实分数决定。,因为:,S,i,2,=S,2,+S,e,2,,,而且假如咱们将总方差看成是1(100)话,所以:,S,e,2,=1r,xx,比如当,r,xx,=0.9,时,咱们能够说实得分数中有90变异是真分数造成,近10来自误差。,各种信度可接收水平,普通标准,当信度0.85时,可用于对个人作评价,当0.70信度0.85时,可用于对团体作评价,但不能对个人作评价,当信度0.7时,不能用作评价,因测验类型而异,普通能力测验要求0.9以上,人格、兴趣、态度等测验要求0.80以上(见表),心理测验技能,第67页,68,几个心理测验信度系数,测验类型,信 度,低,中,高,成套成就测验,0.66,0.92,0.98,学术能力测验,0.56,0.90,0.97,成套倾向性测验,0.46,0.88,0.96,客观人格测验,0.46,0.85,0.97,兴趣测验,0.42,0.84,0.93,态度量表,0.47,0.79,0.98,心理测验技能,第68页,69,解释个人分数意义,测量标准误(SEm,SE),测量误差分布标准差,用来表示误差大小。,公式:,SE=S,x,1r,xx,S,x,分数标准差,r,xx,测验信度,举例:,已知WAIS-RC城市20岁组FIQ信度为0.95,求其测量标准误。,SE=1510.95,=150.224,=3.35,心理测验技能,第69页,70,测量标准误用途,确定真分数置信区间(可信区间),公式:,X,T,=XZSE,X 为某人详细得分,Z 置信区间概率水平,SE 测量标准误,举例:20岁城市男性在已知WAIS-RC全量表IQ为105,问95置信区间是多少?,从上例已知20岁组FIQ测量标准误为3.35,当置信区间概率水平为95时,Z为1.96,IQ=1051.963.2599111,比较不一样测验分数差异(离散分析),测量标准误在评价两个不一样测验分数差异是否含有统计学意义上显著性时非常主要,这种比较能够是两个人分数是否存在差异,也能够是同一被试两个测验分数,该内容留在智力测验结果分析时讲,心理测验技能,第70页,71,(四)影响信度(相关系数)原因,样本特征:,样本团体异质性,若计算信度样本较常模团体样本异质,往往会高估测验信度,相反则会低估测验信度,。,样本团体平均水平影响:对不一样水平团体,题目难度不一样,累积就会影响信度,心理测验技能,第71页,72,测验长度,测验长度,亦即测验条目数,也是影响信度系数一个原因。普通说来,增加同质条目能够提升测验信度。,假如咱们在预备试验中已知道某测验信度,希望提升至某一水平,能够利用斯皮尔曼,布朗公式计算出最少应增加多少条目。,公式:,K 指改变后长度为原长度倍数,r,kk,指期望到达信度水平,r,xx,指原信度系数,举例:,中国,韦氏幼儿智力量表(城市版)领悟力分测验有18个条目,平均分半信度为0.69。期望将其信度提升至0.80,问需要多少条目?,需要条目=181.79732,心理测验技能,第72页,73,测验难度,难度对信度影响,只存在于一些测验中,如智力测验,对无对错之分测验,不存在,难度与信度并无简单对应关心,测验时间间隔,只对重测信度和不一样时间测量复本信度有影响,其余信度不受影响,以再测法或复本法求信度,间隔时间越短,信度系数越大,时间越久,信度系数越低,心理测验技能,第73页,74,四、效度分析,(一)定义,效度,(validity),,在心理测验中是指所测量与所要测量心理特点之间吻合程度。,心理测验准确性,心理测验有效性(龚耀先),在编制或修订心理测验时,效度研究是必须步骤,效度资料是测验手册里必备测量学指标。,在使专心理测验时,没有效度资料测验也不能使用。,心理测验技能,第74页,75,效度性质,相对性:是对一定目标来说,连续性:用相关系数来表示,只有程度上不一样,心理测验技能,第75页,76,(二)效度类型与预计方法,内容效度(contentrelated validity),指测验条目对相关内容或行为取样实用性。换句话说,所选取条目是否能测到想要测量行为。,预计方法,教授判断法,请相关教授对条目进行审定,审定步骤,定义测验总体范围,描述相关知识与技能及所用材料起源。,编制双向细目表,确定各种内容所占百分比,标出每个条目设计所测内容。(见表),制订一个对应评定量表来评价效度,如测验包含内容、技能、材料主要程度、条目对内容实用性等。请每位评定者对各方面进行评价,然后总合全部评定者评价。,心理测验技能,第76页,77,高中化学标准测验双向细目表,识记,了解,应用,分析,综合,评定,累计,第一章,8,2,10,第二章,10,6,2,10,28,第三章,3,6,2,4,7,22,第四章,2,9,12,6,5,6,40,累计,5,25,28,14,22,6,100,心理测验技能,第77页,78,统计分析法,计算两个评审者之间一致性,克伦巴赫推荐方法:,先编出两个测验复本(取自一样内容范围),在同一组被试中实测,然后计算其相关。,再测法:,学习前先测验一次,学习后在测试一次,计算两次相关。,经验推测法,经过实践来检
展开阅读全文