1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一节 信度概述,一、信度的定义,(reliability),信度是指测量结果的稳定性程度。(测量结果的可靠性程度。可信度。),信度就是测验在测量它所测东西的一致性。或者说,就是同一测验先后测同一对象时所得分数的一致性。,信度系数是表示测量结果的稳定性程度的指标。记为:,信度系数的值域:0,1,二、信度的统计定义,信度是被试团体真分数方差与实得分数方差之比:,信度是被试团体真分数与实得分数相关系数的平方:,理论定义,操作定义,信度是一个测验X(A卷)与它的任意一个平行测验(B卷)的相关系数。,两组测验分数之
2、间的相关,二、信度的作用,信度是测量过程中所存在的随机误差大小的反映(评价测验好坏),标准化学绩或能力测验 0.9以上,人格测验 0.8以上,教师自编学绩测验 0.6以上,信度可以用来解释个人测验分数的意义测量标准误(用区间估计来表示真分数的范围),理论上:用一个测验对一个人测无数次,实测值的标准差即为标准误,造作上:用一组被试两次施测的结果之间的差异来表示,差异的分布为标准误,例题,某智力测验的信度为0.95,标准差为15,某儿童得分为120分,试估计真分数的范围。,SE=3.35,120-1.96*3.35,120+1.96*3.35,信度可以帮助进行不同测验分数的比较(一个人在不同测验上
3、的得分是否有显著差异),不同测验的原始分不能直接比较,转换成相同尺度的标准分数(Z分数或T分数),求标准误,求Z值,测验分数的比较与平均数差异显著性检验是一回事吗?,一、重测信度,含义,同一测验,同组对象,前后测2次,相关系数,稳定性,程序,误差,时间,太短,练习效应,记忆效应,A卷,一,定,时,距,A卷,太长,身心变化,优点,省力、省时,测量属性相同,提供随时间变化的资料,不足,适用范围,所测心理特质稳定,运动技能,速度,时间间隔长短,被试的积极性,评价,二、复本信度,两个平行测验测量同一批被试所得结果的一致性程度。(积差相关),等值性系数,测验A1 测验B1,等值稳定性系数,测验A1 测验
4、B1,最短时距,合适时距,等值性系数,含义,两等值测验,最短时间内,对同组对象,施测结果r,等值性,程序,误差,内容,取样,A卷,最,短,时,距,B卷,优点,代表性增强,信度更准,避免练习、记忆效应,不足,编制复本难,影响积极性,触类旁通,顺序效应,评价,等值稳定性系数,含义,两等值测验,一定时间内,对同组对象,施测结果r,等值性,稳定性,程序,误差,内容取样,时间,A卷,一,定,时,距,B卷,等值稳定性系数,反映题目间的差别、两次实测时的情境、被试特质水平方面的差异。,两个测验要具有更高的等值性,测验的时距要根据问题性质和测量目的来定,经费的问题,报告结果时,应报告间隔的时间,等值稳定性系数
5、与重测、等值性系数,谁得估计更严格,为何?,三、内部一致性信度,含义,测验,各题间,一致性,题目,一致性,是否测量,同一特性,分半,信度,类型,内容,取样,同质性,信度,(一)分半信度,将一个测验分成对等两半后,所有被试在这两半上所得分数的一致性程度。,只能测一次或没有副本的情况下使用,要把题目分成对等的两半(分半的方法不同,结果不同),公式,斯皮尔曼,-布朗公式,方差相等时,弗拉南根公式卢尤公式,方差不等时,(二)同质信度,同质性,题目间的内部一致性,类型,库-理信度,克龙巴赫,系数,0、1,题型,K-R20,难度不同,k-R21,难度相近,各类,题型,四、评分者信度,含义,评分者评分的一致
6、性,方法,2评分者,2个以上者,r,XY,r,肯德尔和谐系数,直接解释,真分数与实得分数相关的解释,r,XX,间接解释,信度系数,决定系数,r,2,XT,=S,T,/S,X,=r,XX,r,XX,为各方差的百分比,S,2,X,分为,各S,2,E,和S,2,T,误差源不同,信度估计法不同,r,XX,=0.90,信度系数和指数,例2-13:设有两平等的创造力测验,(A和B)。现:,1)间隔两月施测100人,其信度为0.70;,2)两卷分半信度校正值为0.80;,3)第2个评分者随机抽50份,信度0.92;,试问:,1)真分数的方差是多少?,2)各种信度的误差是多少?,间接解释范例,信度类型 r,X
7、X,重测复本 0.70,分半信度 0.80,评分者信度 0.92,总误差方差,真分数方差,分析结果,误差源,时间、内容,内容取样,评分者差异,两者之差,误差的方差,时间取样,1-0.70=0.3,1-0.80=0.2,0.3-0.2=0.1,0.2+0.1+0.08=0.38,1-0.38=0.62,1-0.92=0.08,典型测验的信度高低水平,测验类型,低 中 高,成套成就测验,学术能力测验,成套倾向性测验,客观人格测验,兴趣问卷,态度量表,.66 .92 .98,.56 .90 .97,.26 .88 .96,.46 .85 .97,.42 .84 .93,.47 .79 .98,各种信
8、度反映的误差来源比较,信度类型,误差来源,重测信度,等值性系数,等值稳定性系数,分半信度,同质性信度,评分者信度,时间,内容,时间和内容,内容,内容,评分者之间的差异,注意问题,以上方法仅适用于常模参照测验,目标参照测验要以概化理论为基础进行处理,以上方法仅适用于难度测验,速度测验的信度问题,目标参照测验的信度,前期目标预测测验和后期目标检测测验的比较,(第二次达标的人在第一次测试中达标的比例),一致性百分比法,(两次测验合格人数+两次测验不合格人数),/,测验总人数,第三节 提高测验信度的方法,一、影响测量信度的因素,影响测量信度的因素,施测间隔的时间,被试,主试,施测环境,测量工具,被试方
9、面,身心状况、应试动机、作答态度等,样本团体异质性的影响,样本团体平均能力水平的影响,特点,样本越异质,分数分布越广,S,r,测验越可靠,样本团体异质性的影响,分析,散点图,计算,散点图,整段范围,低,高,样本团体平均能力水平的影响,团体平均水平太高或太低,使测验分数的分布变窄,低估测量的信度,选择测验时应注意,取样团体的变异性和能力水平,建立信度的团体与欲测团体是否一致,测量工具,试题取样(题目太少,考察的不全面),试题之间的同质性程度,试题难度,智力的时间变化,间隔期 信度系数,同日或次日 0.900.95,1年 0.85,22.5年 0.80,5年 0.750.80,9年 0.78,时间间隔,二、提高测验信度的常用方法,提高测验信度的常用方法,规范施测程度、统一施测环境,适当增加测验的长度,控制试题的难度分布,努力提高每道题的区分度,维持测验的同质性,努力提高测验在被试中各个同质亚团体上的信度,保证被试有充裕的作答时间,严格控制评分误差,






