收藏 分销(赏)

教育测量.pptx

上传人:可**** 文档编号:881733 上传时间:2024-04-02 格式:PPTX 页数:122 大小:362.08KB
下载 相关 举报
教育测量.pptx_第1页
第1页 / 共122页
教育测量.pptx_第2页
第2页 / 共122页
点击查看更多>>
资源描述
教育测量教育测量课程内容课程内容第一章第一章 教育测量的基本原理教育测量的基本原理第二章第二章 测验的性质、种类和功能测验的性质、种类和功能第三章第三章 信度的理论定义、操作定义及其估计方法信度的理论定义、操作定义及其估计方法第四章第四章 效度的理论定义、操作定义及其估计方法效度的理论定义、操作定义及其估计方法第五章第五章 测题分析测题分析第六章第六章 测验量表和常模测验量表和常模第七章第七章 测验编制的步骤和方法测验编制的步骤和方法第八章第八章 测验例举测验例举教育测量教育测量课程考核课程考核总评成绩由总评成绩由平时成绩平时成绩考试成绩考试成绩组成组成平时成绩占平时成绩占20,包括考勤和作业。,包括考勤和作业。考试成绩占考试成绩占80,闭卷考试,时间为,闭卷考试,时间为2小时,小时,可以使用计算器。可以使用计算器。第一章第一章 教育测量的基本原理教育测量的基本原理一、测量的概念一、测量的概念1、测量的定义、测量的定义测量测量根据法则给事物分派数字。(史根据法则给事物分派数字。(史蒂文斯,蒂文斯,1951)例例1:测量学生体重:测量学生体重 测量的属性:测量的属性:“体重体重”规则:规则:“身穿极少量衣服,赤脚自然地站身穿极少量衣服,赤脚自然地站在体重计上在体重计上”用来描述学生体重的数:用来描述学生体重的数:体重计上指示的体重计上指示的“数字数字”例例2:评定学生道德品德:评定学生道德品德2、测量的三要素、测量的三要素事物的属性事物的属性测量的对象测量的对象 物理属性:物理属性:长度、重量、体积、温度、时长度、重量、体积、温度、时间等间等 心理属性:心理属性:智力、个性、能力、知识、技智力、个性、能力、知识、技能、态度、兴趣等能、态度、兴趣等数字数字描述事物属性的符号描述事物属性的符号 同一性和区分性:同一性和区分性:每一个数的独特性每一个数的独特性 等级性或位次性:等级性或位次性:若干个数之间按其大小若干个数之间按其大小所形成的次序关系所形成的次序关系 等距性等距性 等比性等比性规则规则给事物的属性分派数字的依据给事物的属性分派数字的依据 规则是指导我们如何测量的一种准则或方法。规则是指导我们如何测量的一种准则或方法。当测量的其他条件相同时,使用不同的规则,当测量的其他条件相同时,使用不同的规则,会产生不同的测量效果。会产生不同的测量效果。规则的好坏,取决于制定规则的程序和所欲规则的好坏,取决于制定规则的程序和所欲测量的事物属性本身测量的事物属性本身 是否易于建立规则和便是否易于建立规则和便于操作规则于操作规则二、教育测量二、教育测量1、教育测量的定义、教育测量的定义广义教育测量广义教育测量就是对于教育领域内的事就是对于教育领域内的事物或现象,根据一定的客观标准,作缜密的物或现象,根据一定的客观标准,作缜密的考核,并依据一定的规则将考核的结果予以考核,并依据一定的规则将考核的结果予以数量的描述。数量的描述。狭义教育测量狭义教育测量是指对学生某些学科经过是指对学生某些学科经过学习和训练之后,所获得的知识、技能的测学习和训练之后,所获得的知识、技能的测量。量。2、教育测量的两要素、教育测量的两要素参照点参照点人为指定的相对零点人为指定的相对零点单位单位无统一单位,也不符合等距要无统一单位,也不符合等距要求求三、教育测量的可能性三、教育测量的可能性凡物之存在必有其数量凡物之存在必有其数量(桑代克,(桑代克,1918)凡有数量的现象都可以测量凡有数量的现象都可以测量(麦柯尔,(麦柯尔,1923)四、教育测量的特点四、教育测量的特点间接性间接性相对性相对性五、四种测量量表五、四种测量量表广义量表广义量表(scale)任何可以使事物数量化任何可以使事物数量化的值和量的渐进系列。的值和量的渐进系列。测量的本质是根据某一法则将事物数量化测量的本质是根据某一法则将事物数量化,即在一个定有参照点和单位的连续体上把即在一个定有参照点和单位的连续体上把事物的属性表现出来事物的属性表现出来,这个连续体即为量表这个连续体即为量表.只要将预测的事物属性放在这个连续体的只要将预测的事物属性放在这个连续体的适当位置上适当位置上,看它们距离参照点的远近看它们距离参照点的远近,便会便会得到一个测量值得到一个测量值.1、名称量表、名称量表名称是测量中最简单的形式,即分类。名称是测量中最简单的形式,即分类。在名称量表中,用来描述事物的数字仅仅是在名称量表中,用来描述事物的数字仅仅是代表事物的符号,只能区分事物的类别。代表事物的符号,只能区分事物的类别。适用的统计方法:比率、百分比、适用的统计方法:比率、百分比、相关系相关系数,数,2检验。检验。2、等级(位次)量表、等级(位次)量表按某一标准对事物的属性进行分类,用来按某一标准对事物的属性进行分类,用来描述各个类别的数字不仅具有区分性,而描述各个类别的数字不仅具有区分性,而且还具有等级性,用这样的数字表示的量且还具有等级性,用这样的数字表示的量表称为等级量表或位次量表。表称为等级量表或位次量表。量表上的数字不能进行加减乘除运算。量表上的数字不能进行加减乘除运算。适用的统计方法:中位数、百分位数、等适用的统计方法:中位数、百分位数、等级相关系数、肯德尔和谐系数、符号检验、级相关系数、肯德尔和谐系数、符号检验、秩次检验、秩次方差分析。秩次检验、秩次方差分析。3、等距量表、等距量表有相等单位和人定参照点的量表称为等距有相等单位和人定参照点的量表称为等距量表。量表。量表上的数值不仅具有区分性、等级性,量表上的数值不仅具有区分性、等级性,还有等距性。还有等距性。可以作加减运算,但不能作乘除运算。可以作加减运算,但不能作乘除运算。适用的统计方法:算数平均数、标准差、适用的统计方法:算数平均数、标准差、积差相关系数、积差相关系数、Z检验、检验、t检验、检验、F检验。检验。4、比率(等比)量表、比率(等比)量表有相等单位和绝对零点的量表称为比率量有相等单位和绝对零点的量表称为比率量表。表。量表上的数值可以进行加减乘除运算。量表上的数值可以进行加减乘除运算。适用的统计方法:算数平均数、标准差、适用的统计方法:算数平均数、标准差、积差相关系数、积差相关系数、Z检验、检验、t检验、检验、F检验、几检验、几何平均数、差异系数。何平均数、差异系数。六、教育测量的量表属性六、教育测量的量表属性教育测量中上述四种量表都有。教育测量中上述四种量表都有。心理(知识、技能)测验多属于等级量表。心理(知识、技能)测验多属于等级量表。通常仍将测验分数作为等距量表来处理:通常仍将测验分数作为等距量表来处理:第二章第二章 测验的性质、种类和功能测验的性质、种类和功能一、测验的概念一、测验的概念1、测验的定义、测验的定义心理测验心理测验是一种对行为样本的客观和标准化是一种对行为样本的客观和标准化的测量(阿纳斯塔西,的测量(阿纳斯塔西,1967)广义心理测验包括智力、人格、能力倾向、学业成广义心理测验包括智力、人格、能力倾向、学业成就等测验。就等测验。教育测验主要是学业成就测验,所以该定义也适用教育测验主要是学业成就测验,所以该定义也适用于教育测验。于教育测验。2、测验的三要素、测验的三要素行为样本行为样本测验的标准化测验的标准化测验的客观性测验的客观性二、行为样本二、行为样本行为样本行为样本对于所欲测量的心理属对于所欲测量的心理属性具有代表性的一组行为反应。性具有代表性的一组行为反应。三、测验的标准化三、测验的标准化测验的标准化测验的标准化测验的编制、实施、测验的编制、实施、记分、分数的解释都按照统一的标准记分、分数的解释都按照统一的标准和严格的规定进行,使所有被试的测和严格的规定进行,使所有被试的测验条件一致。包括四方面:验条件一致。包括四方面:测验材料的标准化测验材料的标准化测验实施的标准化测验实施的标准化评分、记分的标准化评分、记分的标准化测验分数解释的标准化测验分数解释的标准化四、测验评价的客观性四、测验评价的客观性信度信度效度效度难度难度区分度区分度五、测验误差的来源五、测验误差的来源1、测验本身、测验本身测题本身的代表性测题本身的代表性测题的数量测题的数量测题的种类测题的种类2、测验实施、测验实施测验情境测验情境主试的影响主试的影响意外干扰意外干扰3、被试状态、被试状态生理状况生理状况情绪状况情绪状况练习因素练习因素六、标准化测验准备和实施六、标准化测验准备和实施中应注意的问题中应注意的问题(一)测验的准备(一)测验的准备1、主试准备、主试准备2、测验环境准备、测验环境准备房间房间座位座位材料材料人物人物3、被试准备、被试准备时间选择时间选择主试与被试建立和睦关系主试与被试建立和睦关系(二)测验的实施(二)测验的实施测验前期工作测验前期工作测题的选定测题的选定记录记录正确对待被试的要求正确对待被试的要求主试注意事项主试注意事项(三)测验结果解释(三)测验结果解释被试测验前后的行为是否一致被试测验前后的行为是否一致被试在强项和弱项测验内容方面的表现被试在强项和弱项测验内容方面的表现被试的测验行为是不是一般行为,即测验被试的测验行为是不是一般行为,即测验表现是否代表在校或在家的行为表现是否代表在校或在家的行为评定测验成绩一般不要采用绝对化的语言,评定测验成绩一般不要采用绝对化的语言,应该综合其他评定量表或评判标准作综合应该综合其他评定量表或评判标准作综合界定界定七、测验的种类七、测验的种类1、根据测量的属性、根据测量的属性智力测验智力测验能力倾向测验能力倾向测验人格测验人格测验教育测验教育测验2、根据测验的标准化程度、根据测验的标准化程度标准化测验标准化测验教师自编测验教师自编测验3、根据测验的功能、根据测验的功能普通测验和诊断测验普通测验和诊断测验难度测验和速度测验难度测验和速度测验预测测验和成绩测验预测测验和成绩测验4、根据记分标准、根据记分标准常模参照测验常模参照测验标准参照测验标准参照测验5、根据同时受测的人数、根据同时受测的人数个别测验个别测验团体测验团体测验6、根据测验所用的材料和形式、根据测验所用的材料和形式语言或文字测验语言或文字测验非语言文字测验非语言文字测验八、测验的功能八、测验的功能了解个别差异了解个别差异检查和巩固学习检查和巩固学习辨别智愚和分类安置辨别智愚和分类安置选拔人才选拔人才对比实验对比实验考查学习努力程度考查学习努力程度预测能力预测能力指导就业指导就业课程评价课程评价第三章第三章 信度的理论定义、操作信度的理论定义、操作定义及其估计方法定义及其估计方法第一节第一节 信度的理论定义和操作信度的理论定义和操作定义定义一、信度的理论定义一、信度的理论定义1、信度与误差的关系、信度与误差的关系(1)一般统计资料的三种误差)一般统计资料的三种误差抽样误差抽样误差测量误差测量误差系统误差系统误差(2)信度与误差的关系)信度与误差的关系抽样误差可以忽略不计抽样误差可以忽略不计系统误差影响不大系统误差影响不大测量误差是影响信度的主要原因测量误差是影响信度的主要原因2、信度的理论定义、信度的理论定义测验分数都包括两个部分:真分数测量测验分数都包括两个部分:真分数测量误差误差信度是一组测验分数中真分数方差与获得信度是一组测验分数中真分数方差与获得分数方差的比率。分数方差的比率。真分数理论的三个假设:真分数理论的三个假设:误差分数的平均数等于零误差分数的平均数等于零 误差分数与真分数之间无相关误差分数与真分数之间无相关 两次测量的误差分数之间相关为零两次测量的误差分数之间相关为零二、信度的操作定义二、信度的操作定义信度是同一个测验(或相等的两个、多个信度是同一个测验(或相等的两个、多个测验)对同一组被试实施两次或多次,所测验)对同一组被试实施两次或多次,所得结果的一致性程度,也即测验的可靠性。得结果的一致性程度,也即测验的可靠性。测验的信度以两次测验结果的相关系数表测验的信度以两次测验结果的相关系数表示。示。第二节第二节 再测信度再测信度一、再测信度及其估计方法一、再测信度及其估计方法1、再测信度的定义、再测信度的定义再测信度再测信度以同一个测验对同一组被试以同一个测验对同一组被试先后实施两次,所得结果的相关系数。先后实施两次,所得结果的相关系数。若对同一组被试先后实施多次,可用每两若对同一组被试先后实施多次,可用每两次测验结果的相关系数之平均数来表示。次测验结果的相关系数之平均数来表示。再测信度又称为稳定系数再测信度又称为稳定系数2、再测信度的估计方法、再测信度的估计方法用原始数据计算用原始数据计算用样本平均数和样本标准差计算用样本平均数和样本标准差计算用样本平均数和总体标准差的估计值计算用样本平均数和总体标准差的估计值计算某算术运算速度两次测验分数某算术运算速度两次测验分数学生序号学生序号第一次测验第一次测验第二次测验第二次测验120202202132121422205232362323723258242592526102626112627122729总和总和280286二、再测信度的优缺点二、再测信度的优缺点优点优点缺点缺点三、再测信度的适用范围三、再测信度的适用范围异质性测验异质性测验速度测验速度测验运动技能测验运动技能测验第三节第三节 复本信度复本信度一、复本信度及其估计方法一、复本信度及其估计方法1、复本信度的定义、复本信度的定义复本信度复本信度等值性的两个测验对同一组被等值性的两个测验对同一组被试实施结果的一致性程度。试实施结果的一致性程度。复本测验是指在性质、内容、题型、题数、复本测验是指在性质、内容、题型、题数、难度等方面都一致或相等的两个或多个测难度等方面都一致或相等的两个或多个测验。验。若复本的个数在两个以上,可用每两个复本测验若复本的个数在两个以上,可用每两个复本测验结果的相关系数之平均数来表示。结果的相关系数之平均数来表示。复本信度系数分等值系数和稳定等值系数两种复本信度系数分等值系数和稳定等值系数两种2、复本信度的估计方法、复本信度的估计方法用原始数据计算用原始数据计算用样本平均数和样本标准差计算用样本平均数和样本标准差计算用样本平均数和总体标准差的估计值计算用样本平均数和总体标准差的估计值计算学学生生序序号号12345678910 总总和和第第一一次次19 191817161515141312 158第第二二次次20 171818171513151212 157二、复本信度的优缺点二、复本信度的优缺点优点优点缺点缺点三、复本信度的适用范围三、复本信度的适用范围是考察测验可靠性的最好方法是考察测验可靠性的最好方法第四节第四节 内在一致性信度内在一致性信度一、内在一致性信度及其估计方法一、内在一致性信度及其估计方法再测信度:再测信度:测验在不同时间的一致性测验在不同时间的一致性复本信度:复本信度:测验的两种不同形式的一致性测验的两种不同形式的一致性内在一致性信度:内在一致性信度:测验内部(测题之间的测验内部(测题之间的一致性)一致性)(一)分半信度(一)分半信度斯皮尔曼布朗公式矫正法斯皮尔曼布朗公式矫正法卢农公式矫正法卢农公式矫正法弗拉南根公式矫正法弗拉南根公式矫正法(二)同质性信度(二)同质性信度0、1记分测验的同质性信度记分测验的同质性信度非非0、1记分测验的同质性信度记分测验的同质性信度二、内在一致性信度的优缺点二、内在一致性信度的优缺点优点优点缺点缺点三、内在一致性信度的适用范围三、内在一致性信度的适用范围同质性测验同质性测验难度测验难度测验第五节评分者信度第五节评分者信度一、评分者信度的定义一、评分者信度的定义评分者信度是指多位评分者对同一组被试评分者信度是指多位评分者对同一组被试作答反应评分的一致性程度作答反应评分的一致性程度二、评分者信度的估计方法二、评分者信度的估计方法积差相关或等级相关估计法积差相关或等级相关估计法系数估计法系数估计法肯德尔和谐系数估计法肯德尔和谐系数估计法信度估计方法的总结信度估计方法的总结信度信度系数系数类型类型再测再测信度信度复本信复本信度(连度(连续)续)复本复本信度信度(间(间隔)隔)分半分半信度信度同质同质性信性信度度评分评分者信者信度度信度信度系数系数性质性质跨时跨时间间跨形式跨形式 跨时跨时间和间和形式形式跨项目或两个跨项目或两个分半测验分半测验跨评跨评分者分者误差误差方差方差来源来源时间时间取样取样内容取内容取样样时间时间和内和内容取容取样样内容内容取样取样内容内容的异的异质性质性评分评分者之者之间差间差异异第四章第四章 效度的操作定义及其估效度的操作定义及其估计方法计方法效度效度一个测验对其所欲测量的属性能一个测验对其所欲测量的属性能够确实测到的程度,即测验的正确性。够确实测到的程度,即测验的正确性。根据美国心理学会的标准,测验的效度分根据美国心理学会的标准,测验的效度分为三大类:为三大类:效标关联效度效标关联效度内容效度内容效度结构效度结构效度效度的相对性效度的相对性一个测验的有效性,总是就其特殊的目的、一个测验的有效性,总是就其特殊的目的、功能和适用范围而言的,并不是就任何目的、功能和适用范围而言的,并不是就任何目的、功能和任何适用范围而言的。功能和任何适用范围而言的。按照特定的目的精心编制的测验,其效度不按照特定的目的精心编制的测验,其效度不是全有全无的区别,只是程度上的不同。是全有全无的区别,只是程度上的不同。第一节第一节 效标关联效度效标关联效度一、效标关联效度的概念一、效标关联效度的概念效标关联效度是指以某一种测验分数与其效效标关联效度是指以某一种测验分数与其效标分数之间的相关来表示的效度,又称为统标分数之间的相关来表示的效度,又称为统计效度。计效度。效标效标指确能显示或反映所欲测量的属性指确能显示或反映所欲测量的属性的变量。是考察检定测验效度的参照标准。的变量。是考察检定测验效度的参照标准。智力测验效标智力测验效标学科成绩、教师评定等学科成绩、教师评定等级、受教育年限、年龄等。级、受教育年限、年龄等。能力倾向测验效标能力倾向测验效标特殊能力或特殊训特殊能力或特殊训练的成绩练的成绩教育测验效标教育测验效标相应的学科成绩或教师相应的学科成绩或教师的等级评定的等级评定职业兴趣测验职业兴趣测验实际工作成绩或记录实际工作成绩或记录同时效度和预测效度同时效度和预测效度根据获得测验分数和效标分数的时间关系,根据获得测验分数和效标分数的时间关系,可以将效标关联效度分为同时效度和预测可以将效标关联效度分为同时效度和预测效度。效度。同时效度同时效度以测验分数与现有效标分数以测验分数与现有效标分数之间的相关表示的效度。之间的相关表示的效度。预测效度预测效度以被试的测验分数与其未来以被试的测验分数与其未来效标分数之间相关表示的效度。效标分数之间相关表示的效度。二、效标关联效度系数的计算二、效标关联效度系数的计算测验分数与效标分数之间的相关系数称为测验分数与效标分数之间的相关系数称为效标关联效度系数。效标关联效度系数。1、积差相关法、积差相关法当测验分数和效标分数均为正态连续变量当测验分数和效标分数均为正态连续变量时采用时采用2、二列相关法、二列相关法当测验分数和效标分数均为正态连续变量,当测验分数和效标分数均为正态连续变量,而其中一个变量被人为地分成二分变量时。而其中一个变量被人为地分成二分变量时。3、点二列相关法、点二列相关法当测验分数和效标分数其中一个变量为连续当测验分数和效标分数其中一个变量为连续变量,而另一个为真正的二分变量或双峰分变量,而另一个为真正的二分变量或双峰分布变量时。布变量时。4、等级相关法、等级相关法当测验成绩和效标成绩两个都(或其中一个)当测验成绩和效标成绩两个都(或其中一个)以等级次序排列或以等级次序表示时。以等级次序排列或以等级次序表示时。5、四分相关及、四分相关及相关法相关法当测验成绩和效标成绩都是二分变量或以当测验成绩和效标成绩都是二分变量或以二分变量表示时。二分变量表示时。6、列联相关、列联相关当测验和效标成绩中有一个不止分为两个当测验和效标成绩中有一个不止分为两个类别时。类别时。第二节第二节 内容效度和结构效度内容效度和结构效度一、内容效度一、内容效度1、概念及意义、概念及意义内容效度内容效度指测验内容对所要测量的内容的代指测验内容对所要测量的内容的代表性程度。表性程度。2、建立过程、建立过程3、检定方法、检定方法(1)逻辑判断法)逻辑判断法一般由本学科的专家根据所欲测量属性的定义和一般由本学科的专家根据所欲测量属性的定义和测量内容范围的界定,以及各部分内容,各认识测量内容范围的界定,以及各部分内容,各认识层次的比重,用逻辑分析的方法对策得体性能是层次的比重,用逻辑分析的方法对策得体性能是否能代拨所欲测量的内容及教育目标作出判断。否能代拨所欲测量的内容及教育目标作出判断。(2)比较平均数差异的显著性)比较平均数差异的显著性对同一组被试用一个测验的两个复本在某对同一组被试用一个测验的两个复本在某一学科教学或训练前后实施测验,根据两一学科教学或训练前后实施测验,根据两次测验成绩差异的显著性来判断该测验内次测验成绩差异的显著性来判断该测验内容的有效性。容的有效性。(3)相关法)相关法用反映同一内容的两个不同测验对同一组用反映同一内容的两个不同测验对同一组被试施测结果的相关系数表示。被试施测结果的相关系数表示。4、提高内容效度的方法、提高内容效度的方法增加测题的同质性增加测题的同质性专家小组平行作业法专家小组平行作业法多人裁判法多人裁判法5、表面效度、表面效度表面效度表面效度指测验在表面上使被试直觉感指测验在表面上使被试直觉感到的有效性程度。到的有效性程度。为了使测验具有表面效度,必须根据测验的为了使测验具有表面效度,必须根据测验的性质、被试的年龄和知识背景来选择测验材性质、被试的年龄和知识背景来选择测验材料和习惯用语。料和习惯用语。表面效度不是测验的真正效度。表面效度不是测验的真正效度。二、结构效度二、结构效度1、概念、概念指测验对于人的假设属性或理论概念测量指测验对于人的假设属性或理论概念测量到的程度。到的程度。2、建立过程、建立过程对所欲测量的属性根据某种理论提出假定对所欲测量的属性根据某种理论提出假定的结构的结构根据假定的结构拟定测题和编制测验根据假定的结构拟定测题和编制测验寻求测验分数与其它评定之间的关系寻求测验分数与其它评定之间的关系根据测验结构来验证假设结构中的各种因根据测验结构来验证假设结构中的各种因素是否成立素是否成立修改测验,重新实施有关步骤修改测验,重新实施有关步骤3、检定方法、检定方法用内容效度为结构效度提供证据用内容效度为结构效度提供证据用相容效度来确定结构效度用相容效度来确定结构效度 相容效度相容效度一个新编的尚待确定其结构的测验与一个新编的尚待确定其结构的测验与另一个已知其结构的测验共同测量相同结构的程度。另一个已知其结构的测验共同测量相同结构的程度。多元特质与多重方法矩阵多元特质与多重方法矩阵 辐合效度辐合效度用多种方法对同一种特质进行测量,用多种方法对同一种特质进行测量,所得结果具有高相关。所得结果具有高相关。辨别效度辨别效度用同一种方法对多种不同特质进行测用同一种方法对多种不同特质进行测量,所得结果的相关低于用多种方法测量同一种特量,所得结果的相关低于用多种方法测量同一种特质的相关。质的相关。三、效度系数的显著性检验三、效度系数的显著性检验积差相关系数表示的效度系数之检验积差相关系数表示的效度系数之检验检验和检验检验和检验第五章 测题分析第一节 测题的难度一、测题难度的概念测题难度指测题的难易程度测题难度指测题的难易程度表示测题难易程度的数量称为测题的表示测题难易程度的数量称为测题的难度指数,用难度指数,用P表示。表示。二、测题难度的估计(一)(一)0、1记分测题难度的估计记分测题难度的估计1、PR/n(所有被试该题答对的人数比率)(所有被试该题答对的人数比率)2、P(PH PL)/2(高分组和低分组答对(高分组和低分组答对人数比率的平均数)人数比率的平均数)(二)(二)0、1记分多重选择题难度的校正记分多重选择题难度的校正 CP(kP1)/(k1)如果要比较两个选项数目不同的测题难度,如果要比较两个选项数目不同的测题难度,必须先用此公式对两测题的难度进行校正。必须先用此公式对两测题的难度进行校正。(三)非(三)非0、1记分测题难度的估计记分测题难度的估计P所有被试该题得分的平均数所有被试该题得分的平均数/该题满分该题满分分数分数三、难度的评价1、0、1记分测题的平均数和标准差记分测题的平均数和标准差每个测题得分的平均数就是其难度指数每个测题得分的平均数就是其难度指数P每个测题得分的标准差为每个测题得分的标准差为 pq2、测题难度的理论评价、测题难度的理论评价测题方差的大小表示测题对被试反应的鉴测题方差的大小表示测题对被试反应的鉴别能力别能力中等难度(即难度指数中等难度(即难度指数P0.5)的测题鉴)的测题鉴别力最好别力最好3、测题难度的选择、测题难度的选择测验中各测题难度的选择与测验的性质和目的有测验中各测题难度的选择与测验的性质和目的有关。关。对于测量某门学科知识或技能掌握程度的测验来对于测量某门学科知识或技能掌握程度的测验来说,测验中大部分测题难度指数说,测验中大部分测题难度指数P分布在分布在0.350.65为宜,所有测题难度指数的平均数在为宜,所有测题难度指数的平均数在0.5左右左右为宜。为宜。如果测验的目的在于选拔人才,测题难度指数的如果测验的目的在于选拔人才,测题难度指数的平均数应根据录取率而定。平均数应根据录取率而定。如果测验的目的在于测量速度,则要求所有的测如果测验的目的在于测量速度,则要求所有的测题难度指数接近相等。题难度指数接近相等。测题难度还应该考虑接受测验的对象。测题难度还应该考虑接受测验的对象。第二节 测题的区分度和效度一、测题的区分度(一)区分度的概念(一)区分度的概念测题的区分度指测题对于被试反应的区分程度和测题的区分度指测题对于被试反应的区分程度和鉴别能力。鉴别能力。区分度一般用某测题的得分与测验总分之间的相区分度一般用某测题的得分与测验总分之间的相关系数来表示。关系数来表示。(二)测题区分度的估计(二)测题区分度的估计1、0、1记分测题区分度的估计记分测题区分度的估计分组法:鉴别指数分组法:鉴别指数D PH PL 点二列相关法点二列相关法二列相关法二列相关法2、非、非0、1记分测题区分度的估计记分测题区分度的估计积差相关法积差相关法二、测题的效度(一)测题效度的概念(一)测题效度的概念测题效度是指测题分数与外部效标分数的测题效度是指测题分数与外部效标分数的相关程度。相关程度。测题的效度对测验的效度有很大的贡献。测题的效度对测验的效度有很大的贡献。如果把测验总分视为内部效标,测题的区如果把测验总分视为内部效标,测题的区分度就是测题的内部效标效度。分度就是测题的内部效标效度。从测题效度对被试反应的鉴别能力来说,从测题效度对被试反应的鉴别能力来说,它也是一种区分度。它也是一种区分度。(二)测题效度的估计方法(二)测题效度的估计方法凡是可以用来估计测题区分度的方法都可凡是可以用来估计测题区分度的方法都可以用来估计测题的效度,只是将内部效标以用来估计测题的效度,只是将内部效标换成了外部效标而已。换成了外部效标而已。可以采用二列相关、点二列相关、积差相可以采用二列相关、点二列相关、积差相关等。关等。三、测题区分度和效度的评价测题区分度和效度的取值范围都是测题区分度和效度的取值范围都是-11之之间。间。如果区分度或效度为正值,其数值越大,如果区分度或效度为正值,其数值越大,则测题越好。则测题越好。测题鉴别指数评鉴测题鉴别指数评鉴鉴别指数鉴别指数D评鉴评鉴0.40以上以上非常好非常好0.300.39良好,最好修改良好,最好修改0.200.29尚可,仍需修改尚可,仍需修改0.19以下以下差,必须淘汰差,必须淘汰如果测验的目的在于评定学生的学习成绩,如果测验的目的在于评定学生的学习成绩,而且测验是同质性的,则应选择区分度作而且测验是同质性的,则应选择区分度作为评价指标。为评价指标。如果测验的目的在于预测被试未来的表现,如果测验的目的在于预测被试未来的表现,则应选择测题的效度作为评价指标。则应选择测题的效度作为评价指标。第六章 测验量表和常模第一节 测验分数的解释一、测验分数与所测属性的关系对于人类心理属性的测量很少有绝对的测对于人类心理属性的测量很少有绝对的测度度测验分数相同的增量很难代表相同的心理测验分数相同的增量很难代表相同的心理增量增量二、原始分数和导出分数原始分数原始分数根据测验的记分标准,对被根据测验的记分标准,对被试的测验结果所计算出的测验分数。试的测验结果所计算出的测验分数。对于同一个学生不同学科的原始分数,由对于同一个学生不同学科的原始分数,由于缺乏参照点和一定的单位,所以既不能于缺乏参照点和一定的单位,所以既不能相互比较,也不能相加求和。相互比较,也不能相加求和。导出分数导出分数经过统计整理的,具有一定经过统计整理的,具有一定参照点和单位的,可以相互比较的分数。参照点和单位的,可以相互比较的分数。常用的导出分数有百分等级、标准分数、常用的导出分数有百分等级、标准分数、年级等值分数、年龄等值分数。年级等值分数、年龄等值分数。对一个标准化样本施行某一个测验之后,对一个标准化样本施行某一个测验之后,将所获得的原始分数以常模(平均数)为将所获得的原始分数以常模(平均数)为参照点转换成某种导出分数,并以等值表参照点转换成某种导出分数,并以等值表的形式将原始分数与导出分数之间的对应的形式将原始分数与导出分数之间的对应值表示出来,这就是测验量表。值表示出来,这就是测验量表。常用的测验量表有百分等级量表,标准分常用的测验量表有百分等级量表,标准分量表、年级量表和年龄量表。量表、年级量表和年龄量表。三、常模与标准常模常模某年级、某年龄或具有某种共同某年级、某年龄或具有某种共同特征的被试团体在某一测验上实际达到的特征的被试团体在某一测验上实际达到的平均水平。平均水平。常模是一个相对的数量,不适一种绝对的、常模是一个相对的数量,不适一种绝对的、永久性的、固定不变的标准。它会随着时永久性的、固定不变的标准。它会随着时间和空间的不同而变化。间和空间的不同而变化。标准化样本标准化样本对于使用某测验的总体具对于使用某测验的总体具有代表性的那部分个体。有代表性的那部分个体。标准标准某年级、某年龄或具有某种共同某年级、某年龄或具有某种共同特征的被试团体在某一测验上应当达到的特征的被试团体在某一测验上应当达到的水准。水准。第二节 百分等级量表一、百分等级量表的含义百分等级量表百分等级量表以标准化样本测验分数以标准化样本测验分数的中位数为参照点,以百分等级(百分位)的中位数为参照点,以百分等级(百分位)为单位的测验量表。为单位的测验量表。与百分等级相对应的原始分数称为该百分与百分等级相对应的原始分数称为该百分等级的百分位数。等级的百分位数。根据标准化样本的测验分数计算出各相应根据标准化样本的测验分数计算出各相应的百分位数,即建立百分等级与原始分数的百分位数,即建立百分等级与原始分数的等值对照表,即为百分等级量表。的等值对照表,即为百分等级量表。二、百分等级量表的评价(一)优点(一)优点百分等级量表上的等级的意义容易被人理解。百分等级量表上的等级的意义容易被人理解。同一被试在不同测验上的百分等级可以相互同一被试在不同测验上的百分等级可以相互比较。比较。不同被试在同一测验上的百分等级可以相互不同被试在同一测验上的百分等级可以相互比较。比较。在较高层次的学校中,当年龄或年级量表不在较高层次的学校中,当年龄或年级量表不甚适用时,可采用百分量表。甚适用时,可采用百分量表。百分等级可转换成标准分数。百分等级可转换成标准分数。(二)缺点(二)缺点百分等级的单位距离不相等。百分等级的单位距离不相等。在百分等级量表上,靠近分布中央的原始在百分等级量表上,靠近分布中央的原始分数稍有变化,其百分等级就会有较大的分数稍有变化,其百分等级就会有较大的变化。而靠近分布两端的原始分数,虽然变化。而靠近分布两端的原始分数,虽然变化较大,其百分等级却变化较小。变化较大,其百分等级却变化较小。百分等级量表属于四种测量量表种的等级百分等级量表属于四种测量量表种的等级或位次量表或位次量表两个不同样本中的百分等级不能相互比较两个不同样本中的百分等级不能相互比较百分等级量表对测验成绩的普遍水平不够百分等级量表对测验成绩的普遍水平不够敏感,与敏感,与T量表相比,其可靠性较差。量表相比,其可靠性较差。第三节 线性标准分数量表标准分数量表是以平均分数为参照点,以标准分数量表是以平均分数为参照点,以标准差为单位的测验量表,其量表值称为标准差为单位的测验量表,其量表值称为标准分数。标准分数。线性标准分数就是由原始分数转换成标准线性标准分数就是由原始分数转换成标准分数之后,只改变了分布的平均数和标准分数之后,只改变了分布的平均数和标准差,并不改变分布的形态。差,并不改变分布的形态。常见的线性标准分数有线性常见的线性标准分数有线性Z分数、线性分数、线性CEEB分数、线性分数、线性ITED分数、线性分数、线性T分数。分数。一、线性Z分数量表(一)线性(一)线性Z分数的含义分数的含义线性线性Z分数是以平均数为分数是以平均数为0,标准差为,标准差为1的标准分的标准分数。数。线性线性Z分数量表是线性分数量表是线性Z分数与原始分数的等值对分数与原始分数的等值对照表。照表。(二)线性(二)线性Z分数量表的编制方法分数量表的编制方法根据标准化样本中每个被试测验的原始分数,计根据标准化样本中每个被试测验的原始分数,计算其平均数及标准差。算其平均数及标准差。根据公式计算原始分数全距中每一个原始分数的根据公式计算原始分数全距中每一个原始分数的线性线性Z分数。分数。(三)线性(三)线性Z分数量表的评价分数量表的评价1、优点、优点线性线性Z分数的单位是等距的。分数的单位是等距的。如果几个不同测验分数的分布形态是很相近如果几个不同测验分数的分布形态是很相近的,那么同一个被试在几个不同测验上的线的,那么同一个被试在几个不同测验上的线性性Z分数可以相互比较。分数可以相互比较。如果几个不同测验分数的分布形态是很相近如果几个不同测验分数的分布形态是很相近的,可以将一个被试几个不同测验上的线性的,可以将一个被试几个不同测验上的线性Z分数相加求和,或计算几个测验线性分数相加求和,或计算几个测验线性Z分数分数的平均数,同时还可以比较不同被试几个线的平均数,同时还可以比较不同被试几个线性性Z分数的总分或平均数。分数的总分或平均数。2、缺点、缺点小于平均数的原始分数转换成线性小于平均数的原始分数转换成线性Z分数后分数后都是负值,这既不容易理解,也不便于运都是负值,这既不容易理解,也不便于运算。算。标准化样本,线性标准化样本,线性Z分数的全距一般不超过分数的全距一般不超过6个单位,由于单位太大,难以区分个别被个单位,由于单位太大,难以区分个别被试测验成绩的差异,若要精确地区分个别试测验成绩的差异,若要精确地区分个别被试的差异,线性被试的差异,线性Z分数的值在小数点后必分数的值在小数点后必须保留一到两位数字,这也不便于运算。须保留一到两位数字,这也不便于运算。线性线性Z分数的分布形态与原始分数的分布形分数的分布形态与原始分数的分布形态完全一样。当两个测验的分布形态不同态完全一样。当两个测验的分布形态不同时,它们的线性时,它们的线性Z分数既不可以相互比较,分数既不可以相互比较,又不可以相加求和。又不可以相加求和。二、线性CEEB量表(一)线性(一)线性CEEB分数的意义及其量表的编制分数的意义及其量表的编制CEEB分数是平均数为分数是平均数为500,标准差为,标准差为100的的线性标准分数。线性标准分数。CEEB100Z500线性线性CEEB分数量表是线性分数量表是线性CEEB分数与原分数与原始分数的等值对照表。始分数的等值对照表。先将原始分数全距中每一个原始分数转换成先将原始分数全距中每一个原始分数转换成线性线性Z分数。分数。再利用上述公式将每个线性再利用上述公式将每个线性Z分数转换成线分数转换成线性性CEE
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服