收藏 分销(赏)

第五章-教育测量研究ppt.ppt

上传人:快乐****生活 文档编号:2151799 上传时间:2024-05-21 格式:PPT 页数:55 大小:1.03MB
下载 相关 举报
第五章-教育测量研究ppt.ppt_第1页
第1页 / 共55页
第五章-教育测量研究ppt.ppt_第2页
第2页 / 共55页
第五章-教育测量研究ppt.ppt_第3页
第3页 / 共55页
第五章-教育测量研究ppt.ppt_第4页
第4页 / 共55页
第五章-教育测量研究ppt.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

1、1第五章第五章 教育测量研究教育测量研究第一节第一节 教育测量概述教育测量概述第二节第二节 教育测量工具的评价指标教育测量工具的评价指标第三节第三节 教育测量的实施教育测量的实施2第一节第一节 教育测量概述教育测量概述一、教育测量的定义一、教育测量的定义二、教育测量的要素二、教育测量的要素三、教育测量的可能性与特点三、教育测量的可能性与特点四、教育测量的应用形式四、教育测量的应用形式五、教育测量的主要类型五、教育测量的主要类型六、教育测量的量表六、教育测量的量表3一、教育测量的涵义一、教育测量的涵义v测量就是根据某种规则把所测量就是根据某种规则把所观察的对象的属性和特征予观察的对象的属性和特征

2、予以数值化的过程,以表明被以数值化的过程,以表明被测对象通过作业和活动所达测对象通过作业和活动所达到的程度或量的多少。到的程度或量的多少。4v教育测量是指对教育领域内的各种事物或现教育测量是指对教育领域内的各种事物或现象,根据一定客观标准进行考核,并将考核象,根据一定客观标准进行考核,并将考核结果用数量描述。结果用数量描述。v狭义狭义:包括对学生德、智、体各方面的测量,:包括对学生德、智、体各方面的测量,也包括对教师的教育教学效果、学校办学水也包括对教师的教育教学效果、学校办学水平、学校办学效益等方面的测量。平、学校办学效益等方面的测量。5 PS:通通俗俗地地说说,就就是是根根据据一一定定的的

3、规规则则,给给事事物物分分派派数数字字。1、2、3、4、5这这些些数数字字本本身身是是没没有有数数量量或或质质量量意意义义的的,只只是是个个符符号号。当当我我们们规规定定1代代表表学学业业成成绩绩的的最最低低等等级级“不不及及格格”;2代代表表“及及格格”;3代代表表“中中等等”;4代代表表“良良好好”;5代代表表“优优秀秀”,这这时时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。才具有实际意义,数字按规则被赋予了意义。6二二、教育测量的、教育测量的要素要素参照点参照点v指的是在测量工作中必须具有一个量的起点,这个起点就叫指的是在测量工作中必须具有一个量的起点,这个起点就叫作测量的

4、参照点。这是任何测量都必须具备的两个要素之一,作测量的参照点。这是任何测量都必须具备的两个要素之一,测量所必须具备的要素包括参照点和单位。测量所必须具备的要素包括参照点和单位。v参照点有两种:一种是绝对参照点,即以绝对的零点作为测参照点有两种:一种是绝对参照点,即以绝对的零点作为测量的起点。比如长度和重量测量就是建立在以绝对的零点为量的起点。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。参照点的基础上的测量。v另一种是相对参照点,即以人为确定的零点为测量的起点。另一种是相对参照点,即以人为确定的零点为测量的起点。如地势高度的测量,就是以海平面为测量的起点。最理想的如地势高度的

5、测量,就是以海平面为测量的起点。最理想的参照点是绝对参照点。参照点是绝对参照点。7测量的单位测量的单位 不同测量的单位是不同的。不同测量的单位是不同的。理想的测量单位应当具备两个条件:理想的测量单位应当具备两个条件:一个是要有确定的意义,即对同一单位来说所有人一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;的理解是相同的;二是要有相等的价值,即单位与单位之间的距离是二是要有相等的价值,即单位与单位之间的距离是相等的。相等的。但是教育与心理测量中的单位往往很难达到这个要但是教育与心理测量中的单位往往很难达到这个要求,它远不如其他测量中使用的单位成熟和完善。求,它远不如其他测量中使用的

6、单位成熟和完善。8测量的要素测量的要素(1)测测量量客客体体。指指测测量量的的对对象象。测测量量的的客客体体可可以以是是人人,也也可可以以是是教育研究中的事物或现象。教育研究中的事物或现象。(2)测测量量内内容容。指指测测量量客客体体的的属属性性和和特特征征。测测量量内内容容可可以以是是外外显显的的,如如学学生生的的性性别别、年年龄龄、身身高高、体体重重等等,也也可可以以是是内内隐隐的的,如学习兴趣、动机、态度、价值观等。如学习兴趣、动机、态度、价值观等。(3)测测量量规规则则。指指测测量量的的法法则则或或方方法法。也也就就是是说说,要要构构建建一一套套如如何何分分派派数数字字或或符符号号的的

7、准准则则,按按准准则则对对测测量量内内容容进进行行规规范范化化、标标准化的操作。准化的操作。(4)测量工具。指测量的指标体系。没有工具,测量难以进行。)测量工具。指测量的指标体系。没有工具,测量难以进行。9三、教育测量法的可能性与特点三、教育测量法的可能性与特点可能性:可能性:桑代克(桑代克(1918年)年)“凡物的存在必有其数量凡物的存在必有其数量”麦柯尔(麦柯尔(1923年)年)“凡有其数量的事物都可测量凡有其数量的事物都可测量”(一)教育测量的结果是相对的(一)教育测量的结果是相对的 学学生生不不断断成成长长变变化化;测测量量对对象象不不同同、测测量量工工具具不不同同,无无法法比较;比较

8、;(二)教育测量一般是间接测量(二)教育测量一般是间接测量 测量心理属性,需要具体行为操作指标;测量心理属性,需要具体行为操作指标;(三)教育测量的客观性(三)教育测量的客观性 主主要要研研究究工工具具是是测测验验,遵遵循循一一定定的的标标准准和和程程序序,不不能能凭凭主主观经验进行。观经验进行。10四、教育测量的应用形式四、教育测量的应用形式v(一)直接应用(一)直接应用v选取某个测验作为收集资料的工具,其测验结果就是选取某个测验作为收集资料的工具,其测验结果就是研究的成果。例如,使用韦克斯勒智力量表测试学生研究的成果。例如,使用韦克斯勒智力量表测试学生智力水平。智力水平。v(二)综合应用(

9、二)综合应用v例如,中小学生创造性气象与学业成绩的相关性研究例如,中小学生创造性气象与学业成绩的相关性研究11五、教育测量的主要类型五、教育测量的主要类型(一)根据测量的标准化程度:标准化测量、非标准化测量(一)根据测量的标准化程度:标准化测量、非标准化测量1.标准化测量(标准化测量(standardized test)v由由专专家家学学者者或或专专门门机机构构采采用用系系统统的的科科学学程程序序编编制制的的、在在测测验验实实施施过过程程、评评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。v编编制制和和施施测测有有一

10、一套套标标准准程程序序。测测验验编编制制包包括括确确定定测测验验目目的的、科科学学命命题题、选选取取有有代代表表性性的的样样本本进进行行试试测测;根根据据数数量量化化指指标标筛筛选选测测验验题题目目;鉴鉴定定整整个个测测验验的的信信度度和和效效度度;建建立立常常模模、确确定定指指导导语语、时时限限和和施施测测条条件件;规规定定评评分分标标准准、分分数数转转换换和和解解释释方方法法等等。标标准准化化测测验验所所获获得得的的测测量量结结果果比比较较客客观观、可可靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。122.非非标标准

11、准化化测测量量(教教师师自自编编测测量量)(non-standardized test)v指指测测量量的的编编制制和和实实施施不不按按标标准准程程序序进进行行的的测测量量,通通常常由由教教师师或或研研究究人人员员自自编编的的、为为临临时时测测量量所所用用的的简简单单测测量量。如如课课堂堂测测验验、考考试试、等等级级评评定量表等。定量表等。v这这些些测测量量是是教教师师根根据据教教学学目目标标和和自自己己的的教教学学经经验验编编制制而而成成,它它通通常常与与日日常常教教学学工工作作紧紧密密联联系系;测测验验内内容容与与教教材材内内容容、教教学学进进度度一一致致;难难易易程程度度由由教教师师把把握

12、握;针针对对性性较较强强。编编制制省省时时、省省力力、灵灵活活、方方便便。不不足足之之处处在在于于测测验验的的客客观观性性和和标标准准化化程程度度不不如如标标准准化化测测验验,测测验验的的实实施施和和记分也不甚严格。记分也不甚严格。13(二二)根根据据测测量量的的内内容容分分类类:学学业业成成就就测测验验、智智力力测测验验、能能力力倾倾向向测测验验、人格测验等。人格测验等。1.学业成就测验学业成就测验v测测被被试试经经某某种种形形式式的的学学习习或或训训练练后后对对知知识识、技技能能的的掌掌握握程程度度或或熟熟练练水水平平。如如识识字字量量、阅阅读读、算算术术测测验验等等,成成就就测测验验可可

13、以以是是学学科科成成就就测测验验或或综合成就测验。综合成就测验。2.智力测验智力测验v测测被被试试的的智智力力高高低低,其其结结果果常常以以智智商商(IQ)来来表表示示,此此类类测测验验比比较较多多,其其中中比比较较著著名名的的有有:斯斯坦坦福福比比纳纳智智力力测测验验、韦韦克克斯斯勒勒儿儿童童智智力力测测验量表(验量表(WISC-CR)、瑞文推理测验等。)、瑞文推理测验等。143.能力倾向测验能力倾向测验v测测被被试试潜潜在在的的某某种种能能力力,以以了了解解其其发发展展的的可可能能性性,预预测测个个人人能能力力发发展展倾倾向向。如如音音乐乐、美美术术、体体育育、创创造造力力、想想象象力力、

14、记记忆忆力力等等方方面面的的能能力力倾向测验。倾向测验。4.人格测验人格测验v测测被被试试的的需需要要、动动机机、兴兴趣趣、态态度度、气气质质、性性格格、人人际际关关系系等等人人格格心心理理特特征征,较较为为著著名名的的有有明明尼尼苏苏达达多多相相个个性性测测验验(MMPIMMPI)、艾艾森森克克人人格格问卷(问卷(EPQ-REPQ-R)、卡特尔)、卡特尔1616项人格因素测验(项人格因素测验(16PF16PF)等。)等。15(三三)根根据据测测量量结结果果的的评评价价标标准准分分为为:常常模模参参照照测测验、目标参照测验。验、目标参照测验。1.常模参照测验常模参照测验v常常模模参参照照测测验

15、验是是一一种种衡衡量量被被试试相相对对水水平平的的测测验验,是是将将被被试试的的测测验验成成绩绩与与同同类类对对象象在在同同一一测测验验上上的的平平均均分分(常常模模)相相比比较较,从从而而解解释释分分数数,确定被试在总体中的相对位置的测验方法。确定被试在总体中的相对位置的测验方法。v常常模模参参照照测测验验要要有有常常模模对对照照表表。常常模模有有地地区区性性常常模模和和全全国国性性常常模模,地地区区性性常常模模只只适适用用于于特特定定的的区区域域,如如在在城城市市获获得得的的常常模模就就不不一一定定适适用用于于农农村村或或边边远远地地区区,而而全全国国性性常常模模适适用用于于全全国国所所有

16、有的的同同类类个个体体。如如,儿儿童童的的身身高高、体体重重就就有有全全国国性性常常模模,中中国国儿儿童童发发展展量量表表(3-6岁岁)就就有有全全国国性性常常模模。只只要要我我们们将将个个体体实实际际测测量量的的数数据据与与常常模模一一对对照照,就就可可以以知知道个体所处的地位。道个体所处的地位。16172.目标参照测验目标参照测验v又又称称标标准准参参照照测测验验,是是衡衡量量被被试试实实际际水水平平的的测测验验,将将被被试试在在测测验验上上的的分分数数与与事事先先制制定定好好的的某某种种标标准准进进行行比比较较,看看被被试是否达到了目标规定的要求。试是否达到了目标规定的要求。v目目标标参

17、参照照测测验验的的特特点点是是依依据据标标准准,判判断断被被试试的的达达标标程程度度,而而不不是是将将被被试试的的成成绩绩与与他他人人成成绩绩做做比比较较。如如,英英语语水水平平测测试、毕业考试、动作技能测试、体育达标测试等。试、毕业考试、动作技能测试、体育达标测试等。18(四)根据同时受测的人数分类:个别测量、团体测量(四)根据同时受测的人数分类:个别测量、团体测量1.个别测量个别测量v指指主主试试与与被被试试一一对对一一进进行行的的测测量量(一一个个主主试试在在同同一一时时间间内内,只测验一个被试)。只测验一个被试)。个个别别测测量量的的可可靠靠性性比比较较高高,主主试试能能有有效效地地观

18、观察察控控制制被被试试的的行行为为反反应应,但但个个别别测测量量费费时时费费力力,短短时时间间内内难难以以获获得得大大量量的的资资料料,并并且且对对主主试试的要求较高。的要求较高。2.团体测量团体测量v指一个主试能同时对许多被试进行的测量。指一个主试能同时对许多被试进行的测量。团团体体测测量量节节省省人人力力与与时时间间,在在短短时时间间内内能能收收集集到到大大量量的的资资料料,效效率率较高,但被试的反应不容易控制,并且测量效果不及个别测量可靠。较高,但被试的反应不容易控制,并且测量效果不及个别测量可靠。19(五五)根根据据测测量量目目的的分分类类:诊诊断断性性测测验验、形形成成性性测测验验和

19、和总总结结性测验。性测验。20v测测量量需需要要有有测测量量的的工工具具,测测量量的的工工具具应应具具有有单单位位和和参参照照点点,并且有表示量数的方法,我们把这种工具称之为量表。并且有表示量数的方法,我们把这种工具称之为量表。v如如,尺尺是是度度量量长长度度的的量量表表,血血压压计计是是测测量量血血压压高高低低的的量量表表,智力测验是测量智商高低的量表。智力测验是测量智商高低的量表。六、教育测量的量表六、教育测量的量表21量表的数据类型:量表的数据类型:v称名数据称名数据v顺序数据顺序数据v等距数据等距数据v比率数据比率数据 点记数据点记数据度量数据度量数据22(一)称名量表(类别量表)(一

20、)称名量表(类别量表)是是根根据据事事物物的的某某一一特特点点,对对事事物物属属性性进进行行分分类类,用用名名称称或或数数字字来来代代表表事事物物或或性性质质,是是给给事事物物进进行简单归类的一种量表形式。行简单归类的一种量表形式。如:男生为如:男生为1,女生为,女生为2 喜欢语文的学生为喜欢语文的学生为1,喜欢数学的学生为,喜欢数学的学生为2 称称名名量量表表测测量量的的结结果果不不能能运运算算,但但可可以以做做统统计计分分析析(如如计计算算百百分分比比、列联相关、卡方检验)列联相关、卡方检验)23(二)顺序量表(等级量表)(二)顺序量表(等级量表)只只有有等等级级顺顺序序而而无无等等距距的

21、的单单位位和和绝绝对对零零点点,只只是是按研究对象的某一种属性的顺序排列出等第次序。按研究对象的某一种属性的顺序排列出等第次序。如如:根根据据学学生生的的测测验验成成绩绩排排出出名名次次,成成绩绩最最好好的的为为1,成绩次之为成绩次之为2,再次之为,再次之为3,依次类推。,依次类推。又又如如,对对于于生生活活水水平平,我我们们可可以以给给出出四四个个等等级级:贫贫困困、温饱、小康、富裕。温饱、小康、富裕。24(三)等距量表(间距量表)(三)等距量表(间距量表)是具有相等的单位,但没有绝对零点的量表。是具有相等的单位,但没有绝对零点的量表。等距量表的数量单位之间的间距是相等的,可以相加减。等距量

22、表的数量单位之间的间距是相等的,可以相加减。如如:温温度度摄摄氏氏30度度至至32度度与与摄摄氏氏18度度至至20度度的的温温差差是是相相等等的的,都都是是相相差差2度度。三三个个儿儿童童在在智智商商测测验验中中分分别别得得分分105、110、115,在在智商测验分数体系中,分数差距是相等的。智商测验分数体系中,分数差距是相等的。等等距距量量表表在在学学校校教教育育系系统统运运用用广广泛泛,一一般般将将百百分分制制评评分分看看作作等等距距量量表。表。25(四)比率量表(等比量表)(四)比率量表(等比量表)v除除了了具具有有类类别别、顺顺序序、等等距距量量表表的的特特征征外外,还还有有一一个具有

23、实际意义的绝对零点。可以加减乘除。个具有实际意义的绝对零点。可以加减乘除。零零点点是是指指测测量量的的起起点点或或参参照照点点。有有些些零零点点是是人人定定的的,称称相相对对零零点点,如如摄摄氏氏零零度度,这这里里零零度度并并不不意意味味着着没没有有一一点点温温度度,而而是是以以人人定定的的冰冰点点为为参参照照标标准准。像像学学生生的的考考试试成成绩绩、智智商商的的0分分都都是是相相对对零零点点。有有些些零零点点具具有有实实际际意意义义,称称绝绝对对零零点点。如如年年龄龄、身身高高、经经费费开开支支等等都都有有绝绝对对零零点点,0岁岁、0米米、0元元中中的的“零零”都都表表示示真真实实的的“无

24、无”,表表示示一点都没有。一点都没有。26量表量表条件条件例子例子称名量表称名量表无顺序的测量,只是指无顺序的测量,只是指出有两个或多个范畴。出有两个或多个范畴。中学的类型:公立、中学的类型:公立、私立、职业、普通私立、职业、普通等。等。顺序量表顺序量表是有顺序有测量,在于是有顺序有测量,在于指出所测量的范畴的不指出所测量的范畴的不同并能够按一定的顺序同并能够按一定的顺序排列。排列。字母的排列系统、字母的排列系统、学习态度。学习态度。等距量表等距量表有顺序的测量,在量表有顺序的测量,在量表中表现为数量上的等距中表现为数量上的等距变化变化数学成绩测量的标数学成绩测量的标准分数。准分数。比率量表比

25、率量表含有绝对或真正的零点含有绝对或真正的零点和统一的单位。和统一的单位。高度、体重高度、体重上述四种量表的比较:上述四种量表的比较:第二节第二节 教育测量的评价指标教育测量的评价指标2728一、测量的误差一、测量的误差v系统误差系统误差v由于仪器结构上不够完善或仪器未经很好校准等原因会产生误差。例如,由于仪器结构上不够完善或仪器未经很好校准等原因会产生误差。例如,各种刻度尺的热胀冷缩,温度计、表盘的刻度不准确等都会造成误差。各种刻度尺的热胀冷缩,温度计、表盘的刻度不准确等都会造成误差。v由于实验本身所依据的理论、公式的近似性,或者对实验条件、测量方由于实验本身所依据的理论、公式的近似性,或者

26、对实验条件、测量方法的考虑不周也会造成误差。例如,热学实验中常常没有考虑散热的影法的考虑不周也会造成误差。例如,热学实验中常常没有考虑散热的影响,用伏安法测电阻时没有考虑电表内阻的影响等。响,用伏安法测电阻时没有考虑电表内阻的影响等。v由于测量者的生理特点,例如反应速度,分辨能力,甚至固有习惯等也由于测量者的生理特点,例如反应速度,分辨能力,甚至固有习惯等也会在测量中造成误差。会在测量中造成误差。v以上都是造成系统误差的原因。系统误差的特点是测量结果向一个方向以上都是造成系统误差的原因。系统误差的特点是测量结果向一个方向偏离,其数值按一定规律变化。我们应根据具体的实验条件,系统误差偏离,其数值

27、按一定规律变化。我们应根据具体的实验条件,系统误差的特点,找出产生系统误差的主要原因,采取适当措施降低它的影响。的特点,找出产生系统误差的主要原因,采取适当措施降低它的影响。29随机误差随机误差v在相同条件下,对同一物理量进行多次测量,由于各种偶然因素,会出在相同条件下,对同一物理量进行多次测量,由于各种偶然因素,会出现测量值时而偏大,时而偏小的误差现象,这种类型的误差叫做偶然误现测量值时而偏大,时而偏小的误差现象,这种类型的误差叫做偶然误差。差。v产生偶然误差的原因很多,例如读数时,视线的位置不正确,测量点的产生偶然误差的原因很多,例如读数时,视线的位置不正确,测量点的位置不准确,实验仪器由

28、于环境温度、湿度、电源电压不稳定、振动等位置不准确,实验仪器由于环境温度、湿度、电源电压不稳定、振动等因素的影响而产生微小变化,等等,这些因素的影响一般是微小的,而因素的影响而产生微小变化,等等,这些因素的影响一般是微小的,而且难以确定某个因素产生的具体影响的大小,因此偶然误差难以找出原且难以确定某个因素产生的具体影响的大小,因此偶然误差难以找出原因加以排除。因加以排除。v实验结果还表明,在确定的测量条件下,对同一物理量进行多次测量,实验结果还表明,在确定的测量条件下,对同一物理量进行多次测量,并且用它的算术平均值作为该物理量的测量结果,能够比较好地减少偶并且用它的算术平均值作为该物理量的测量

29、结果,能够比较好地减少偶然误差。然误差。30衡量教育测量的质量,可采用四个指标:衡量教育测量的质量,可采用四个指标:v信度 主要对整个测量而言。v效度 v难度 主要对测量的项目而言。v区分度 二、测量的条件二、测量的条件31二、信度信度(信度(reliabilityreliability):指的是测量结果的稳定性和):指的是测量结果的稳定性和可靠的程度,亦即测量的结果是否真实、客观地反可靠的程度,亦即测量的结果是否真实、客观地反映了受测者的实际水平。映了受测者的实际水平。具体而言,可以从以下三方面来理解测量的信度:1.信度指实测值和真值相差的程度信度指实测值和真值相差的程度2.信度指统计量与参

30、数之间的接近程度信度指统计量与参数之间的接近程度3.信度指两次重复测验或等值测验之间的关联程度信度指两次重复测验或等值测验之间的关联程度321.1.信度指实测值和真值相差的程度信度指实测值和真值相差的程度v x xT TE E(公式(公式1-11-1)x x表示实测值,表示实测值,T T表示真值表示真值(是未知的,可以把多次是未知的,可以把多次测量的实测值的平均值作为真值的近似值测量的实测值的平均值作为真值的近似值),E E表示表示误差。误差。v E Ex-T x-T (公式(公式1-21-2)33试比较以下两次测量结果(只进行一次)的信度:试比较以下两次测量结果(只进行一次)的信度:v用尺子

31、量用尺子量100cm100cm高的一个儿童,得到高的一个儿童,得到1cm1cm的绝对误差;量的绝对误差;量185cm185cm高的一位运高的一位运动员,也得得到动员,也得得到1cm1cm的绝对误差。的绝对误差。v要比较两种测量结果的信度,一定要看误差分数(要比较两种测量结果的信度,一定要看误差分数(E)对于真分数()对于真分数(T)所占的百分数是多少。这个百分数表示该实得分数(所占的百分数是多少。这个百分数表示该实得分数(x)的相对误差。其)的相对误差。其计算式如下:计算式如下:v相对误差相对误差E/T100%公式(公式(1-3)v把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得

32、:把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得:v 相对误差(甲)相对误差(甲)1/100100%1%v相对误差(乙)相对误差(乙)1/185100%0.54%v据此,度量乙的信度要比度量甲的信度高。据此,度量乙的信度要比度量甲的信度高。34v统计量是指样本上的各种数字特征。(如样本平均数、标统计量是指样本上的各种数字特征。(如样本平均数、标准差等);参数是总体上的各种数字特征(如总体平均数、准差等);参数是总体上的各种数字特征(如总体平均数、标准差等)。标准差等)。v在统计学中,统计量越接近参数,这个统计量的可靠性越在统计学中,统计量越接近参数,这个统计量的可靠性越高。而要

33、知道统计量与参数的接近程度,可以对参数进行区高。而要知道统计量与参数的接近程度,可以对参数进行区间估计。间估计。2.信度指统计量与参数之间的接近程度信度指统计量与参数之间的接近程度353.信度指两次重复测验或等值测验之间的关联程度信度指两次重复测验或等值测验之间的关联程度v统计学中估计事物或现象间数量变动的一致性,主要采用相关分析的方法,即计算出两种变量的相关系数(rxy)。v在使用相关系数表示信度的高低时,相关系数可称为信度系数(coefficient of reliability)。它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。36提高测量信度的方法提高测量

34、信度的方法v1.测题要有一定数量测题要有一定数量 延长测验的长度,既可排除试题抽样的偶然性因素,也有可能扩大得分延长测验的长度,既可排除试题抽样的偶然性因素,也有可能扩大得分的范围,因而使信度系数增大,测验信度提高。的范围,因而使信度系数增大,测验信度提高。v2.测题难度适中测题难度适中v3.测题内容要有同质性,不要包含过多性质不同的内容测题内容要有同质性,不要包含过多性质不同的内容v4.测验时间要充分测验时间要充分v5.评分要客观评分要客观37 是测验的准确性,是测验能够测出它所欲测的特质是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。的程度,即测验

35、实际测量出其所要测量特性的程度。二、效度二、效度38提高效度的注意事项:提高效度的注意事项:v(1)要控制系数误差,即控制测验过程的误差;)要控制系数误差,即控制测验过程的误差;v(2)精心编制测题,分析教学目标,编制双向)精心编制测题,分析教学目标,编制双向细目表,测题表述简明易懂,测量有必要的覆盖细目表,测题表述简明易懂,测量有必要的覆盖面。面。v(3)妥善组织测验。)妥善组织测验。39 难难度度是是指指题题目目的的难难易易程程度度。表表示示题题目目难难易易程程度度的的数数量量,称称为为题目的难度指数,一般用题目的难度指数,一般用P P来表示。来表示。试题卷面的难度值范围是试题卷面的难度值

36、范围是0.40.40.70.7v由于测题记分的方法不同,所以难度的估计方法也不同。由于测题记分的方法不同,所以难度的估计方法也不同。三、难度三、难度401.1.在计算客观题的难度时,它就是受测者在回答该题目时在计算客观题的难度时,它就是受测者在回答该题目时 正确回答的人数在全体受测者中所占的比例。正确回答的人数在全体受测者中所占的比例。2.2.当题目的分数为多值时(包括主观题或一些分步解答的题当题目的分数为多值时(包括主观题或一些分步解答的题目),目),难度就是全体平均分与题目满分的比例。难度就是全体平均分与题目满分的比例。难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。414

37、243v区区分分度度是是指指一一个个题题目目区区分分所所有有受受试试者者的的能能力力。(题题目目的的区区分分度度是是衡衡量量题题目目对对测测量量目目的的所所做做的的贡贡献献大大小小程程度度的的指指标标。它它反反映映了了一一个个题题目目的的鉴鉴别别能能力力。因因此此区区分分度度又又称称题题目目的的鉴鉴别度。)别度。)四、区分度四、区分度44v通常用D表示,取值范围为1.00-1.00。D越高则质量越好。v0.2以下应淘汰 v0.2-0.3 合格v0.3-0.4 良好0.4-1 性能佳 第三节第三节 教育测量的实施教育测量的实施4546一、教育测量的方法一、教育测量的方法(一)编制试题的一般原则(

38、一)编制试题的一般原则1.要有明确的测验目的要有明确的测验目的2.能反映学科的重点内容能反映学科的重点内容3.试题取样要有代表性试题取样要有代表性4.试题难度要有一定的分布范围试题难度要有一定的分布范围5.试题的文字要适合学生阅读能力,力求浅显易懂试题的文字要适合学生阅读能力,力求浅显易懂47(二)测量的编制方法(二)测量的编制方法v1.标准客观测验的各种试题形式标准客观测验的各种试题形式v(1)填空题)填空题v(2)是非题)是非题v(3)选择题)选择题v(4)匹配题)匹配题v(5)简答题)简答题v(6)论述题)论述题48(1)填空题)填空题v问渠那得清如许,问渠那得清如许,_。v竹外桃花三两

39、枝,竹外桃花三两枝,_。v测验学生完成句子的能力测验学生完成句子的能力v优点:试题容易编写,避免乱猜;优点:试题容易编写,避免乱猜;v缺点:容易造成死记硬背的现象,学习内容容易混淆。缺点:容易造成死记硬背的现象,学习内容容易混淆。49(2)是非题)是非题v1.背影的作者是朱自清吗?背影的作者是朱自清吗?2.企鹅是在北极吗?企鹅是在北极吗?v3.刚吃完饭能马上运动吗?刚吃完饭能马上运动吗?4.口腔有消化作用吗?口腔有消化作用吗?v5.英语的卧房是英语的卧房是Sleeproom v 测量学生对问题的理解、解释、再认、比较与辨认的能力。测量学生对问题的理解、解释、再认、比较与辨认的能力。v题目容易编

40、写,容易计分。题目容易编写,容易计分。v缺点:容易猜题缺点:容易猜题v改进方法:提高出题质量,对错答题目扣分。改进方法:提高出题质量,对错答题目扣分。50(3)选择题)选择题v测量学生对问题的理解、解释、再认、比较与辨认的能力。测量学生对问题的理解、解释、再认、比较与辨认的能力。v试题内容广泛,评分客观,提供选择的答案多,可以减少猜试题内容广泛,评分客观,提供选择的答案多,可以减少猜中题目的机会。中题目的机会。v缺点:编写试题时费时较多。缺点:编写试题时费时较多。51(4)匹配题)匹配题v测查学生对字词、文法、日期、事件、地点、人物、公式、测查学生对字词、文法、日期、事件、地点、人物、公式、原

41、则等关系的了解与联结的能力。原则等关系的了解与联结的能力。v优点:测量学生简易的联结能力;优点:测量学生简易的联结能力;v缺点:使用过多容易鼓励学生死记硬背的材料,学生往往为缺点:使用过多容易鼓励学生死记硬背的材料,学生往往为了使材料相互匹配而重复阅读,消耗时间精力。了使材料相互匹配而重复阅读,消耗时间精力。52(5)简答题)简答题v测量学生对重要知识点的记忆程度,编写试测量学生对重要知识点的记忆程度,编写试题容易,评分客观,教师使用较多。题容易,评分客观,教师使用较多。v缺点:测量的知识零碎,偏重记忆。缺点:测量的知识零碎,偏重记忆。53(6)论述题)论述题v测量学生的组织知识、表达思想和构

42、思能力。测量学生的组织知识、表达思想和构思能力。v优点:给予学生独立思考的机会;优点:给予学生独立思考的机会;v缺点:评分不易客观,答题时间有限,不易缺点:评分不易客观,答题时间有限,不易测量构思能力。测量构思能力。542.论文式考试论文式考试v论文式考试是主试就教材要点编拟试题,由学生以论文的方论文式考试是主试就教材要点编拟试题,由学生以论文的方式阐述所回答的问题。式阐述所回答的问题。v(1)优点)优点v测试回忆知识和形成假设的能力,测查学生组织知识、整理测试回忆知识和形成假设的能力,测查学生组织知识、整理论据、构思、评价和表述观念的能力;了解学生对问题的敏论据、构思、评价和表述观念的能力;

43、了解学生对问题的敏感性和论述问题的逻辑思维过程。感性和论述问题的逻辑思维过程。55v(2)缺点)缺点v试题少,内容样本缺乏代表性,效度和信度差,覆盖率低,试题少,内容样本缺乏代表性,效度和信度差,覆盖率低,评分主观。评分主观。v(3)改进建议)改进建议v全面考虑测试学科知识的内容,选择与教学目的密切相关的全面考虑测试学科知识的内容,选择与教学目的密切相关的命题;明确规定答案的范围和限度,用短小的形式回答问题;命题;明确规定答案的范围和限度,用短小的形式回答问题;评卷时对试题内容、组织、逻辑性、说服力、表达程度等制评卷时对试题内容、组织、逻辑性、说服力、表达程度等制定明确的评分标准。定明确的评分标准。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服