资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 教育测验的编制,本章内容提要:,本章主要讲述教育测验的编制步骤、测题的编写、测题的组合及标准化、测验的评价标准、测验量表的编制、测验说明书的编写。,测验项目的编写技术。,第一节 教育测验编制的一般程序,教育测验的编制一般包括:确定测验的目的,分析测量目标,制定编题蓝图或计划,编辑题目,决定测验时间和测题数量,确定计分方法,实施试测,题目分析,鉴定测验测量标准,编制测验量表及说明书,拼题并建立题库。,一、确定测验的目的,1,、确定测量对象,2,、确定测量目标(一般要将目标转化成可操作的术语),3,、确定测量的功用(常与评价目标结合在一起),如是诊断性测验还是选拔性测验。,二、分析测量目标并制定编题计划,美国心理学家布鲁姆(,Bloom),最早提出教育目标的分类问题。他把学习的心理活动过程分成认知、情感二个领域。又把认知领域具体分为知识(记忆事实、条件、方法、原理等的能力)、理解、应用、分析、综合、评价六个层次。,布鲁姆教育目标分类体系详细结构如下:,1,、知识,1.1,具体知识,1.2,处理具体事物方式方法的知识,1.3,学科领域中的普遍原理和抽象概念的知识,2,、理解,2.1,转化,2.2,解释,2.3,推断,3,、应用,4.,分析,4.1,要素分析,4.2,关系分析,4.3,组织原理分析,5.,综合,5.1,进行独特的交流,5.1,制定计划或操作步骤,5.3,推导出一套抽象关系,6.,评价,6.1,依据内在的证据来判断,6.2,依据外部准则来判断,情感领域的目标分类,1.,接受,(,注意,),:探讨学习者是否愿意接受或注意学习内容,1.1,觉察是指在提供适当机会时学生对某些客观刺激的意识,.,1.2,愿意承受特定刺激的行为,1.3,控制或选择的注意,是指有意识或半意识的从内容或情境中辩别某种特定的刺激,.,2,反应所关心的是学生受到动机的充分驱动,积极地注意学习内容,2.1,默认的反应,这种反应强调行为的被动性,一般产生遵从或顺从,.,2.2,愿意的反应,学生完全致力于表现自己的行为,是自己想做或自愿去做,.,2.3,满意的反应,它关心的是伴随着行为有一种满意的感觉或一种情绪反应,即愉快、兴奋或快乐。,3,价值判断,它一般是指学习者对某事物、某现象或行动所产生的意义或价值。包括个人的价值判断和社会的价值判断。,3.1,价值的接受,它所关心的是把价值归结为与某种现象、行为、客体等相联的东西。,3.2,价值的偏爱,是指对某价值的单纯接受和参与某一领域的倾向,.,3.3,价值的信奉,是指毫不怀疑的确信,.,4,组织化,:,反映相关的价值状态的价值体系,它是价值内化的结果,.,4.1,价值的概念化,是指价值的一贯的稳定的价值倾向,.,4.2,价值体系的组织化,是指把各种价值组成一个复合体,形成了一种和谐的内在的统一,.,5,价值或价值复合体的个性化,是指各种社会价值体系在个体价值结构中的位置,并控制着个体的行为,.,5.1,泛化心向,是指在任何特定的时候都对态度和价值体系有一种内在的一致的心向,.,5.2,个性化,是内化过程的最高水平,它包括隐蔽的现象和外显的行为的更加广泛的目标,是人的宇宙观、人生观和世界观的反应。它是一种生活哲学。,动作技能领域的教育目标分类,该目标分类是,Simpson,提出的试验方案,它是通过身体的活动来掌握教育目标。,1,知觉:是通过听觉、视觉、触觉、味觉、嗅觉的作用,寻求实现教育目标的有效手段。,2,精神准备:是指做好完成目标的准备状态或进行调整的能力。,3,接受指导的反应:是指学生在接受教师指导时能模仿典型动作的行为,并具有做出适当反应的能力。,4,作用过程:是指必要时形成反应所自动产生的行为过程。如心理定势。,5,复合动作:是指通过复杂的示范动作来实现运动技能的目标。,6,适应:是指把以学会的运动技能应用于新的目标之中的能力,即迁移能力。,7,创作:是指实行新的动作或形成新的动作能力的表现。,小学自然常识测验编题细目表,目标,内容,识记,理解,应用,分析,综合,评价,合计,生物世界,3,5,6,3,2,1,20,资源利用,2,3,3,1,1,0,10,动力机械,2,3,4,2,0,1,12,物质能量,5,6,8,3,2,1,25,气象,2,4,3,2,2,0,13,宇宙,2,5,4,1,0,0,12,地球,2,2,2,1,1,0,8,合计,18,28,30,13,8,3,100,三、编辑题目(类型、数量、记分方法),1,、搜集有关资料,(,1,)材料要丰富,(,2,)材料要有普遍性,2,、选择测验形式,(,1,)测验的目的和材料的性质,(,2,)接受测验的团体的特点,(,3,)各种实际因素,3,、编定和修订项目,应注意:(,1,)题目的范围要有测验的计划所列内容与目标相一致。(,2,)题目的难度符合测验的目的。(,3,)题目的说明要清楚明白。,四、题目的试用、分析、筛选,1,、预测,(,1,)预测对象要取自将来正式测验准备应用的群体。,(,2,)预试的实施过程与情境应与正试测验相近似。,(,3,)预试的时限可稍宽,尽量使每个被试答完。,(,4,)预试过程中被试的反应应随时记录。,2,、项目分析,主要包括:确定题目的难度、区分度、被选答案的合适度。,五、集合成测验(拼题),(一)试题的选择,最好的题目,就是只测定所需要的特征,并能对该特征加以有效区分的难度合适的题目。,(二)试题的编排,最常见的编排方式是:,1,、并列直进式,2,、混合螺旋式,(三)编造复本,复本的等值需具备以下几个条件:,1,、各份测验测量的是同一种心理特征。,2,、各份测验具有相同的内容和形式。,3,、各份测验的题目不应有重复的地方。,4,、各份测验题目数量相等,并且有大体相同的难度和区分度。,5,、各份测验的分数分布(平均数和差异度)大致相等。,六 将测验标准化,测验标准化包括以下几个方面:,(一)内容的标准化,即对所有受测者施测相同的或等值的题目。,(二)施测的标准化,即测验实施过程要有相同的指导语、时限和客观的物理情境。,(三)评分的标准化,(四)常模,是测验使用者解释测验分数的依据。测验分数必须与常模比较才能显示出它所代表的意义。,建立常模的方法是:它将来要使用测验的全体对象中,选择有代表性的一部分人(称标准化样本),对此样本施测并将所得的分数加以统计整理,得出一个具有代表性的分数分配,标准化样本的平均数,即为该测验的常模。常见的常模有:年龄常模、年级常模、地域常模、民族常模、职业常模等。,七 测验的信、效度分析,(一)信度指的是测验的可靠性或一致性。,(二)效度就是测验的有效程度。衡量测验的有效程度是看测验所测量的是不是它所要测的东西。,八 编写测验说明书,一份说明书主要包括:,(一)本测验的目的和功用,(二)编制测验的理论背景以及选择题目的根据。,(三)测验的实施方法、时限及注意事项。,(四)测验的标准答案和评分方法,(五)常模资料,包括常模表、常模适用的团体及对分数如何做解释。,(六)测验的信度、效度资料,包括信度系数、效度系数以及这些数据是什么情境下得到的。,第二节 测题的编制技术,一、命题的一般原则,命题应遵循以下原则:,1,、试题要符合测验的目的。,2,、内容取样要有代表性。,3,、题目格式不要使被试发生误解。,4,、文字要简明扼要,即排除与解题无关的因素,又不可遗漏解题所依据的必要条件,要避免使用艰深的字词。,5,、应有不致引起争论的确定答案(创造力测验、人格测验除外。,6,、各个试题必须彼此独立,不可互相牵连,不要使一个题目的回答影响另一个题目的回答。,7,、题目中不可含有暗示题或其它题正确答案之线索。,8,、题目内容不要超出受测题体的知识和能力。,9,、所提问题应避免涉及社会禁忌与隐私。,10,、施测与评分省时。,二、测题的种类及编制要领,根据应答方式,测题的种类分为两大类,即自由应答型和固定应答型。自由应答型题目是让受测者用自己的语言或行动来对某一问题做出回答,包括填充题、简答题、应用题、论文题、联想题、操作题等。固定应答型题目又称客观性题目,是让受测者从测验编制者事先定好的答案中辩认出一个正确答案,包括了多选题、是非题、匹配题等。,(一)多选题,多选题在结构上包含两部分,一为题干,由直接问句或不完全的陈述句所构成,另一为选项,包含一个正确答案及若干个错误答案。多选题可适用于文字、数字和图形等不同性质的材料,可以考察记忆、分析、鉴别、推型、理解和应用知识的能力。下边是几种常见的变式。,1,、计算:,例:小明给了弟弟,2,支铅笔,自己还剩,8,支,小明原来有几支?,(,A,),4,(,B,),6,(,C,),8,(,D,),10,2,、类比:已知甲和乙的关系,推出丙和丁的关系。,例:船,-,水,飞机,-,?,(,A,)大地 (,B,)白云(,C,)天空,(,D,)海洋,3,、找不同类:每一题内有几项属于同一类事物,只有一项不属于这一类,要划去。,例:(,A,)狗(,B,)鸟(,C,)树(,D,)鱼,4,、最好理由:几个备选答案都是对的,但其中一个最好,要把它找出来。,例:偷东西的人应该受惩罚,因为:,(,A,)罚款可使他不敢再犯。,(,B,)偷窃为法律所不容。,(,C,)偷东西的人不是好人。,(,D,)偷窃扰乱社会治安。,多选题的优点是:,1,、单位时间内可以施测很多项目,从而有保证取样的广泛性,使测验更有效。,2,、评分客观,加上题目数量多,可以减少随机因素的影响,从而能保证测验的可靠性。,3,、便于对题目进行分析,易于调整题目的难度。,4,、阅卷方便迅速,并可用机器评分,被试多时比较经济。,5,、好的题目可存入题库,重复使用。,多选题的缺点是:,1,、有固定答案,测不出组织材料的能力、文字表达能力和创造力。,2,、题量大,并要为每个题目考虑几个似是而非的答案,因而编写困难费时,需要一定技巧。,编拟多选题的要领及原则如下:,1,、根据测验的目的和内容来选择最适当的题型。,2,、备选答案要简略,必要的叙述或相当的修饰语应全部置于题干中。,3,、每题只能环绕一个中心,并只有一个正确答案,该答案在内容和形式上不可特别突出,但其正确性必须确凿无疑。,4,、题干应当包括解题所必须的共同要素,并尽可能做到精炼、准确、清楚,不要把选项夹在题干中间。,5,、错误答案对被试具有迷惑性,不要错得太明显。这种答案可以是人们经常出现的错误,也可以是一般性的误解和似是而非的内容。,6,、各个选项在形式上应该协调一致,或为数字,或为图形,或为人名,应该一律,文字长短也应大体相当,以免对正确回答提供线索。,7,、选项之间不应相互重迭,相互包括,相互依赖。,8,、几个选项最好按逻辑顺列或随机排列。正确答案在每个位置上出现的次数要大致相等,且不要形成固定的格式。,9,、所有选项在逻辑上和语法上都能与题干相接,否则本来正确的答案,会因为逻辑上或语法上与题干不一致而放弃。反之,如果干扰答案在逻辑上或语法上与题干不吻合,被试就会根据常识,发觉它们之间的矛盾而加以排除。,10,、题干要尽量创新的情境,文字要自己拟定,避免重复书本上的现成实例或措词。,(二)是非题,是非题是指出一个论点要被试判断是否正确,或从是非两个答案中做出选择。是非题回答方便,适于考查学生对简单观念或知识的了解,其缺点是易受猜测因素的影响,重要的材料有时不能用对和错简单回答,缺乏教育诊断作用,故在能力测验中应用不如多选题广泛。,编拟是非题应注意下面几点:,1,、内容应以有意义的事实、概念或原理为基础,避免无关重要的问题或琐碎的细节。,2,、每题应只包含一个观念,避免两个以上的观念在同一题中出现,而造成题目“似是而非”或“半对半错”。,3,、论点要简明扼要,意义明确,不要有艰深难懂的词句或含糊不确定的文字叙述。,4,、对论点的陈述要重新组织,不要照搬教科书上的词句或仅仅加上否定词就构成错误项目。,5,、避免使用具有暗示性的特殊字词,如“绝不”“完全”等。,6,、尽量采用正面肯定的叙述,避免反面陈述或双重否定的文句。,7,、“是”与“非”的题数应大致相等,且随机排列。,8,、题数不能太少。,(三)匹配题,匹配题包括并列的两行,一行为刺激项目,另一行为反应项目,被试的任务是由后者中选出与前者相适合的项目,可以是完全匹配,也可以是不完全匹配。,匹配题是选择题的一种变式,一个匹配题实际上就是一套多选题,适用于测量概念与事实之间的关系,其优缺点与多选题相同。,编制匹配题的要领是:,1,、一个题目的各个刺激项目及各个反应项目应在内容上同质,若涉及年代都为年代,涉及地点都为地点,涉及符号都为符号。,2,、在指导语中要讲匹配依据,告诉被试每个反应可用几次。,3,、配对项目不可过多或过少,如在十对以下,最好应用不完全配合,使反应项目比题项目多出一两个。以增加其可靠性。,4,、每个刺激项目应有一个而且只有一个反应项目相匹配。,5,、按一定逻辑次序安排反应项目,同时要避免答案的固定格式。,6,、同一组项目应印在同一页上,以免造成作答时的困扰。,(四)填空题与简答题,填空题与简答题要求的是对正确答案的回忆,即由被试自己写出答案。,填空题和简答题的编写原则如下:,1,、填空题目所空出的应该是关键字句,并且要和上下文有密切联系,不要空出无关紧要的字词。,2,、一句内不要有太多的空白,空白太多,不容易明了题意。,3,、空白最好放在句子的尾部,免得空格多少为答案提供线索。,4,、测题句子避免直接引用教科书的措词。,5,、问题要具体,范围要确定,要使受测者知道答案的类型、长度和确切程度。,6,、准备一个正确答案和可接受的变式的标准,如果部分正确也适当给分,则要做出更具体的规定。,(五)论文题,论文题适合测验组织能力、综合能力、文字表达能力,同时还可测量评价能力和创造能力。,编拟论文题目要注意以下几点:,1,、要让被试知道答案的范围和方向。,2,、最好要求被试在新的情境下,应用知识去解决新的问题。,3,、题目不要少或大,数量要适当多些,内容要适当具体些。,4,、要选用具有可接受的正确答案的题目,不用那些仅测量意见和态度的问题。,5,、在测验前,对每一个题目编制几个“理想”的答案,并对部分正确的问答如何评分做出尽可能具体的规定。,6,、一般不要有任选题,因为两个论文题目很难做到等值。,(六)应用题,应用题是叙述一个具体的情境并提出一些有关的数据,让被试解决所提出的问题。应用题适合测验计算技能、数学和科学推理,以及运用知识到新情境中的能力。,编写应用题要遵循以下原则,1,、题目的陈述要使被试明白让他干什么,答案应以什么形式出现。,2,、题目中应包括对解题所需要的一切数据和信息,也可包含一些无关数据和信息。,3,、采用新的情境和例子,不要重复过去已用过的。,4,、应向被试指明是否要求写出解答步骤,以及对各个步骤详细到什么程度等。,5,、对一个问题的答案不论正确与否,都不影响另一个问题的解答。,6,、文字要通俗易懂,不要变成阅读理解测验。,(七)操作题,在测验中有些项目是让被试实际操作,如画图、拼配物体等。,制定操作项目的主要原则是:使被试明确知道要他们干什么和在什么条件下干,如何使用工具以及时间限制。,操作项目可以根据完成的数量和错误次数客观记分,有些项目则需要给出评分标准,把整个操作分成许多部分技能,分别定出评分标准。,(八)联想题,联想题是让被试把与某个事物有关的事物写出来。此种题目能够考察发散思维能力,其缺点是评分不易有客观标准。,(九)排列题,依据时间、大小或其他原则,把测题中所列的项目重新排列一下顺序。此种题目评分较为客观,但应用范围有限。,(十)改错题,改正错误的字词,内容或逻辑错误等。,
展开阅读全文