资源描述
第一张
讲授新课一、考试、测量和评估的关系 1. 考试(Test) 2. 测量 (Measurement) 3. 评价( Evaluation ) 4. 考试、测量和评价的关系
1.测量。什么是测量? Stevens(195)认为,“广义而言,测量(measurement)就是根据法则赋予事物数量。”也就是说,按照一定的规则给事物的属性指派数字或符号的过程就是测量。这是迄今为止公认的测量定义。举例来讲,要测量一下桌子的高度,我们可以拿尺子来量一量,看看它有多高。尺子是人们根据一定的法则制定的量具,利用它就可以把事物的属性,即桌子的高度用数字表示出来,如,0.75米。这种测量属于客观测量,因为它基本上不受观察者的主观判断的影响。
测量这一定义包含三个要素:
1) 事物及其属性。这是测量的对象或目标。上面提到的对桌子的高度进行测量,属于对物体进行测量,其属性——高度,是可以观察到的,可以进行客观测量的。在外语教学领域,我们感兴趣的是学生的语言能力,而学生的语言能力属于人的心理特征,是无法直接测量的,但是人的心理活动会在人的具体活动和行为中体现出来,所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低。
2) 指派数字或符号。所谓指派数字或符号,就是用数字或符号来代表某一事物或事物的某一属性的量。如张三在本次阅读考试中得了87分,李四得了92分,我们说李四比张三多考了5分。数字本身没有意义,只是一种符号。我们用它来代表考生的阅读成绩,这时它就变成了量化的数,可以对其进行解释和分析。在一定的条件下,还可以对数据进行运算从而对事物的属性进行推测。
3) 法则 。法则是指测量所依据的规则和方法,是测量的关键。法则不好或不可靠,得到的测量结果就会出偏差,失去测量的意义。简单来说,尺子不准,测量的结果就无法使人信服。对客观世界的物体进行测量时,由于有公认的测量法则或尺度,如测量物体的高度、重量等;一般不会出现大的偏差。而对人的某些特性(心理特征)进行测量时,则往往会出现较大的偏差。举例来讲,有几个评委对某学生的英语口语进行评定。评委A认为一个人的口语要好,必须发音准确,而该学生的发音好,所以他给打了个5分。评委B认为流利性最能体现一个人的口语水平,该同学尽管发音不错,但流利性差一些,所以她给他3分。同一名学生,让不同的评委去打分,成绩出现了偏差。这也很自然,原因是他们没有按照一个评定口语成绩的统一法则(rules)去给这名学生打分,结果造成了偏差。这个例子提醒我们,在对人的某些心理特征,如口语表达能力、阅读理解能力等等进行测量时,首先要制定一个便于操作的,稳定的法则或标准。这样得到的测量结果才可靠,才具有可比性。
2.测试 测试(test)又称测验。不同的心理学家对此下的定义不同。Anastasi(1982)认为,“测试实质上是对行为样本所做的客观的标准化的测量。”这个定义是人们公认的最权威的定义,它包含以下三个基本要素:
1) 行为样本语言测试的目的是要测量受试者的语言能力。上面提到,语言能力是无形的,如何测量?只能测量它的有形表现,这里所说的有形表现,是指语言表现,如说出来的话,写出来的句子,对测试题目所做的各种反应等等、这些行为,都是无形的语言能力的有形表现,用心理学术语叫“表征”(manifestation)。所谓行为样本,是指对语言能力表现行为的有效的抽样。我们知道,一个人的语言能力的表现行为会有各种各样的形式,测试时不可能也没有必要把它的全部表现行为都测到,只能选取一部分有代表性的抽样进行测量,然后据此对受试者的语言能力作出推测。2) 客观的测量。所谓客观的测量是指测量的标准是否符合实际。对于一项测试的客观性程度可以从这么几个方面去评价:⑴ 测试题目的难易度和区分度如何;⑵ 测试结果的可靠性程度如何?⑶ 测试结果的有效性如何?这几项指标是衡量一项测试质量的重要指标。3) 标准化的测量标准化的测量是指在测试题目的编制、测试的实施、记分以及对分数的解释等方面有一套严密的系统的程序。只有这样,测试才有统一的标准,对不同人的测量结果才有可比性。凡是不标准化的测量,都没有可比性。
3.评价 Weiss(1972)认为,“评价(evaluation)是指为作出某种决策而收集资料,并对资料进行分析,作出解释的系统过程。”与测量、测试相比,评价的含义更广、综合性更强。Bachman(1990)指出,决策的正确与否,一方面取决与决策者本身的能力,另一方面则取决于收集到的信息的质量。在其它条件等同的情况下,如果收集到的信息越可靠,相关性越强,那么,作出正确决策的可能性就越大。所以说,评价的一个很重要的方面就是要获得可靠的、相关的信息。在谈到评价与测量及测试的关系时,Bachman指出,在对个体(学生)作出评价时,我们可以从质量和数量两个方面进行描述,或只描述其中一个方面。所谓质量方面的描述是指对学生的行为作出定性的描述,如某 某学生的口头表达能力优秀,书面表达能力优等;数量方面的描 述则是指某次测验的分数等。
测试、测 量及评价三者之间的关系,使用下面的图来表示。图1. 测试、测量及评价三者之间的关系
从图中可以看出,我们在对某教育目标(或学生的行为)作出评价时不一定用到测试或测量(如面积1所示),这种评价属于质量评价,或叫定性评价,如指出学生在学习方面存在的问题。有时在作出评价时只需测量,而无需测试(如面积2所示),对学生的口头表达能力定出级别就属于这种性质的评价。如果要检查学生学习的进步情况,通常就要对学生实施测试,这又是另一种性质的评价,即只通过测试对学生的成绩作出评价(如面积3所示)。许多情况下,测试只是作为一种科研的工具或手段,而不是用来作出评价(如面积4所示),在外语教学、第二语言习得研究领域,我们经常拿水平测试作为研究的工具。不用测试便可进行测量的情况(如面积5所示)在外语教学研究领域也经常碰到,在研究学生的第二语言习得时,如果研究对象为来自不同国家的学生,人们一般按其母语情况编号。总而言之,并非所有的测量都是测试,并非所有的测试都属于评价,而且并非所有的评价活动都涉及到测试或测量。
二、外语考试的功能 外语测试有三大功能,即信息反馈、成绩评定和人才选拔
。. 1 反馈功能 外语考试能为师生双方提供及时的反馈信息,从而提高教与学的质量。考试所提供的反馈信息又具有如下两种功能。(1)调节功能 用调节功能来调节行为以达到一定的教学目标,称为反馈信息的调节功能。在外语教学中,师生双方常常依据考试的结果来调节教与学的活动。因此考试是教学中不可缺少的一环。缺少教学的反馈信息,教师很难使自己的教学有的放矢,也不利于学生及时发现自己的薄弱环节。(2)动机功能 学习动机是激起学生学习的内部动因,例如父母、教师的表扬、奖励,同学间的竞争,这些都能提高学生的积极性,考试也具有这类作用,这就是考试反馈信息的动机功能。凯斯(N· Keys) 的研究发现,每周对学生进行一次测验比每月进行一次测验更能提高学生的成绩(约提高12%左右)。这是因为前者给予学生的信息比后者多,学生学习动机的强度增大。但是考试也往往给学生带来考试焦虑,因此考试的密度也不是越大越好,而应适当控制。考试的反馈功能看重教学的过程,它更具有教育价值
2. 评定功能 考试的评定功能是考试的一个主要功能,也是教师用得最多的一个功能。考试常被用来评定学生的学习成果,这就是考试的评定功能。例如,学期结束教师往往利用考试成绩给学生评等级、发证书 (评定学生合格与否)。自有考试以来,人们就很重视考试的评定功能。与考试的反馈功能不同,考试的评定功能强调教学的结果。
3. 选拔功能 考试的选拔功能是指利用考试成绩对人才进行选拔的一种功能。这一功能最为突出的考试就是高考。考试具有选拔功能是基于这样的假设:一个好的考试能把不同语言能力的人区分开来,因此考试成绩的不同就代表了语言能力的差异。考试的质量是考试是否是真正具有选拔功能的条件。如果不注意考试质量而滥用考试的选拔功能将带来不堪设想的后果在外语考试的三大功能中反馈功能对教学的促进作用最大,但却最容易被人忽视。某学生的口头表达能力优秀,书面表达能力优良等;数量方面的描 述则是指某次测验的分数等。
三、考试在教学中的地位与作用
1. 考试在教学中的地位与作用 考试是外语教学过程中的一个重要的组成部分,外语考试与外语教学之间存在着相辅相成,互为影响的关系(见图2)。
在教学中教学目标起着决定性的作用,它决定了教什么(教学内容)和怎么教(教学方法);教学目标是否达到需要考试作为它的评估手段,因此考试的测试目标必须以教学目标为依据,这样才能起到评估教学目标的作用。在教学考试中,教学内容决定了考试的内容(考什么),而教学方法决定了考核方法(怎么考),因此从理论上说,考试只是教学的一个组成部分,它的考核内容与方法由教学目标、教学内容和教学方法所决定。考试应在教学目标的指导下进行,并不是说考试可有可无。在教学实践中,我们发现考试占有很重要的地位。有时甚至影响到整个教学过程,使教学围绕考试进行,其典型例子就是应试教育。这是因为考试除了有受教学其他环节和因素影响的一面外,它反过来对教学其他环节又有反作用的一面,亦即所谓的反拨作用(backwash)。因为外语测试的结果不但能判断外语教学目标设置的正确性、可行性及实现的程度,而且也能反馈、控制外语教学活动。过分强调考试的反拨作用,特别是强调考试的评定和选拔功能,必然导致考试在教学过程中的错位。教师、学生、家长、教育部门对考试作用的过度强化所形成的合力就会导致应试教育,使考试成为教学的核心和教学的目的,这应该加以避免。
2. 对应试教育的思考 考试在外语教学中有很大作用,但过分强调考试的作用反而会干扰教学。从考试与教学的关系上看,应试教育实际上是不恰当地强调考试评定与选拔功能的结果,它造成了考试与教学关系的倒置。正确地运用考试的反馈、评定和选拔功能可以促进我们的教学且是教学必不可少的环节,但是过分强调某些功能必然背离教学目标。 过分强调反馈功能使得考试次数过于频繁,考试代替了教学,这在初三、高三毕业班的教学中尤其明显。这不但不利于激发学生的学习动机,反而使学生产生对学习的厌倦。过分强调考试的评定功能,必然把师生的注意力引向教学的结果,而且把评定功能的对象从学生扩大到教师。教师的教学效果以学生的考试成绩为评定依据,使得教师也围着考试转。提高学生的考试成绩成了教师教学的唯一目标。教育管理人员以考试目标代替教学目标来评定学 生和教师,更加剧了应试教育的。 过分强调选拔功能,就会使教育的全部功能异化为培养高校人才一种功能,使得学生、教师、家长、教育管理人员把通过升学考试看成是教育的全部含义,造成整个社会为应试教育呐喊助威,形成了应试教育的社会环境。在外语考试中为了体现选拔的公正与公平,考试以客观型试题为主但是在教学中也只重视客观型考试必然,削弱语言运用能力的训练。 目前考试中有许多不尽如人意的地方,并不意味着只取消考试教学就能上去,或者搞素质教育就意味不要考试。如前所述,考试能为师生双方提供大量教学信息,很难想象离开了考试我们的教学能成功。应试教育要向素质教育转轨,就应是对考试在教育中的作用有一个正确的理解就应该让考试回到它应有的位置上,这是考试科学 化的出发点。
巩固练习
1. 外语测试的主要理论支柱是_ACE_______。A.语言学 B.社会学 C.学习心理学 D.哲学 E.测量学
2. “外语测试”是一门新兴的边缘学科,它经历了_ADE_______ 几个阶段。A. 前科学阶段 B. 后科学阶段 C. 传统测试阶段
D. 心理测量和结构主义 E. 心理语言学与社会语言学
3. 外语考试的主要功能包括_BCDE________。A. 检测 B. 动机 C. 评定 D. 调节 E.选拔
4. 考试是由一定数量的题目组成,用于测定人的AE________ 的工具。A. 心理品质 B. 学习能力 C. 学习态度 D. 学习分数 E. 学习程度
5. 对学生的学习行为进行评价的主要依据是__BD______。A. 教材 B. 测试目的 ` C. 大纲 D. 测试结果 E. 学习兴趣
6. 根据外语测试的理论说明产生应试教育的原因。
6. 产生应试教育的原因很多。从测试理论看,由于考试对教学有非常大的反拨作用,因此考试和教学的位置往往被颠倒。很多学校、甚至社会上的不少人将升学率视为学校教学质量的主要标志,从而造成考试指导教学,而不是教学目标决定考试的不正常现象,发展到极端就造成了应试教育,造成了如下图的情况。
此外,在发挥考试的作用方面,应试教育过分重视考试的评定与选择功能,而忽视考试的反馈功能。由于高考对师生都有至关重要的作用,因此教师在平时的考试中大量采用高考模拟题,并根据考试成绩不断地对学生排名次,从而丧失了考试在教学中的最重要的作用――信息反馈的调节和动机作用。
过分强调考试的评定功能,必然把师生的注意力引向教学的结果,而且把评定功能的对象从学生扩大到教师。教师的教学效果以学生的考试成绩为评定依据,使得教师也围着考试转。提高学生的考试成绩成了教师教学的唯一目标。教育管理人员以考试目标代替教学目标来评定学生和教师,更加剧了应试教育的。
过分强调选拔功能,就会使教育的全部功能异化为培养高校人才一种功能,使得学生、教师、家长、教育管理人员把通过升学考试看成是教育的全部含义,造成整个社会为应试教育呐喊助威,形成了应试教育的社会环境。在外语考试中为了体现选拔的公正与公平,考试以客观型试题为主但是在教学中也只重视客观型考试必然,削弱语言运用能力的训练。
第二章 讲授新课
一、分离式测试、综合测试和交际测试的理论依据与测试的特征
(1) 分离式测试 (Discrete-point Test) 分离式测试的理论依据分离式测试有三大理论依据:结构主义语言学、行为主义心理学和听说教学法。A. 结构主义语言学对分离式测试的影响。结构主义语言学认为语言是一组符号,有其内在结构。完整的语言结构系统由层次不同但相互联系的语法结构和语言成份组成。用来描述语言结构的语言基本成份有音素、词素等。音素和词素构成单词,单词组合成词组,词组组合成子句,子句又可组成句子,语言就是这样一层一层地构成了一个体系。因此,语言考试也可以从听、说、读、写,以及音素、单词、句子等方面分别加以考核。B. 行为主义学习论对分离式测试的影响行为主义学习理论认为任何复杂的学习行为都可以分解成最基本的单元:“刺激—反应”(S—R) 的联结。学习实际上是建立“刺激—反应”的联结。五十年代新行为主义的代表斯金纳提出S—R的联结是通过强化(reinforcement) 实现的。他把学习过程归纳为“刺激—反应—强化”(S – R - S )。例如,父母教孩子学说话,父母教的话是一种刺激,孩子的模仿是一种反应,父母对孩子的模仿或表扬或纠正,这就是强化。儿童学会正确地使用语言就是通过刺激—反应—强化这样的过程实现的。行为主义学习理论认为语言是由无数行为构成的,是个体语言行为或称言语习惯的一个集合体。行为主义学习理论对分离式测试的影响是多方面的,首先它的理论对结构主义语言学和听说教学法产生影响,这种影响又在测试中得到间接反映;其次,行为主义学习论认为言语行为是反复“刺激—反应”最终形成习惯的结果。言语是一套习惯,习惯必然达到自动反应的程度,因此在语言测试中就应该有一定的速度要求。这一思想在TOEFL考试中就很明显,这类考试量大,而且每一部分都有速度要求。C. 听说教学法对分离式测试的影响听说法以结构主义语言学和行为主义学习理论为依据,提出了听说法的基本原则:听说领先;反复实践,形成习惯;以句型为中心;排斥或限制母语;对比语言结构,确定教学观点;及时纠正错误,培养正确的语言习惯和广泛利用现代化教学手段。听说法所依据的这些理论在外语测试中也得到了反映。语言是一种习惯在测试中至少有两个含义。首先,应用语言的速度应是外语测试中的一个被测要素,因为一个人只有能对自然的语言环境做出快速、自动的反应,才能认为他真正掌握了一门语言。其次,掌握一门外语也就意味着掌握了另一套语言习惯,因此通过两种语言差异的对比能最有效地测试出考生的外语水平。听说教学法认为“语言是口语而非文字”,体现在外语测试中就是要加强听、说在语言考核中的地位,对于初学者更是如此。 听说教学法认为“语言是本族人说的话”,这意味着在外语测试中应使用地道的语言材料。听说教学法认为“教语言是教会人学会使用语言而不是教语言知识”,这一原则在考试中就成了“考语言使用,而不是考有关语言方面的知识”。 听说教学法认为 “语言和语言之间是有差异的”,则意味着通常在外语测试中翻译只能起有限的作用。 ·
分离式测试的特点 拉多(R · Lado ) 在他的《语言测试》一书中全面总结了美国的结构主义语言学派在语言测试领域中的观点。这些观点对外语测试也产生了很大的影响。拉多认为:① 由于个人的语言技能发展是不平衡的,语言测试可以从听、说、读、写四个方面分 别进行,以了解个人在多方面的现有水平。② 语言是有结构并按层次构成的,测试可按层次由低到高进行。例如对听能的测试就 可以分为:1) 音素(元音、辅音、语调、重音等),2) 词汇,3) 句子, 4) 小段对 话或短文等等。③ 语言情景是无限的,而语言成份是有限的,因此测试语言成份更有效。根据这一观 点,这类题目的测试往往是孤立的,没有上下文联系的语言成份。④ 母语与外语在相互转换时,两者在形式、结构和意义等方面有一定的不同之处,这 些不同之处是需要通过学习掌握的,因此也是语言测试的重点。⑤ 语言是一门科学,试题要精确、客观、可靠和科学。因此,考试结果要运用统计学 原理对试题的各项指标 (如难度区分度等) 进行分析。⑥ 试题要采用只有一个正确答案的题型如正误判断、多项选择题等,以保证试题的客 观性与科学性。⑦ 评分采用客观打分的方法,任何人阅卷结果都一致。
(2)综合测试 (Integrative Test)
综合性测试的理论依据A. “语用期待语法”假设 美国语言学家奥勒(John W· Oller) 针对分离式测试认为语言能力可分的观点,提出了整体语用能力的假说,他认为“语言水平的构成也许更像一种粘性物质,而不像一部机器,可以很容易地被拆成一个个部件。”他反对分离式测试把完整的语言分解成很小的语言单位,然后分别加以测试。他认为这种脱离语境、孤立地测试语言成份的做法,不能测出学生实际使用语言的能力,奥勒认为在通常的语言交际过程中,语境或称上下文(context),对于确定句子中模棱两可的语音或词义有着至关重要的作用。因此,在语境中确定语音和词义的能力远比在无语境的孤立语言材料中辨认语音或词义的能力来得重要。奥勒把在语境中进行语言加工的能力,称之为“语用期待语法(规则)”。他认为正是有了这种能力才使我们能够理解和表达语言,因此“语用期待语法”在奥勒看来是语言测试的最适宜的目标。他把能测定这种能力的考试 (如,完型填空、听写等) 称之为“语用测试”。
B. 格式塔心理学与综合性测试。对综合性测试产生影响的另一理论是格式塔心理学(Gestalt Psychology),或称完形心理学。它是一种反对用元素分析的方法研究心理,而强调整体组织的心理学理论行为主义心理学认为语言是一种行为,语言学习就是通过反复“刺激―反应”最终形成一套语言习惯。研究复杂的语言行为可以通过分解,从了解最简单的S—R(刺激---反应)的联结着手。这在语言测试中就表现为将整段有意义的话语分解成简单的句子加以考核,而不重视语言的情景。和行为主义这一做法相反,格式塔心理学则强调感知的整体性,认为整体不等于部分之和,整体是先于部分而存在,并制约着部分的性质和意义。综合性测试强调语境,强调语言环境和语言外环境的对应关系,正是受了格式塔心理学的感知整体性思想的影响。我们在使用语言时是离不开语境的。如果我们把完整的语言分解成互不关联的句子,甚至分解成音素,然后进行考核。那么把各部分结果机械的相加也不能代表一个人的整体能力。综合性测试的形式 综合性测试的主要形式是完形填空和听写。这是最常用的测试方法。此外,综合性测试还包括完形听写、口头完形填空、释义、回答问题、面谈、写作和口头叙述等。综合性测试的特点综合性测试与分立式测试相比有着自己独特的长处。首先,综合性测试往往把听、说、读、写等技能混合在一起测试,从而能比较准确地测出考生运用语言的综合能力。其次,综合性测试十分强调语境在语言使用中的作用,这类考试始终在语境中测试学生使用语言的能力,因此测试结果比分离式测试更接近于考生实际使用语言的能力。
·(3)交际性测试 (Communicative Test)
· 交际性测试的理论依据 交际性测试的理论依据是社会语言学和交际法(也称意念----功能法)。
A. 社会语言学
六十年代中期,社会语言学兴起。这一学派重视语言的社会功能,主张把语言放在社会环境中研究。社会语言学研究语言结构变异和社会变异之间的关系,研究语言和社会的关系,以及语言在社会中的功能。社会语言学一改以往语言学的研究重视语言形式,轻语言使用的倾向,十分重视研究语言的社会功能。社会语言学家们认为。语言的社会交际功能是语言最本质的功能。
B. 交际教学法
以社会语言学为理论基础的交际教学法提出了以语言功能项目为纲以培养交际能力为本的教学方法体系。社会语言学家海姆斯(D · H · Hymes) 认为,一个学语言的人,其语言能力不仅指他能否造出合乎语法规则的句子,而且还包括能否恰当使用语言的能力。海姆斯进而提出了交际能力(communicative competence)的概念。海姆斯提出的交际能力既包括了语言能力(linguistic competence),也包括语言行为(linguistic performance)。他认为交际能力应体现在四个方面,即形式正确、合理可行、内容得体、实际使用。首先,一个人的交际能力表现在能否辨别、组织合乎语法的句子。所谓的形式正确指的是句子结构应符合语法规则。这是用语言进行交际的首要条件,也是语言本身提出的要求。其次,交际能力表现为我们所使用的句子从心理语言学的角度看,应是合理可行的。这里所说的合理可行是指心理语言方面的因素,例如记忆的广度、感觉器官的感知等,也就是说我们所使用的语言应符合我们感知语言的规律,它和语言行为有关再次,交际能力表现为能根据情景判断语言得体与否。语言的使用离不开情景,因此在使用语言时我们应该遵循“得体法则”,即我们所使用的语言应是适当的、令人愉快的和成功的。最后,交际能力表现为能知道语言形式出现的可能性:是常用习语,还是罕见的个人用语?一句句子可能语法正确,也符合使用语言的心理特点,内容也得体,但实际上可能没有人这么说。如果出现这种情况,也不能认为此人交际能力强。
交际性测试应体现上述特点。
交际性测试的特点正如卡罗尔所下的定义那样,交际性测试是一种行为测试,是在真实的或与接近真实的情景中,通过完成实际任务估测语言掌握程度的一种考试。由于这类考试往往模拟一项交际任务,因此这类考试又称“基于任务的考试”(task-based tests)。同时这类考试也是一种综合听、说、读、写多种技能的考试。 根据交际法原则而编写的交际性测试,目前有以下一些特点: ① 注重语言行为 交际性测试虽也兼顾测试语言知识,但更注重测试考生的语言行为,因此考试 主要采用主观型试题,而很少用选择题。② 设置真实情景 考试中的语言交际场景是现实生活中存在的,而非虚拟的。因此,考试结果也更 能反映考生的实际水平。 ③ 强调针对性 随着ESP(English For Special Purpose)的发展,考试所涉及的主题和用语也更 有针对性,即更针对考生所学专业,测试考生使用专业外语的行为,从而出现了所谓的 “行为参照考试”(performance—referenced tests)。 ④ 以语段为测试单位 分离式测试的最小语言测试单位一般是句子,甚至可以小到音素,而交际性测试的 最小语言测试单位是语段。⑤ 多技能的综合测试
二、交际能力的概念三、成绩考试、水平考试、学能考试和诊断考试的用途
(1)成绩考试 (Achievement Test, 也称 Attainment Test)
成绩考试主要用于了解学生在经过较长一段时间学习后,对教学大纲中所规定的课程要求(包括知识和技能)掌握的情况,或者说取得的成绩。成绩考试应以教学大纲作为命题依据。它测试的是学生掌握教学目标所规定的语言知识与技能的掌握程度。通常所说的教什么考什么是教师使用成绩考试时的一个特点,在一纲一本的教学条件下,它往往以教材为命题依据。在一个大纲多本的情况,对考试成绩解释的唯一依据就是大纲。成绩考试可以作为升留级、授予文凭、决定毕业与否的依据。国外一些标准化的成绩考试建立了自己的常模,用它可以确定学生实际水平处在哪个年级,并可将各校的水平进行比较。成绩考试有时也用来预测学生将来的语言学习情况,这时它和水平考试的差别就很小。但预测不是成绩考试的主要功能
(2)水平考试 水平考试主要用于测试学生的语言能力与水平,预测他将来完成某项任务的情况。和成绩考试不同,它不考虑考生先前受过何种语言训练,也不以任何教学大纲、教材和教学计划作为命题的依据。它以考生今后为了胜任某项任务而必须在语言熟练程度上要达到水平作为考试的命题依据。尽管水平考试主要用于预测,但由于将来所要完成的任务和以前考生的训练之间关系有密有疏,因此水平考试与教学大纲的关系也有紧有松。我国的英语高考是一种水平考试,它主要预测考生将来能否胜任高校的学习,它以今后高校外语学习的要求作为命题的依据,但由于我国中学实行的是统一的大纲,以前甚至使用统一教材,而大学的学习又与中学相衔接,因此高考英语卷的命题仍离不开教学大纲。另有一类水平考试与高考、TOEFL考试不同,它既与考生以前的学习无关,也不考虑今后的工作或学习任务。这种水平考试所测定的水平 (proficiency) 具有更普遍、更一般的含义。例如,英国的第一证书考试(First Certificate Examination)和剑桥大学的水平考试(Proficiency Examination)。这类考试测试考生的语言能力是否达到了某种水平。负责这类考试的机构一般独立于教学单位,因此更公正。人们可以利用这类考试对不同国家、不同地区、不同学校的学生情况进行公正的比较。这类不以某一特定任务为测试目的的水平考试,仍有自己详细的考核细目,和考核要求,而且每次考试均以此为命题依据。因为只有如此,想使用该类考试的人员(包括教师、学生和考试单位)才能正确的判断该考试是否适合他们使用,才能正式解释考试成绩。尽管各种水平考试在考试的内容、难度等方面可能千差万别,但它们有一个共同点,即在考试中都可以不反映考生曾使用过的教学大纲和教材的要求。相反这类考试会对考生学习语言的方法和采用何种语言教材产生影响。
(3)学能考试 (Aptitude Test)
学能考试主要预测学生学习外语的潜在能力。这类考试和其他外语考试不同,成绩考试、水平考试和诊断考试都是通过考外语来确定考生的外语情况,而学能考试却是通过测定母语及其他能力来预测考生的外语潜能。这类考试更象体育运动中选拔运动员的选才考试。学能考试从分析影响学生外语学习的因素着手,根据这些因素确定相应的测试方法,然后依据测试结果预测一个人学习外语的潜力。因此,学能考试的命题依据是外语学习理论和外语习得理论,也就是说,它更多地是根据心理学和心理语言学的理论来指导命题。目前世界上较有名的外语学能考试有两套。一套是皮姆斯勒 (Paul·Pinsleur) 编写的“语言能力成套测试”(Language Aptitude Battery,简称为LAB)。皮姆斯勒认为对一个人的外语学习产生影响的有三大因素:言语智能 (verbal intelligence)、学习动机 (motivation)和语音能力 (auditory ability);并从六个方面预测考生的外语学习潜能: (1) 外语以外其他学科的平均分,(2) 外语学习的兴趣,(3) 母语词汇,(4) 语言分析,(5) 声音辨认,(6)音形联系。前两项由考生填写,后四项采用考试形式,要求考生在规定的38分钟内完成。
另一套是由卡罗尔和萨庞(carroll and sapon)编写的“现代语言能力测试”(Modern Language Aptitude Test ,简称为MLAT)。卡罗尔等人认为一个人的语言潜能取决于下列因素:(1)语言编码能力——将听到的语言材料进行“编码”,间隔一段时间后重新辨认或记忆的能力;(2)语法敏感性——根据上下文对单词在句中功能的判断力;(3)机械记忆能力;(4)语言归纳能力。卡罗尔用5个分测验对上
四种能力进行测定。完整版包括所有5个分测验,规定在70分钟内完成。简约版只包括3个分测验,规定在30分钟内完成。
学能测试主要用于预测和诊断学生的外语学习能力。
(4)诊断性考试 (Diagnostic Test,也称Formative Tests ) 诊断性考试主要用于了解学生在外语学习过程中的进展情况及存在的问题,从而补救教与学的不足。因此诊断考试主要为教师所用。教师根据本人教学需要自行命题,测试重点是了解外语教与学的问题。这种考试往往在教学过程中进行,考试成绩作为诊断教学进展情况之用,而不作为衡量学生水平的尺度,故称之诊断考试或形成性考试。为了达到诊断学生学习困难的目的,诊断考试不能象成绩考试和水平考试那样只给一个总分,对学生的语言能力做一个总体评估,而必须提供更多的信息,详细地指出考生的长处与弱点,因此考试内容的选择是诊断考试编写中的一个重要方面。诊断性考试每次考核的范围不能很大,考核的内容必须有代表性,而且每个考核内容必须有适当的题量,这样才能对考生在某一方面的长处与问题作出可靠的推断,并对造成的原因作出合理的解释。
诊断性考试有三个主要用途:a.检查整个班级是否达到了预期的教学目标,以检验教师的教学方法是否可行b了解哪些学生未达到教学目标;c. 找出未达标学生的学习问题。
四、主观型考试和客观型考试的区别 主观型考试是指阅卷人员的主观因素如语言水平、对评分标准的理解、阅卷时的心情等对考试的分数会产生影响的一类考试。例如英语写作、口试等就属于主观型考试。客观型考试是指考试的评分不受阅卷人员主观因素影响,任何阅卷人评分的结果都一样,甚至可以用机器阅卷的一类考试。例如大量使用多项选择题的考试就属于客观型考试。 客观型考试和主观型考试可以从以下三个方面加以区分。1) 语言的表达量。 做客观型试题时,考生几乎无需用外语表达,他们所做的一切只是在许多现有的答案中做出选择,而在主观型考试,考生必须用外语表达自己的思想。2) 所测试的能力不同。 主观型考试测试的是考生的语言表达和使用能力,而客观型考试测试的是考生辨别正确答案的能力。判断语言水平高低的依据不同。 在客观型考试中,考生的回答离不开编题者的语言水平;而在主观型考试中,考生的成绩的取决于本人的语言应用水平。因此,客观型考试成绩反映的是考生与出题者两者之间的语言水平的差异。它无法显示考生在实际语言应用中的真实水平
五、常模参照考试和标准参照考试的区别 常模参照考试是将某一学生的行为(通常用学生的考试成绩表示)与参加同一次考试或同一类考试的其他学生的行为作比较后,作出考试成绩解释的一种考试。这里解释学生考试结果的参照指标是考生的平均成绩,即所谓的常模,因此称为常模参照考试。它是一种相对评价。标准参照考试或称目标参照考试,以事先确定的知识和技能目标作为参照标准,解释考生成绩的一种考试。它是通过考生与外在的标准进行比较后,解释考生分数的一种方法,是一种绝对评价。
上述两种考试的成绩一般可以提供两大类信息:(1)每个学生在群体中的相对位置,(2)所掌握的外语知识和技能。第一类考试的成绩说明的是每个学生与其他学生相比所处的位置。
第二类考试表明每个学生具体掌握了哪些知识、技能。常模参照考试和标准参照考试仅仅指解释测验成绩的方式不同,从试题的形式和考核内容上,有时很难作出区分。两者可以使用同样的测 试方法,甚至同样的试题,但却可以用不同的方法解释考试的成绩。这两种测试也有各自的特点,其主要差异可见表3。常模参照考试和标准参照考试有各自不同的用途。常模参照考试主要用于甄别、分类、选拔等,例如,编班考试、外语竞赛、高考等考试就属于常模参照考试。标准参照考试常用于各类证书考试,如高中会考、学校期末考试、市民英语等级考试、大学英语四、六级考试等都属于这类考试。
表3 常模参照考试与标准参照考试特点比较
常模参照考试(NRT)
标准参照考试(CRT)
主要用途
考生间进行比较
了解学习掌握程度
测试重点
个体差异
了解学生具体的学习情况
内容覆盖
覆盖面广
在所要了解的领域内
考核内容应尽量详细
试题选择
试题的区分度越大越好
(分数间的差异要大),应剔除十分容易的题目。
应包括一切能说明学生
学习水平的试题,不必考虑
试题的难度与区分度
评价成绩的标准
根据学生在群体中的相对
位置来确定该学生的学习水平
根据一个预先制定的绝对
标准来确定该考生的水平
六、标准化考试的概念
标准化考试是采用系统科学的程序对考试进行编写与实施,考试的每个阶段特别是试卷设计、测试、考试实施、建立常模等阶段都有统一严格的标准,并且对误差进行严格控制的考试。为了使考试准确可靠,考试的每个环节都实现了标准化,故称标准化考试。这些环节包括试题编写的标准化、施测过程的标准化、评分计分的标准化、结果解释的标准化等。标准化考试一般具备如下七个特征:(1)权威性。标准化考试必须由权威性的机构负责组织和主持,根据一定法令来实施,并受法律的保护,结果受到国家和公众的承认。(2)稳定性。定期举行,保持严格稳定的标准,不同时间举行的同一类考试的分数具有可比性。(3)社会性,面向社会,对社会负责,为社会提供鉴定和选拔人才的尺度。(4)广泛性。规模大,跨地区。(5)科学性。根据现代教育测量学的理论,对试题的难度、区分度、信度、效度等考试质量指标进行科学的统计分析,严格控制测量误差,使考试达到预期的指标。(6)建有常模。建立一个可以对考生分数进行比较的常模,并定期对常模进行修改。(7)系统性。有三支专业化队伍紧密配合:行政管理队伍、命题队伍和电脑统计分析队伍
巩固练习
(一). 填空题:
1. 交际能力就是既要拥有语言知识又要有__使用语言______的能力。
2. 分离测试的最大弱点是不符合语言的___实际使用____情况。
3. 综合测试的方法与分离测试正好相反,它测试的是考生___使用语言的综合______能力。
4. 尽管综合测试测定的是考生对多种语言技能和语言成分的掌握情况,但它仍属于 _间接_______测试,与现实生活中的语言行为没有直接联系。
5. 出国人员选拔考试属于_____水平__测试。水平
(二)单答选择题
1. 将人的语言能力视为一个整体,对考生的多种能力的多个方面同时进行的测试称为___C_______。
A. 分离式测试 B. 交际性测试 C. 综合性测试 D. 水平测试
2. 海姆斯提出的交际能力包括四个方面,即形式正确、合理可行、__D____ 和实际使用。
A. 应对灵活 B. 交谈流畅 C. 行文规范 D. 内容得体3.分离式测试认为语言能力是可分的,这一
展开阅读全文