1、第29卷第1期江 苏 理 工 学 院 学 报JOURNAL OF JIANGSU UNIVERSITY OF TECHNOLOGYVol.29,No.1Feb.,20232023年2月教材是把教学目标与教学实践连接起来的桥梁153。适用的教材能够帮助学生更好地掌握目标词汇,从而体现考试的公平性,因此,高中英语教材应该能够大致覆盖高考词汇。2021年起江苏高考使用全国卷,但常用的高中英语教材仍是江苏卷时期译林版的教材,这套教材能否覆盖全国卷的词汇?覆盖程度如何?篇际词汇重复率是否科学?与“人教版”高中英语教材相比,有无显著差异?对于高中师生与教材编撰者,上述问题值得考证。词汇覆盖率(lexica
2、l coverage rate)是指某一给定词汇表与某语篇或语料库相同的词汇数与该词汇表的词汇量的比率。篇际重复率(inter-textuallexical repetition rate)是指同一词汇在不同篇章中的重复率。Laufer2316-323研究发现,二语学习者需要有文章中所有词汇的95%的词汇量,才能获得大致的理解。Hu和Nation3 403-430也对词汇覆盖率与阅读理解之间的关系进行了研究,结果表明在词汇覆盖率为80%时,没有人可以充分理解文章;在词汇覆盖率为90%或95%时,有极少数的人可以充分理解;而有98%以上的词汇覆盖率才能使学习者获得充分理解。正如Nation所述,
3、“如果以98%为阈值,几乎所有的学生都有机会获得充分理解;而如果以最低限度的理解为标准,那么95%的覆盖率则可能是阈值”4147。所以,至少95%的词汇覆盖率才能确保对文本的基本理解。统计一个词在教材中的篇际重复率是评估教材词汇的一个重要指标,对于科学的篇际重复次数,学界意见并不统一,Nation 考察相关研究指出,一个单词要重复至少5次才能被习得5。江苏新高考背景下英语教材对全国卷的词汇覆盖率研究赵秀莲(江苏理工学院 外国语学院,江苏 常州 213100)摘要:基于语料库的方法,探究译林版和人教版高中英语必修教材对近10年全国I卷的词汇覆盖率,并分析考卷词汇在两套教材中的篇际重复率。研究发现
4、,译林版与人教版教材对近10年全国I卷的词汇覆盖率分别是59.30%和53.28%,译林版显著高于人教版;全国I卷词汇在译林版与人教版教材的篇际重复率分别是24.10%和23.62%,两者无显著差异,但对考卷词汇的篇际重复率均较低。研究结果说明,江苏现行译林版高中英语教材对新高考词汇的匹配度高于人教版教材,但与理解阈值相比仍待提高。建议采用扩充性词汇教学弥补教材尚未覆盖的高考词汇,并通过习题充分呈现教材中篇际重复率低于5次的高考词汇,同时建议修订教材提升高考词汇的覆盖率和篇际重复率。关键词:词汇覆盖率;高中英语教材;全国卷;语料库中图分类号:G642;H313文献标识码:A文章编号:2095-
5、7394(2023)01-0072-05收稿日期:2022-02-12基金项目:2021年教育部人文社科一般项目“基于语料库的五眼联盟涉华舆情的批评话语研究”(21YJAZH125);2020年江苏省高校哲学社会科学项目“基于语料库的中国抗疫的海外舆情研究”(2020SJA1194)作者简介:赵秀莲,副教授,主要研究方向为语料库。DOI:10.19831/ki.2095-7394.2023.01.015国内以词汇覆盖率为主题的相关研究成果始于2003年,截止2021年7月6日,总量不过百,但总体呈上升趋势。根据研究内容可以分为四类:一是研究英语教材词汇难度6-8;二是研究通用英语词汇对专业英语
6、词汇或特定语域词汇的覆盖率9-12;三是研究词汇覆盖率的测试软件与数学模型13-14;四是研究学生掌握的词汇对学习材料的覆盖率15-17。国外有关“词汇覆盖率”的研究,主要集中在通用英 语、学 术 英 语,口 语 等 不 同 文 本 类 型(genre)之间的相互覆盖程度18。研究要读懂某类文本所需词汇量可以发现,如要读懂流行歌曲需3000单词加上专有名词19;读懂400篇TED演讲所需词汇量是4 000词族加上专有名词和生僻词20;读懂计算机专业书籍,需3 300中学词汇加上356个计算机专业词族21。由于中国高考的影响力主要在国内,国外相关教材与高考卷的研究很少。综上,学界对于“词汇覆盖率
7、”的研究为本研究提供了完善的理论基础,但是关于高中英语教材对高考词汇覆盖率的研究尚待开展。本研究拟采用语料库的方法,研究“译林版”和“人教版”两套常用的高中英语教材对近10年高考英语全国I卷词汇的覆盖率和高考词汇在两套教材中的篇际词汇重复率。高考卷中个别生词是为了考察学生的“猜词能力”,不应被教材覆盖,该类词在本研究中排除。一、研究设计(一一)语料库建设语料库建设收集译林版和人教版高中英语教材必修15册(因选修部分在高中课堂一般不能全部涉及)。然后收集20102020年10年间的高考英语全国I卷,因为该套试卷在全国使用最广泛。之所以选用近10年的试卷,是考虑到最近10年的试卷能够基本代表高考卷
8、的词汇范围,少了会出现代表性问题,而往前20年的试卷又不是新课标教材对应的试卷。对教材和试卷进行扫描、文字识别与去燥,最终建成三个语料库:20102020高考英语全国I卷语料库、译林版高中英语教材语料库和人教版高中英语教材语料库。为了方便软件识别和行文指称,三个语料库分别命名为NCETP1(National Col-lege Entrance Test Paper One)、YLTB(Yi Lin PressText Book)和 PETB(People s Education Press TextBook)。经过人工校对后,三个语料库的基本数据如表1所示。表1三个语料库的基本数据语料库项目形
9、符数类符数平均词长NCETP137 9124 8164PETB52 7734 6734YLTB85 9965 5384表 1所示,高考英语全国 I卷语料库、人教版高中英语教材语料库和译林版高中英语教材语料库的形符(token即语料库中总单词数)分别是37 912、52 773和85 996;类符(type即语料库中不重复的单词数)分别是 4 816、4 673 和 5 538。平均词长均为4个字母。(二二)数据提取数据提取两套教材和高考卷的词表:利用Wordsmith的WordList功能提取三个语料库的词表。本研究考虑到高考考纲对词汇的要求,包括曲折变化的要求,比如,forbid、forba
10、de、forbidden按三个词对待,所以本研究不考虑削尾(lemmatising)处理。两套教材词表与高考卷词表的比对:Word-smith的词表一致性功能可以提取两个语料库全部词汇的一致性词表,可以计算出同时出现在两个语料库中的类符数,即共享词汇。经比对,全国I卷与人教版教材的共享词汇2 566条,与译林版教材的共享词汇2 856条。高考卷词汇在两套教材中的篇际词汇重复率:本研究根据 Nation(1990)的研究,以重复 5次赵秀莲:江苏新高考背景下英语教材对全国卷的词汇覆盖率研究第1期73为门槛值。利用Wordsmith词表功能中的DetailedConsistency选项,把高考卷词
11、表分别与两版教材词表进行比对,可以统计出高考卷词表出现至少1次的类符在两版教材中出现5次以上的类符数量,用该数据除以高考卷类符数,就可以得出高考词汇在两版教材中重复5次及以上的篇际词汇重复率。二、结果与讨论(一一)两套教材对高考词汇的覆盖率两套教材对高考词汇的覆盖率经过检索、比对、计算与统计分析,高考卷词表在两套教材中的词汇覆盖率见表2。根据表2,近10年高考卷与人教版教材和译林版教材比对,共享类符数分别是2 566和2 856,即有2 566个类符同时出现在近10年高考卷和人教版教材语料库中,有2 856个类符同时出现在近10年高考卷和译林版必修教材语料库中;因人教版教材的总类符是4 673
12、,可计算出有54.91%的类符出现在近10年的高考卷中,译林版教材总类符5 538,可得出51.57%的类符出现在近10年高考卷中;两套教材与高考卷的共享类符对高考卷的词汇覆盖率分别是53.28%和59.30%,即近10年高考卷中有53.28%的类符被人教版教材所覆盖,有59.30%的类符被译林版教材所覆盖,两套教材对近10年高考卷的词汇覆盖率都偏低。使用SPSS16.0对两版教材进行独立样本T检验,经差异显著性分析,P值为0.002小于0.05,95%置信区间不含零,译林版教材对高考卷的词汇覆盖率显著高于人教版。表2高考卷词表在两套教材中的词汇覆盖率语料库共享类符数对教材的共享类符比/%高考
13、卷专有类符数对高考卷类符的覆盖率/%NCETP1 VS PETB2 56654.912 29553.28NCETP1 VS YLTB2 85651.571 96059.30差异显著性(P值)0.002值得注意的是,近 10 年高考卷也有 2 295 和1 960个类符并没有被人教版教材和译林版教材覆盖,比率分别达47.65%和40.69%,即近10年高考卷有超过 40%的类符并没有出现在两版教材的必修5册中。可能的原因在于:第一,本研究只考察了必修5册教材,两版教材还有选修5册未纳入考察范围;第二,高考考核的不仅是高中词汇,还有初中的词汇,后者并没有纳入本研究范围;第三,有一小部分词汇标注有汉
14、语意思,不影响理解,此外,10年高考卷累积的专有名词较多,而专有名词也不影响学生理解;第四,教材编制的依据是高考考纲,但在编制过程中无法保证完全没有一点偏离,高考卷编制的依据也是高考考纲,可能也存在一定的偏离,从而导致考卷与教材的偏离较大,该现象或许还有其他因素有待考察。Laufer、Nation的研究成果将95%视为词汇覆盖率的阈值,抛开诸多因素,单就本研究范围的数据而言,两版教材对高考词汇的覆盖率均低于60%,离 95%的阈值相差甚远,至少说明,即便学生习得了其中一版教材必修五册的全部词汇,也无法完全理解近10年的高考卷。但这并不说明学会了教材词汇,读不懂高考卷,因为每一年的高考词汇远远少
15、于近10年考卷总词汇,而是说明,仅习得必修教材词汇是远远不够的。(二二)高考词汇在两套教材中的篇际词高考词汇在两套教材中的篇际词汇重复率汇重复率本研究将重复 5次视为词汇重复率的阈值,利用 Wordsmith 词表功能中的 detailed consistency选项做出高考卷分别与两版教材的比对词表,筛选出高考卷词表中的类符在教材词表中出现5 次以上的数量,除以高考卷总类符,就可以得出高考卷类符在教材中的篇际重复率。这是在教材中得到充分呈现的高考词汇数量,即教材中呈现次数能保证学生有效习得的高考卷词汇江 苏 理 工 学 院 学 报74第29卷数量,该数量越大,教材的词汇编排与考卷的吻合度越高
16、。经数据提取与统计,近10年高考卷词汇在两版教材中的篇际词汇重复率见表3。比对语料库类符数教材中重复5次以上的高考卷类符NCETP1 VS PETB类符数1 138百分比23.62NCETP1 VS YLTB类符数1 611百分比24.10由表3可知,在4 816条高考词汇中,有1 138个在人教版必修教材中呈现5次以上,有1 611个在译林版必修教材中重复呈现5次以上,相关比率分别为23.62%和24.10%。也就是说,人教版必修5册教材只能保证近10年高考卷中23.62%的词汇充分呈现给学习者;译林版必修5册教材只能保证24.10%的近 10年高考卷词汇的充分呈现。两套教材之间没有显著差异
17、,对高考卷的词汇均没有充分重复呈现。基于此,给师生的建议是,教材没有充分重复呈现的高考词汇应保证充分的练习,确保练习题或者其他学习材料中充分接触高考词汇。给教材编著者的建议是,关注高考词汇,扩充教材词汇,对高考词汇给予充分的重复呈现,确保学习者有效习得重点词汇。三、结语本研究发现,译林版和人教版高中英语必修教材对 20102020年 10年高考英语全国卷的词汇覆盖率分别是53.28%和59.30%,译林版显著优于人教版,但两版教材离95%的阈值较远。在篇际重复率方面,译林版教材有23.62%、人教版有24.10%的高考词汇达到 5次重复的阈值,两者无显著差异,但对高考词汇的篇际重复率均较低。基
18、于上述研究发现,笔者建议高中师生除学习必修教材外,还应补充其他学习材料,包括选修教材等,或者考虑同时学习多套教材,确保积累足够的词汇量以覆盖高考卷词汇;对于教材没有充分重复呈现的高考词汇,应保证充分的练习,确保在练习题或者其他学习材料中重复接触高考词汇,确保高考词汇的有效习得。对教材编撰者来说,需重视对高考试卷词汇的调研,及时更新教材内容,扩充教材词汇量,并对高考词汇给予充分的重复呈现,确保学习者有效习得重点词汇。总之,应尽力避免让学生所学非所考,所考未有效习得的局面,缓解学生的高考压力。本研究探索现行译林版和人教版高中英语教材在词汇层面对全国卷的适用性,为修订与新编新版教材提供了实证依据,在
19、学校对教材进行筛选时给予数据参考,同时也为高中英语扩充性词汇教学提供了指南。未来研究可探究教材词汇对大纲词汇的覆盖率,大纲词汇对试卷词汇的覆盖率,完成三角互证,形成三方材料的一致性评价,为高中英语学习材料的严谨性探索一套闭环评价机制。参考文献:1 SCHMIDT W H,MCKNIGHT C C,RAIZEN S A.A splin-tered vision:an investigation of U.S.science and mathemat-ics education M.New York/Boston/Dordrecht/London:Kluwer Academic Press,199
20、7:53.2 LAUFER B.What percentage of text lexis is essential forcomprehension?C/LAUREN C,NORDMAN M.Speciallanguage:from humans thinking to thinking machines.Clev-edon:Multilingual Matters,1989:316-323.3 HU M,NATION I S P.Unknown vocabulary density andreading comprehension J.Reading in a Foreign Langua
21、ge,2000(13):403-430.4 NATION I S P.Learning Vocabulary in Another LanguageM.Cambridge:Cambridge University Press,2001:147.5 NATION I S P.Teaching and learning vocabulary M.NewYork:Newbury House Publishers,1990.6 郑志恒.基于语料库的英语阅读教材词汇评估J.外语研究,2012(5):56-63.7 王同顺,许莹莹.大学英语教材中的词族分布研究J.外语电化教学,2013(9):10-15.
22、表3近10年高考卷词汇在两套教材中的篇际重复率赵秀莲:江苏新高考背景下英语教材对全国卷的词汇覆盖率研究第1期758 王雨露.基于语料库的 新高中英语 词汇覆盖率和梯度研究D.呼和浩特:内蒙古师范大学,2017.9 曾铄然.大学英语词汇对普通英语的词汇覆盖率D.青岛:大连海事大学,2008.10 王芳,王岩.大学英语词汇在商务英语中的覆盖率研究J.沈阳师范大学学报(社会科学版),2014,38(2):110-112.11 李华东,吴楠,杜驭炎.大学英语教材学术词汇覆盖率研究:以 新编大学英语综合教程 为例J.杭州电子科技大学学报(社会科学版),2019,15(5):69-73,78.12 吴楠.
23、基于语料库的大学通用英语教材学术词汇覆盖率研究D.杭州:杭州电子科技大学,2020.13 赵振国.基于词汇覆盖率的可读性研究及RALCS系统开发D.徐州:江苏师范大学,2013.14 罗卫华,赵小东.英语篇际词汇覆盖率研究J.中国外语,2014(6):53-61.15 刘慧云.走遍美国 词汇要求调查J.广东外语外贸大学学报,2013(3):84-87.16 梅婕.词汇覆盖率、问题预览方式和听力速度对英语学习者听力理解的影响D.南京:南京工业大学,2016.17 宋贝贝,周小兵.高频超纲词的覆盖率及语义透明度J.汉语学习,2017(3):95-104.18 孙凤兰.国外学术英语口语词汇覆盖率最新
24、研究述评J.外语研究,2017(5):61-65.19 TEGGE F.The lexical coverage of popular songs in Eng-lish language teaching J.System,2017(4):87-98.20 ULUGBEK N.Lexical coverage of TED talks:implicationsfor vocabulary instructionJ.TESOL Journal,2017,8(4):768-790.21 JIA BI.How large a vocabulary do Chinese computer sci-e
25、nce undergraduates need to read English-medium spe-cialist textbooks?J.English for Specific Purposes,2020(58):77-89.责任编辑徐晶A study of lexical coverage rate of high school textbooks over nationalcollege entrance examination papers in the context of theNew Scheme of College EntranceExamination in Jiang
26、suZHAO Xiulian(School of Foreign Languages,Jiangsu University of Technology,Changzhou 213100,China)Abstract:By taking a corpus-based methodology,this research has studied the vocabulary coverage rate ofhigh-school compulsory textbooks by Yinlin Press and People s Education Press over NCEE Paper One
27、and theinter-textual lexical repetition rate of NCEE vocabulary in the two sets of textbooks in the last 10 years.Theresults show that the vocabulary coverage rate is 59.30%and 53.28%respectively with Yinlin version signifi-cantly higher than the People s Education version.But there is no significan
28、t difference in the inter-textuallexical repetition rate with 24.10%and 23.62%respectively,both showing a low level of repetition rate ofNCEE vocabulary.The research findings indicate that in terms of vocabulary the current high-school Englishtextbooks by Yinlin Press in Jiangsu matches the NCEE Pap
29、er One better than those by People s EducationPress but needs improvement compared with the comprehension threshold value.Therefore,suggestions arethat supplementary vocabulary should be taught to make up for the NCEE vocabulary not covered by the text-books and exercises be given to supplement what is not repeated as much as 5 times.Meanwhile,textbooksrevision should see to a rise in NCEE vocabulary coverage and inter-textual lexical repetition rate.Key words:lexical coverage rate;high school English textbooks;NCEE English test paper;corpus江 苏 理 工 学 院 学 报76第29卷