1、收稿日期:作者简介:2023-10-14邵川华,男,华东师范大学课程与教学研究所博士研究生;迟少辉,女,华东师范大学教师教育学院教授;王祖浩,男,华东师范大学课程与教学研究所研究员。邵川华迟少辉王祖浩(华东师范大学,上海 200062)学习进阶视域下初中生科学能力测评工具的开发与检验摘要:学习进阶不仅能反映学生能力发展的轨迹,还可以细致地揭示学习进程与认知路径,其测评工具的开发备受关注。立足学习进阶理论开发初中生科学能力测评工具,探索其科学能力发展路径,包括建构初中生科学能力进阶的理论框架、基于IRT理论组建测试题目、采用Rasch模型检验测评工具信效度、验证科学能力进阶预设四个步骤。结果表明
2、,初中生科学能力的学习进阶理论假设与初中生能力发展水平基本相符,基于学习进阶理论开发的测评工具能够为了解学生能力发展和改进教学提供更多参考信息。关键词:学习进阶;科学能力;测评工具;Rasch模型;锚题【中图分类号】G405【文献标识码】A【文章编号】1005-8427(2024)04-0047-11DOI:10.19360/ki.11-3303/g4.2024.04.006一、问题提出2014年出台的 关于全面深化课程改革落实立德树人根本任务的意见 中明确指出,教育部将组织研究并提出学生发展核心素养体系,明确学生应具备的必备品格和关键能力,根据核心素养体系,明确学生完成不同学段、不同年级、不
3、同学科学习内容后应该达到的程度要求1。使核心素养发展要求和儿童年龄心理阶段特征紧密契合,基于不同年级、学段学生的认知与行为特征将各个学科的能力发展目标切面化、具体化,是有效深化基础教育课程改革、促进学生核心素养螺旋式稳步发展必须思考和面对的问题,这与国际上学习进阶的理念不谋而合。学习进阶(learning progressions)由美国国家研究理事会(National Research Council,NRC)于2005年在K-12(基础教育阶段)国家科学课程评价体系报告中正式提出,报告将学习进阶定义为“在一定的时间跨度内,学生对某一主题的理解与思考不断丰富、深入的过程”,并强调其在促进课程
4、、教学、评价三者连贯性与一致性方面的重要作用2。目前,学习进阶作为一定时期内学生发展历程的具体表现,已基本成为学界的共识3-4。随着研究的不断深入,学习进阶作为一种优化测评方案、指导教学实施的理论,受到了越来越多学者的关注5。建构学习进阶不仅可以将学生掌握某一领域或学科复杂水平的学习过程模型化,还可以体现学生对某学科知识概念与关Journal of China Examinations2024年第4期No.4,20242024年第4期键能力逐步掌握的过程6。据此,学习进阶的理论研究与实践探索在核心概念进阶设计、课程标准研制与修订、教育测量与评价、学校教学实践等方面均得到初步应用。在科教兴国的战
5、略背景下,科学教育的重要性日益凸显。2023年5月,教育部等十八部门联合印发的 关于加强新时代中小学科学教育工作的意见 明确提出,要着力在教育“双减”中做好科学教育加法,一体化推进教育、科技、人才高质量发展7。科学教育的本质是提高学生的科学素养,而科学能力作为科学素养的内核,其重要性不言而喻。研究表明,中小学阶段学生的科学能力水平对其一生的科学素养发展具有重要的决定性作用8,了解初中生科学能力水平进而帮助教师及时干预调控和优化教学,对全面提升科学教育质量具有一定的促进作用。基于此,本研究旨在依托学习进阶理论,开发适合义务教育阶段初中生的科学能力测评工具,并对初中生科学能力特征与发展情况进行实证
6、研究。二、学习进阶研究综述(一)学习进阶的概念内涵不同学者对学习进阶的概念探讨略有不同,主要经历了方法论、序列论、过程论、假设论四个阶段975-11710。方法论主要关注学生对某一主题学习方法的演变。例如,Smith等将学习进阶定义为对特定内容领域认知方式不断完善的描述11。序列论主要关注学生对某一问题的认知序列。例如,Duschl等指出学习进阶是对同一个主题不断思考的描述,并随着学生在较长一段时间内的研究和学习而逐步成熟12。过程论主要关注学生对某一主题的认知全过程。例如,Merrit等认为学习进阶是学生对某一主题下复杂内容由表及里、深入认识过程13。假设论则重点强调学习进阶理论本身的功效。
7、例如,Salinas对前人的观点进行了综合,将学习进阶总结为一种事实证据、可被重复验证的假说,能够解释在较长一段时间内学生通过课程学习和教师指导,对某一学科核心内容的认识、理解和应用一步步发展的过程14。虽然四种观点在学习进阶概念内涵的侧重点上有所不同,但无论采取何种观点,学习进阶均指向学生发展过程中螺旋式上升的特征与表现。(二)学习进阶的内容对象内容对象是指学生发展过程中所反映的具体特征与表现,是学习进阶研究探讨的内核。现阶段有关学习进阶的内容对象主要存在两种研究取向。其一,是以学科大概念为代表的知识取向,如NRC指出学习进阶应该围绕学科核心概念和原则来组织建构,而这些通称为学科大概念,代表
8、着学科领域中关于某些现象的概念、原理、原则和解释性主题,它契合学科本质,具有较高的概括性且方便学生进行迁移运用,对学生的终身发展具有持久的促进作用15。其二,是以关键能力为代表的能力取向,如Songer等认为NRC对学习进阶的定义限于知识主题维度过于简单化,提出学生对主题的思考过程是和探究推理共存并具有内在联系的,在关注知识性内容的同时必须考虑探究推理16,此类取向的学习进阶多关注关键能力或特定的认知过程。学习进阶内容对象的不同取向对应着教育学知识与能力的争论,虽然很难达成共识,但都以学生的发展过程为核心。(三)学习进阶的构成要素一个完整的学习进阶模型应包含五个组成部分17-18。一是学习目标
9、(learning goals),即学生通过一阶段学习后应当达到的期望表现与预设要求。二是进阶变量(progress variable),代表学习进阶关注的内容对象,如前所述,可以是学生对核心知识的掌握或是学生能力的发展。三是成就水平(levels of achievements),指学习进阶过程中学生发展所处于的不同层级,不同的层级体48现学生不同阶段的发展情况,直至最终达成学习目标。四是学习表现(learning performance),由于进阶变量通常具备内隐的特性,为方便观察,研究需将其外显化,即通过不同层级学生在完成任务过程中行为表现的差异区分不同的成就水平。五是测量工具(asse
10、ssment),指基于学习进阶模型开发出的用于了解、评估学生发展的工具。(四)学习进阶测评的研究范式学习进阶视角下的测评研究一般分为三个阶段9265-32519。阶段一是预设学习进阶的理论框架,框架的开发通常有两种方法自上而下法和自下而上法20。自上而下法是一种验证式制定进阶的方法,从课程标准或考试标准出发,由学科领域专家预估学生发展的应然情况并推演出学生各阶段可能会出现的具体表现,进而制定学习进阶的具体内容;自下而上法则与之相反,将不同阶段学生的行为表现归纳形成该阶段的行为特征,由实然情况制定学习进阶的具体内容。阶段二是根据预设的学习进阶框架命制评价试题,学习进阶框架承担规划命题、双向细目表
11、的作用,命制的试题必须是信效度良好的测评工具。阶段三是基于开发的测评工具进行实测并分析测试结果。如此,一方面可以对学生发展情况进行深入诊断,另一方面能够对预设的学习进阶框架进行验证21。综合上述文献,本研究将科学能力作为学习进阶的内容对象,聚焦学生关键能力的发展,以科学学科的核心概念与知识内容为载体,细致刻画义务教育阶段初中生科学能力的具体表现;并将学习进阶作为理论支撑,评估义务教育阶段初中生科学能力的发展情况。三、测评工具开发本研究采用自上而下的研究范式,设计学习进阶框架,开发初中生科学能力测评工具,具体流程如图1所示。首先,建立初中生科学能力的学习进阶理论假设,结合国内外初中科学课程标准和
12、国际大规模科学素养测试,梳理并提炼出科学能力四个进阶变量,然后,结合进阶变量的发展特征建构出43科学能力进阶矩阵并归纳各水平的表现情况,其次,参照进阶框架编制不同水平的测试题,初构测评工具并确保各试题与框架一一对应。再次,实施预测试,应用Rasch模型检验测试工具质量并依据各项参数修订试题和评分标准。最后,正式施测,考察优化后的测评工具质量水平并分析被试作答情况,依据测试情况修正学习进阶理论假设,准确描绘科学能力的层级结构。(一)科学能力学习进阶的理论假设初中生科学能力学习进阶的理论假设参考了我国义务教育科学课程标准(2022版)22和国际大规模科学能力测评项目,包括 PISA2006、PIS
13、A2015、TIMSS2015、NAEP2015 等23。分析上述材料可以发现,国家课标和国际测评对科学素养、科学能力的核心要素关注焦点趋于相同,对“识别科学信息”“提出科学问题”“解释科学现象”“寻找科学证据”“运用证据进行推理”“评价、设计实验探究”“得出结论、制定决策”这七个核心能力均给予了充分关注和重视。图1 初中生科学能力测评工具开发流程邵川华 等:学习进阶视域下初中生科学能力测评工具的开发与检验492024年第4期对上述七个核心能力进行合并、归类,最终将初中生科学能力划分为准确提取信息、科学解释问题、基于证据进行推理和综合多因素制定决策四个进阶变量,各个进阶变量的水平划分参考已有研
14、究成果加以确立。具体而言,依据SOLO分类的五级结构体系24和各子能力的影响因素25-26,并参照初中生心智特征,将每个进阶变量划分为三个水平,水平越高意味着表现越优,各水平能力表现如表1所示。(二)科学能力测评工具试题设计分析国际大规模科学素养测评项目和国内外科学能力测评研究可以发现,科学能力测评过程中需要将能力构念外显化,根据学生特定的行为表现与作答情况进行评价27。借鉴PISA2015科学素养测试的组织经验,从情境、知识、能力、行为表现四个角度建构本研究科学能力测评机制,拟通过学生解答不同难度试题过程中的行为表现来反映学生的科学能力水平。学生完成试题的过程中,首先要阅读试题情境,明确试题
15、所需要解决的问题,然后结合自己已有的科学知识,调用相应的科学能力进行一系列认知过程,最终完成作答,其具体机制如图2所示。设计测试题的过程中需要对知识、情境、能力、行为表现四个维度分别进行探讨,具体研发过程主要包括以下步骤:整合核心知识、科学能力框架规划命题多维细目表;基于多维细目表选择情境素材命制试题;参照能力水平和预设行为表现制订评分标准;从试题描述、核心知识、科学能力要素、认知加工方式、评分标准五个角度编码试题;依据小范围学生试测口头报告评估修订测评工具;报送专家团队逐题匿名审议,根据反馈意见进一步修订测评工具。维度准确提取信息科学解释问题基于证据进行推理综合多因素制定决策行为表现Leve
16、l1:能基于生活经验或表层信息识别具体的科学现象,并加以描述Level2:能从单一的视角(宏观、局部、定量或定性)识别科学现象中的某一些特征,并且可以初步采用定量的方法进行表述Level3:能从多层次多角度(宏微结合、定性定量结合、整体)识别并简明准确地表述科学现象Level1:能基于生活经验或表层信息对科学问题做出初步的解释Level2:能从单一的视角(宏观、局部、定量或定性)并结合一定的数据计算较为系统地解释科学问题Level3:能从多层次多角度(宏微结合、定性定量结合、整体与局部)出发或结合科学的模型,较为全面地解释科学问题Level1:能从表层信息、所学知识点或个人经验中寻取证据,对科
17、学问题进行推理论证,并能得出一定的结论Level2:能从某些视角(宏观或微观、定性或定量、整体或局部)中寻找证据,通过推理得出较为合理的结论Level3:能从多层次多角度(宏微结合、定性定量结合、整体与局部)出发寻找证据,并能评估证据的质量,在此基础上进行推理论证得出准确的结论Level1:学生仅能够从单一的视角、运用某一学科知识形成问题解决方案或进行相关决策Level2:学生能综合考虑多因素,运用多学科知识制定问题解决方案或进行相关决策,但所得出的方案决策未必严谨周到Level3:学生能综合考虑多因素,运用多学科知识进行统筹分析,制定问题解决方案或进行相关决策,所制定的方案决策严谨科学表1
18、初中生科学能力的学习进阶理论假设图2 初中生科学能力测评机制50本研究选取情景素材包含个人情境(personal contexts)、社会情境(social contexts)、全球情境(global contexts)三个类型,所涉及的知识覆盖义务教育初中阶段科学课程的五大内容主题,其具体分布如表2所示,表中,P、S、G分别代表个人情境、社会情境和全球情境。其中部分试题来自PISA、TIMSS等国际大规模科学素养测试和教科书课后习题,并经过筛选改编与多次论证,以确保试题符合中国初中生阅读理解习惯。如表2所示,本研究设计了17个不同情境下的题组,其中包含8个个人情境、6个社会情境和3个全球情境
19、。学生在解决这些真实情境的问题过程中,需要调用的科学知识各不相同。由于我国科学课程的实施分为七至九年级三个学年,不同年级的所学内容与知识储备存在差异,所以在命制三个年级科学能力测试题过程中,需要针对不同年级学生的学习进度与已有经验进行试题分配。为此,本研究根据初中各年级教学内容与进度对17个题组进行了如下分配,具体如表3所示。其中七年级涉及 7 个题组,共计 24 道测试题;八、九年级均涉及 6 个题组,分别共计 20、22道测试题。由于七至九年级学生测试题组并不相同,无法直接讨论各年级成绩情况,为方便后期对不同年级学生的能力水平情况和试题难度进行分析比较,需要将不同年级学生的测试成绩统一在同
20、一标尺中,即学生测试成绩的等值处理。为了实现等值处理,在编制测试工具的过程中须提前设计 链 接 不 同 年 级 测 试 工 具 的 锚 题(linkingitems)28。本研究依据锚题设置的基本要求29,设计了两套锚题组作为七至九年级试卷的链结,分别为L78I4与L89I5,以便后续的等值化讨论,锚题设置见表3。使用学习进阶开发测评工具时,学生的每一种作答反应模式都可以追溯至题目对应的进阶水平,每一种作答反应均有测评意义。因此,本研究将七至九年级编制的试题与科学能力进阶框架一一配对,以确保框架的每个水平都存在一道以上的试题与之对应。此外,在配对过程中还需要尽可能地保证试题的预估难度随着维度、
21、水平的上升逐级提高,以保证测试工具满足IRT理论的基本原则。为探查初中生科学能力试题与内容主题科学探究生命科学物质科学地球和宇宙科学、技术、社会与环境(STSE)试题选取保温性能(P)、杀虫剂药效(S)、刹车距离(P)克隆技术(S)、狐狸特征(S)、种子发芽(P)、营养物质(P)压强差异(P)、风力发电(G)、力与运动(P)、唇膏成分(P)、分子运动(P)地形变化(G)、建厂选址(S)人工湿地(S)、温室效应(G)、污水净化(S)表2 科学能力试题涉及的知识内容与情境素材邵川华 等:学习进阶视域下初中生科学能力测评工具的开发与检验七年级测试卷保温性能G7I2-1、G7I2-2G7I2-3克隆技
22、术G7I3-1、G7I3-2G7I3-3杀虫剂药效L78I4-1、L78I4-2L78I4-3、L78I4-4温室效应G7I5-1、G7I5-2G7I5-3、G7I5-4狐狸特征G7I6-1、G7I6-2G7I6-3污水净化G7I7-1、G7I7-2G7I7-3种子发芽G7I8-1、G7I8-2G7I8-3合计24道八年级测试卷营养物质G8I2-1G8I2-2地形变化G8I3-1、G8I3-2G8I3-3、G8I3-4人工湿地L89I5-1、L89I5-2L89I5-3、L89I5-4压强差异G8I6-1、G8I6-2G8I6-3建厂选址G8I7-1、G8I7-2G8I7-3合计20道九年级测
23、试卷唇膏成分G9I2-1、G9I2-2G9I2-3力与运动G9I3-1、G9I3-2G9I3-3、G9I3-4分子运动G9I4-1、G9I4-2G9I4-3、G9I4-4风力发电G9I6-1、G9I6-2G9I6-3刹车距离G9I7-1、G9I7-2G9I7-3、G9I7-4合计22道注:G7I2-1是指7年级第二题的第一小题;L78I4与L89I5为两套锚题组。表3 七至九年级初中生科学能力测试题分布情况512024年第4期所测查的进阶水平是否匹配,邀请一线初中科学教师、教育学博士生、科学教育领域专家共五人组成试题水平审查小组,根据水平描述的内容标定题目的测量水平。对标定不一致的题目开展讨论
24、,三人及以上意见统一则标定水平,保证测试工具内容效度良好后可结束该题目的讨论。表4呈现初中生科学能力进阶测评工具试题分布情况。四、测评工具的质量检验与优化(一)测评工具的预测试与优化本研究测评工具的检验与普通的测验工具检验流程基本类似,共开展两轮测试。第一轮测试重点在于修订测试题目;第二轮测试一方面是为了解试题情况以便进一步优化,另一方面是为收集实际数据,探讨学习进阶的预设框架与初中生实际发展状况的一致性程度。第一轮测试选择浙江省X市A初中的296名学生,其中七年级101人,八年级106人,九年级89人,均通过分层抽样的方法随机取得。在学生们完成试题后,课题组根据评分标准进行阅卷,并将原始数据
25、录入电脑。使用Winsteps 3.72.0软件进行Rasch模型分析,对题目难度进行估计并对拟合指标进行检验,依据常用的怀特图、单维性检验图、MNSQ、ZSTD等数据分析结果对试题进行删减与修改30。分析发现,部分题目分步计分的难度阈值并未呈现出增高趋势,需要完善评分标准。例如,试题G7I6-1要求学生从多角度比较两幅图片差异,但由于不同学生在作答过程中的关注点存在差异,作答中未必能够刚好提及两个得分点,为此对该试题的评分标准做出修正:但凡能从皮毛颜色、耳朵大小、皮毛长度三项中答到两项即获满分2分;若只答出其中之一得1分;若为无关答案则得0分。此外,部分题目单维性不佳或题目过难致使无学生与之
26、匹配的,在试题优化过程中对其进行了删减或修改设问表述。(二)基于正式测试的初中生科学能力测评工具的质量分析在编制初中生科学能力测评工具的基础上,还需要进一步验证测评工具的信效度与稳定性情况31。论证科学能力测评的维度和指标、组卷前测试题目与能力水平的一致性,能够在一定程度上保证测评工具的内容效度。此外,在正式测试过程中,围绕试题内容、考查知识点、试题解题过程等内容与四位一线科学教师展开深入访谈,进一步验证测试工具的内容效度。在结构效度方面,需利用 IRT 理论基于Rasch模型分析正式测试数据加以验证。正式测准确提取信息科学解释问题基于证据进行推理综合多因素制定决策Level1Level2Le
27、vel3Level1Level2Level3Level1Level2Level3Level1Level2Level3七年级G7I7-3、G7I8-3G7I8-2、G7I6-1G7I7-1、G7I6-2G7I7-2、G7I6-3G7I5-2、L78I4-1L78I4-2、G7I2-3G7I5-3、G7I8-1G7I2-2、L78I4-4L78I4-3、G7I3-3G7I2-1、G7I8-4G7I3-1、G7I5-1G7I3-2、G7I5-4八年级G8I2-1G8I6-1、G8I6-3G8I6-2、G8I2-2G8I3-2G8I7-2、L78I4-1L89I5-2、L78I4-2G8I3-3、L8
28、9I5-1L78I4-4、G8I7-3L89I5-3、L78I4-3L89I5-4、G8I7-1G8I3-1G8I3-4九年级G9I7-3G9I7-2、G9I6-3G9I3-2、G9I4-1G9I3-3、G9I2-1G9I4-2L89I5-2、G9I6-1G9I7-4、L89I5-1G9I4-4、G9I4-3G9I3-1、L89I5-3L89I5-4、G9I2-2G9I3-4、G9I7-1G9I2-3、G9I6-2表4 初中生科学能力进阶测评工具试题分布情况52试仍在A初中进行,总样本容量为643人,其中七年级267人,八年级198人,九年级178人,主要目的一方面在于验证前期测评工具试题优化
29、是否有效;另一方面检验随着样本量的扩大,测评工具是否仍具备较好的稳定性。数据处理方法与第一轮预试后相同,题目的难度、估计误差,加权、未加权的拟合指标,分离度以及信度如表5所示。分析数据可以发现,七至九年级测试工具的Infit与Outfit各拟合参数均与理想值接近;试题的分离度均大于2,信度接近于理想值1.00;被试的分离度均大于2,信度高于0.8,均处于可接受范围。由此可见,初中生科学能力测评工具整体质量良好。此外,三套测试工具区分度情况良好,测试题目的难度与学生的能力分布基本呈现正态分布。图3为七至九年级三套测试工具的怀特图,从中可以看出,调整后正式测评试卷的试题难度分布较为合理,对初中生科
30、学能力具有一定的测评广度,被试能力和题目难度均分布良好,绝大多数不同能力水平的被试都有试题群与之对应。邵川华 等:学习进阶视域下初中生科学能力测评工具的开发与检验年级七年级八年级九年级研究对象被试试题被试试题被试试题平均估计值-1.530.00-0.510.00-1.020.00模型误差0.390.190.350.200.330.21InfitMNSQ1.001.000.991.001.000.99ZSTD0.00-0.400.00-0.50-0.10-0.50OutfitMNSQ1.001.011.001.001.001.00ZSTD0.00-0.300.00-0.50-0.10-0.40分
31、离度2.376.372.394.742.295.77信度0.850.980.850.960.840.97表5 七至九年级初中生科学能力测评工具整体质量情况图3 七至九年级三套科学能力测评工具的怀特图532024年第4期综合上述分析可以发现,经过修正与优化后的初中生科学能力学习进阶的测评工具具备较好的信效度与稳定性,能够准确评价初中生科学能力水平情况。五、启示及讨论本研究基于学习进阶理论构建了初中生科学能力的理论框架,梳理了应用学习进阶理论开发初中生科学能力测评工具的一般流程,并得到具有较好信效度的初中生科学能力测评工具。总结研究过程,可以得出如下三个方面的启示。(一)初中生科学能力进阶理论与学
32、生发展实际基本一致通过对试题的分析,可以发现初中生科学能力的学习进阶理论与学生的实际发展状况基本相符。学生科学能力的发展规律从自身的个性化特征向生活经验,再到接受化、分析化水平发展。针对一道未解决的科学问题,初中生首先从表层的提取信息,再到逐步分析解释现象,进而能够寻找证据加以推论,并最终制定出相应的决策。在此过程中,学生关注的要素从单线索到多线索、多结构发展,其能力水平也逐渐提高。这种发展规律与科学课程标准、国际大规模科学素养测试、SOLO分类体系研究得出的初中生科学能力的发展规律基本一致32。在提取科学信息维度,随着学龄的增加与科学课程的深入,初中生提取信息的视角与方法更加多元,在原有生活
33、经验的基础上已经逐步能够借鉴所学的方法论进行多角度提炼与概括。例如,“与牛肉等动物蛋白相比,真菌蛋白在产率、原料利用率、生产速度这些方面均具备优势”,这一类作答需要学生从试题情境中自行筛选、归纳。在分析解释问题维度,年级越高的学生越能够熟练从多层次多视角(宏观与微观、定量与定性、整体与局部)进行推理与演绎,但这一阶段的学生仅能够根据已有信息进行分析解释,并且停留在单一链式线索上,不具备寻证与批判意识。例如,“如图中所示,随着全球二氧化碳浓度的增加,全球温度基本保持上升趋势”,这一类答案更多停留于对已知信息的阐释与说明,并未关注其中存在的异常情况。在寻找证据加以推论维度,学生已经初步具备批判意识
34、与寻证能力,能够发现异常现象并清晰地认识到得出结论需要何种证据,但处于这一维度的学生缺乏决策能力,存在决策不准确、考虑不周密等问题。在综合多因素制定决策这一维度,学生能够利用所学知识与自己的判断进行决策;并且随着学龄的增加和知识储备的丰富,他们在进行决策过程中所考虑的因素更为全面,能够熟练运用多学科的知识解决跨学科的问题。(二)学习进阶测试题能够准确反映学生的科学能力水平学习进阶试题可以组合选择多种题型,如选择题、填空题、主观题等,由于每道试题均存在与之匹配的能力水平,学生答对与否可以帮助教师及时诊断学生的能力发展情况。此外,学生的作答痕迹也可揭示学生思维过程,进而帮助教师了解学生科学能力发展
35、特征,判断其是否存在知识欠缺或认知障碍。例如,下述题目考查综合多因素制定决策:在城市规划选择厂址时,需要充分考虑生态效益和经济效益,请你思考一下想在该地区开设一家炼钢厂,你会选择A、B、C、D哪个区域?请说出你选择该区域的理由。54该题主要考查学生能否从劳动力、市场、能源、原材料、交通、环保等多方面影响因素出发进行选址决策。学生在作答前须首先了解炼钢厂的化学反应原理,进而推断出炼钢厂所需的原料以及潜在的环境污染;其次,学生还需要能够看懂地图并明确图中表征的信息;最后,学生还要结合自身生活经验,从社会发展、城市建设的视角进行整体布局。根据学生不同的作答,可以判断学生对具体哪一板块的知识内容掌握欠
36、缺。例如,选择D地建炼钢厂的学生,他们仅了解炼钢厂所需的原料,却不知道炼钢厂冶炼钢铁的原理以及其可能带来的污染,所以无法综合环境保护、绿色安全等因素进行最终决策,能力未达到“综合多因素制定决策”第二级水平。为此,教师可以在后续教学过程中着重讲解炼钢原理、环境保护等相关知识内容,促进学生科学能力的发展。又如,如下回答:“A 处开设炼钢厂是因为位于河流的下游,水源充足且不易污染河道;该位置还远离城区,地价便宜,且不会影响居民区;附近有煤矿与发电站,有充足的能源供给;此外该位置交通方便,有水路、公路通过,便于原料输入与产品输出。”则较好地体现了“综合多因素制定决策”维度的最高水平。(三)测评结果能为
37、优化教学方案、研究学习规律提供新视角利用学习进阶理论开发测评工具,除了能够了解学生发展状况及水平、提供诊断信息之外,还能为优化教学方案、研究学习规律提供新的视角。如前所述,学习进阶的理论框架通常采用自上而下或自下而上的方式预设,在一定程度上能够反映学生的发展轨迹。若测试结果与最初预设理论框架相同,可以证实学生发展的规律;反之则需要探讨是教学缺漏导致还是存在其他影响因素。在本研究中,初中生科学能力的进阶理论预设与学生实际能力发展情况基本一致,但也存在部分学生科学能力发展表现出差异化的特征,这与预设的螺旋式上升的科学能力框架存在一定的出入。例如,实测过程中发现,八年级学生虽基本呈现预设科学能力进阶
38、框架相同的发展特征,但出现了科学能力的分化现象,即低能力水平与高能力水平的学生占比增加,在“基于证据进行推理”第一级水平出现分布谷值。这一现象一方面提醒教师对八年级学生寻找证据、判断证据真实性、基于证据进行推理等能力水平的影响因素做出反思,优化教学方案并在教学中为学生提供更多的学习机会;另一方面也需要研究者加以关注,挖掘是否存在潜在因素致使八年级学生科学能力出现分化。参考文献1 教育部关于全面深化课程改革 落实立德树人根本任务的意见:教基二 2014 4 号A/OL.(2014-04-08)2023-10-25.http:/ OSBORNE J.Book reviews:taking scie
39、nce to school:learning and teaching science in grades K-8J.EurasiaJournal of Mathematics Science and Technology Education,2007,3(2):163-166.3 高一珠,陈孚,辛涛,等.心理测量学模型在学习进阶中的应用:理论、途径和突破J.心理科学进展,2017,25(9):1623-1630.4 HARRIS L R,ADIE L,WYATT-SMITH C.Learningprogression-based assessments:a systematic review
40、 ofstudent and teacher usesJ.Review of Educational Research,2022,92(6):996-1040.5 ALONZO A C,ELBY A.Beyond empirical adequacy:learning progressions as models and their value for teachersJ.Cognition and Instruction,2019,37(1):1-37.6 KANE M T,BEJAR I I.Cognitive frameworks for assessment,teaching,and
41、learning:a validity perspectiveJ.Psicologa Educativa,2014,20(2):117-123.邵川华 等:学习进阶视域下初中生科学能力测评工具的开发与检验552024年第4期7 教育部等十八部门关于加强新时代中小学科学教育工作的意见:教监管 2023 2号A/OL.(203-05-26)2023-10-25.https:/ LAUGKSCH R C.Scientific literacy:a conceptual overviewJ.Science Education,2000,84(1):71-94.9 ALONZO A C,GOTWALS
42、A W.Learning progressionsin science:current challenges and future directionsM.Rotterdam:Sense Publishers,2012.10 刘晟,刘恩山.学习进阶:关注学生认知发展和生活经验J.教育学报,2012,8(2):81-87.11 SMITH C,WISER M,ADERSON C W,et al.Implications of research on childrens learning for standardsand assessment:a proposed learning progres
43、sion formatter and the atomic-molecular theoryJ.Measurement:Interdisciplinary Research and Perspectives,2006,4(1-2):1-98.12 Committee on Science Learning,Kindergarten throughEighth Grade.Taking science to school:learning andteaching science in grades K-8M.Washington DC:The National Academies Press,2
44、007:213-214.13 MERRIT J D,KRAJCIK J,SHWARTZ Y.Development of a learning progression for the particle model ofmatterC/OL/Proceedings of the 8th International Conference for the Learning Sciences,Utrecht,Netherlands,June 23-28,20082023-10-25.https:/ SALINAS I.Learning progressions in science education
45、:twoapproachesfordevelopmentC/OL/TheLearning Progressions in Science Conference,IowaCity,IA,June,20092023-10-25.https:/ DUNCAN R G,HMELO-SILVER C E.Learning progressions:aligning curriculum,instruction,and assessmentJ.Journal of Research in Science Teaching,2009,46(6):606-609.16 SONGER N B,KELCEY B,
46、GOTWALS A W.How andwhen does complex reasoning occur:empirically drivendevelopment of a learning progression focused on complex reasoning about biodiversityJ.Journal of Research in Science Teaching,2009,46(6):610-631.17 JIN H,van RIJN P,MOORE J C,et al.A validationframework for science learning prog
47、ression researchJ.International Journal of Science Education,2019,41(10):1324-1346.18 姚建欣,郭玉英.为学生认知发展建模:学习进阶十年研究回顾及展望J.教育学报,2014,10(5):35-42.19 DUSCHL R,MAENG S,SEZEN-BARRIE A.Learningprogressions and teaching sequences:a review andanalysisJ.Studies in Science Education,2011,47(2):123-182.20 张云,何声清.
48、学科教育领域学习进阶的测评研究与应用研究进展J.中国考试,2023(3):68-76.21 WEI S,LIU X F,JIA Y.Using Rasch measurement tovalidate the instrument of students understanding ofmodels in science(SUMS)J.International Journal ofScience and Mathematics Education,2013,12(5):1067-1082.22 教育部.义务教育科学课程标准(2022年版)M.北京:北京师范大学出版社,2022:4-15.23
49、 潘士美,张裕灵,李玲.义务教育学生科学素养及其关键影响因素研究:来自PISA、TIMSS和NAEP的国际测评经验J.外国教育研究,2018,45(10):76-87.24 吴有昌,高凌飚.SOLO分类法在教学评价中的应用J.华南师范大学学报(社会科学版),2008(3):95-99.25 KAPON S,diSESSA A A.Reasoning through instructional analogiesJ.Cognition and Instruction,2012,30(3):261-310.26 LIU W D,LUO X F,SHU J,et al.Bridging infere
50、ncebased sentence linking model for semantic coherenceJ.International Journal of Cognitive Informatics andNatural Intelligence,2016,10(1):32-54.27 庄腾腾,谢晨.我国中小学生技术素养测评工具设计探析:基于国际科学与技术素养测评框架J.华东师范大学学报(教育科学版),2018,36(6):42-53.28 WINGERSKY M S,COOK L L,EIGNOR D R.Specifying the characteristics of linkin