收藏 分销(赏)

可信的端到端深度学生知识画像建模方法.pdf

上传人:自信****多点 文档编号:648511 上传时间:2024-01-23 格式:PDF 页数:12 大小:1.91MB
下载 相关 举报
可信的端到端深度学生知识画像建模方法.pdf_第1页
第1页 / 共12页
可信的端到端深度学生知识画像建模方法.pdf_第2页
第2页 / 共12页
可信的端到端深度学生知识画像建模方法.pdf_第3页
第3页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 可信的端到端深度学生知识画像建模方法王士进1,2吴金泽2张浩天3沙晶2黄振亚3刘淇31(认知智能全国重点实验室(科大讯飞股份有限公司)合肥230088)2(科大讯飞股份有限公司合肥230088)3(大数据分析与应用安徽省重点实验室(中国科学技术大学)合肥230027)()Trustworthy End-to-End Deep Student Knowledge Portrait Modelling MethodWang Shijin1,2,Wu Jinze2,Zhang Haotian3,Sha Jing2,Huang Zhenya3,and Liu Qi31 (State Key Labo

2、ratory of Cognitive Intelligence,iFLYTEK Co.,Ltd,Hefei 230088)2 (iFLYTEK Co.,Ltd,Hefei 230088)3 (Anhui Province Key Laboratory of Big Data Analysis and Application,University of Science and Technology of China.Hefei 230027)AbstractStudent knowledge portrait means a comprehensive and accurate represe

3、ntation of students mastery forknowledge concepts.Generally,knowledge tracing methods are used in intelligent education to summarize and predictpotential students mastery of knowledge concepts based on students learning data.However,the prediction of theknowledge tracing method is inconsistent with

4、the student knowledge portrait,leading to not credible portrait.In thispaper,we first define the student knowledge portrait task based on the end-to-end object of students knowledgemastery,and then propose a novel deep knowledge portrait(DKP)model.Specifically,we first represent the learninginteract

5、ion with difficulty and knowledge concepts to distinguish learning interactions on the knowledge level.Besides,we adopt the bidirectional long and short time memory network(Bi-LSTM)to trace the students knowledgestates based on the learning record.Finally,we predicted the student knowledge portrait

6、using a multi-head attentionpooling layer to focus on the historical knowledge states related to the knowledge concepts to predict the mastery.Experimental results on three real datasets show that the proposed method is more suitable for student knowledgeportrait task so as to obtain a more trustwor

7、thy student knowledge portrait,and overperforms the baselines on metrics.Key wordsstudent knowledge portrait;knowledge tracing;intelligent education;data mining;deep learning摘要学生知识画像是对学生在不同知识概念掌握程度的全面精准的表示.通常,智能教育系统中使用知识追踪方法,基于显式的学生交互数据,对学生在某些知识概念的隐式掌握程度进行建模.然而知识追踪方法的预测结果与学生知识画像存在着时序、预测粒度不一致的情况,导致其产

8、生的学生知识画像不可信.对此,首先基于端到端的学生知识掌握度预测目标定义并形式化学生知识画像预测任务,然后提出了一种深度知识画像(deep knowledge portrait,DKP)模型.该方法首先在知识粒度上学习交互表征,引入了知识难度、知识概念等特征在知识粒度上区分交互;然后,采用双向长短时记忆网络基于学生历史交互序列,建模学生知识状态变化.最后针对待预测知识概念,使用了多头注意力池化层强化历史序列中的相关交互以进行该概念下的学生掌握度预测.在 3 个真实的数据集上的实验结果表明,所提出的方法更适合学生知识画像预测任务从而获得更可信的学生知识画像,并在各项性能上超过了现有的方法.收稿日

9、期:2023-03-31;修回日期:2023-06-08基金项目:国家重点研发计划(2021YFF0901003)This work was supported by the National Key Research and Development Program of China(2021YFF0901003).通信作者:吴金泽()计 算 机 研 究 与 发 展DOI:10.7544/issn1000-1239.202330229Journal of Computer Research and Development60(8):18221833,2023关键词学生知识画像;知识追踪;智能教

10、育;数据挖掘;深度学习中图法分类号TP391 学生知识画像建模是智能教育中的一个基础的任务.它旨在通过挖掘学生历史记录,对学生的知识状态,即知识概念的掌握程度进行推断,从而在知识维度上构建个性化的学生表示,即学生知识画像.基于 学 生 知 识 状 态 表 示,智 能 教 育 系 统(intelligenteducation systems)能够针对性地关注学生薄弱点为学生提供各种个性化的智能教育服务.例如为学生推荐个性化的试题、教学视频等学习资源以及为学生定制学习路径,从而让学生的学习过程减负增效1-10.现有的学生知识画像建模任务及应用中,往往使用知识追踪(knowledge tracing

11、,KT)类方法10刻画学生.知识追踪方法通常首先定义一个学生知识状态向量以表示学生在各个知识概念上的掌握程度,并基于学生每个时刻的表现预测目标,优化该隐式的知识状态向量,使其可以动态表征学生知识状态变化趋势.特别是近年来,基于深度学习的方法已经成功应用到知识追踪任务中,并且在学生未来答题表现预测目标上获得了成功11.然而知识追踪方法的最终目标是预测学生未来时刻的题目粒度上的作答得分.这造成了此类方法的预测目标与期望的衡量学生在知识概念上的掌握程度的知识画像不一致的问题 12-14,最终导致了基于知识追踪方法的学生知识状态建模结果不可信,从而难以被应用在面向学生知识画像的智能教育场景与应用中.具

12、体而言,现有方法在进行学生知识画像建模时的不一致问题产生了不可信的预测,具体来说现有方法具有 2 方面的不一致性:kc31)时序不一致.知识追踪方法通常就学生答题表现预测这一优化目标进行优化.模型关注的是预测学生下一时刻对某个题目的作答情况的即时能力,而学生知识画像期望的是一种足以描述学生在未来一段时间内表现的学生知识状态.这种时序上的不一致导致了预测结果的不可信.如图 1 所示,学生在知识概念(“减法的计算和应用”)下一时刻作答错误,然而随后的作答连续正确.如果仅关注下一时刻的作答以评估学生知识概念上的掌握情况,将导致获得不可信的知识状态.q2)预测粒度不一致.现有的知识追踪方法通过对学生历

13、史答题记录的挖掘和建模对未来时刻学生在某个试题 上的期望作答结果进行准确的预测.在此过程中,知识追踪方法将学生知识状态建模为一 答题序列答题结果历史序列知识状态建模知识画像未来答题kc1:四则混合运算kc2:加法的计算和应用kc3:减法的计算和应用kc1q1q2q3q4q1q2q3q4q5q6kc2kc2kc1kc1kc3kc1kc2kc3kc3kc3kc3Fig.1Student knowledge portrait prediction图 1学生知识画像预测王士进等:可信的端到端深度学生知识画像建模方法1823kc3kcq1,q2,kc1kc2种抽象的表示,并假设更准确的试题作答预测与知识

14、状态表示的更好估计是一致的.然而题目粒度上的作答预测受题目选择的影响较大,如图 1 所示,选择学生对知识概念(“减法的计算和应用”)中前 2题的作答情况和后 2 题的作答情况估计学生该知识粒度的掌握程度会有明显的差距 15.因此在题目粒度上进行学生知识画像建模难以获得可信的估计.与之对应的学生知识画像预测的目标是建模学生对知识概念粒度的掌握度.如图 1 所示,通过对学生历史序列的建模,学生知识画像预测方法被期望输出学生对知识概念的掌握度估计.该估计应当能够衡量在短期内学生在某知识概念相关题目上整体的作答情况.例如,知识画像方法对学生在(“四则混合运算”)的掌握度产生了较低的估计,这与真实记录中

15、学生在该知识概念上短期内的较差的作答情况吻合;方法对(“加法的计算和应用”)上掌握度较高的估计也吻合了学生在该知识概念较好的未来作答情况,这种知识状态的估计将更为可信和准确.针对上述问题,本文提出了端到端深度学生知识画像方法.本文首先针对现有方法在学生知识画像预测时的目标不一致的情况,构建了时序、预测粒度一致的端到端学生知识掌握度预测目标.进一步地,本 文 提 出 了 一 种 深 度 知 识 画 像(deep know-ledge portrait,DKP)模型.DKP 模型包含 3 个主要模块:1)知识粒度交互表征模块;2)知识状态序列建模模块;3)知识画像预测模块.具体而言,知识粒度交互表

16、征模块用于在知识粒度上描述学生的交互,以确保预测粒度的一致性.因此该模块融合了更多的知识层面的试题表征,如知识概念、知识难度等表征,从而区分学生在不同知识概念上的作答交互.特别地,该模块使用知识聚合策略融合与当前练习知识相关的知识表征,从而引入知识之间的相关性.知识状态序列建模模块负责基于学生历史作答序列,建模学生知识状态.本文使用双向长短时记忆(Bi-LSTM)网络架构以更好地捕捉学生作答时序的信息.知识画像预测模块端到端地对学生在某些知识概念上的掌握程度进行预测,从而粒度一致地对学生知识状态进行估计.为了增强对学生历史状态中与待画像知识概念相关信息的关注,本文设计了一种多头注意力池化层,基

17、于多头注意力机制有选择地过滤历史交互,为更相关的交互赋予更高的重要性.最终,DKP 模型能够端到端地对学生在某些知识概念的掌握度进行预测,从而实现预测与任务目标的一致性,产生可信、可解释的学生知识画像.本文在 3个真实数据集上进行了实验,实验结果表明 DKP 在学生知识画像预测任务中能够获得更加可信的学生知识画像,在数据集上的各项指标超过了目前最优的方法.1相关工作 1.1知识追踪方法20 世 纪 90 年 代 以 来,知 识 追 踪(knowledgetracing,KT)成为了智能教育的一项基本任务,其目的是根据学生的历史学习表现来追踪学生的知识状态10.其中,基于贝叶斯知识追踪(Baye

18、sian knowledge tracing,BKT)的模型就是一类代表性方法,也是第一类被提出的知识追踪模型1.BKT 利用隐马尔可夫模型将学生的知识状态表示为一组二值化的参数.近年来,由于深度学习技术能够对数据高效地建模和挖掘,深度学习技术被广泛地应用在各项方法中.其中,深度知识追踪(deep knowledge tracing,DKT)首先将深度学习引入到知识追踪任务中,DKT 利用循环神经网络(RNN)以及其变体建模学生答题记录并更新学生的知识状态表示11.随后 DKT 方法变体依次被提出,例如卷积知识追踪(CKT)应用卷积神经网络(CNN)来 模 拟 学 生 个 性 化 学 习 过

19、程15.动 态 键 值 网 络(DKVMN)被引入追踪和记忆学生能力变化16.基于注意力机制的知识追踪(SAKT,AKT)方法引入了注意力机制建模学生学习过程17-18.基于图神经网络的知识追踪(GKT)应用图神经网络(GNN)方法来建模知识概念之间的关系19-20.学习过程一致的知识追踪(LPKT)考虑到学生学习过程中的记忆和遗忘因素来建模学生学习过程中知识状态的变化趋势14.此外一些知识追踪方法也致力于引入更多额外信息增强学生表现预测的效果,如试题表征21、难度属性22,知识关系等23.然而现有的知识追踪方法大多关注学生在题目上的得分,这与对学生知识概念掌握程度的估计的目标不一致,导致了产

20、生了不可信的学生画像.1.2用户建模用户建模是一项基本任务,它旨在通过分析用户显式的行为数据,推断出用户难以观察的隐式画像特征,如能力、偏好、习惯、倾向等24.用户建模任务广泛地应用在各个领域中,通过建模用户准确的画像,从而为下游任务提供丰富的信息.近年来,研究者们基于深度神经网络对用户建模来推断用户的视觉能力25、律师的专业性26、游戏中玩家竞争力27、1824计算机研究与发展2023,60(8)以及用户的在饮食、社交、旅游、新闻检索等各门类的偏好28.但与其他领域中用户画像往往作为一个隐式的信息用于下游任务推断不同,教育领域的学生知识画像成为了重要的期望输出,并且对其可信性要求更加严苛.但

21、是现有工作往往没有保持学生知识画像的任务目标与方法目标的一致性,也难以输出可信的学生知识画像,这阻碍了其在智能教育实际场景中的应用.2模型与方法本文提出了用于学生知识概念掌握度预测的DKP 模型,DKP 模型框架如图 2 所示.在本节首先形式化了学生知识画像预测任务与目标.然后详细介绍 DKP 细节,包括知识粒度交互表征模块、知识状态序列建模模块,以及知识画像预测模块.2.1问题定义SQKCR=(q1,kc1,a1),在介绍具体的模型设计之前,本文首先针对现有方法与学生知识画像预测目标的不一致的情况,为学生知识画像任务构建了时序、预测粒度一致的端到端的学生知识掌握度预测目标.在一个智能教育系统

22、中,学生集合为,题目集合为,知识集合为.学生对试题作答形成了学习记录 特征嵌入特征融合知识粒度交互表征模块知识状态序列建模模块双向LSTM历史学习状态htMLPr知识画像预测模块MLP多头注意力池化知识聚合知识图谱kctkcpkcepkcetdktdketdqtdqetataet表征向量xt知识状态表征hattFig.2DKP model图 2DKP 模型王士进等:可信的端到端深度学生知识画像建模方法1825(q2,kc2,a2),.,(qt,kct,at)(q,kc,a)kcqaMkcpr 0,1ryminF(r,y).每个时刻 t 的学习记录为一个三元组,表示了某学生在属于知识概念的题目

23、上的交互,其中作答结果为.本文的目标是构建知识粒度的学生知识画像模型,针对待预测知识概念,输出预测结果,其中 1 表示学生完全掌握该知识,0 表示学生不完全掌握该知识,将 与衡量学生知识概念掌握度的真实画像(真实画像的构建将在 3.2.2 节画像场景构建详细介绍)进行拟合,即实现.最终实现对学生在某个知识概念上的掌握度进行端到端的推断,并保持与真实画像的一致,以吻合其未来一段时间的表现情况,从而获得可信的学生知识画像.2.2知识粒度交互表征模块学生的学习过程由相对独立的学生题目交互组成.正如前文所提到的,仅关注题目粒度上的特征与交互,忽略了学生在知识粒度上的表现将导致产生不可信的结果.为了更好

24、地利用题目的特征,并在知识粒度上对学生掌握度进行刻画,本文设计了知识粒度交互表征模块,基于学生交互生成良好的表示作为后续算法层的输入,并保障预测与知识画像的一致性.dqkcdkaEK RKddkcikceiRK RKK学生知识画像预测的目标是获取学生在某些知识概念上的掌握程度,因此建模的表征需要更加关注题目在知识层面的信息,从而有效地区分不同的知识在概念上的交互.因此本文使用包括题目的难度、题目所属的知识概念、对应知识概念的难度,以及交互的结果 等特征进行交互建模.特别是与现有方法使用 one-hot 向量表示不同的类型或元素的表示方法不同,本文使用信息更稠密的嵌入向量表示来表征特征.具体而言

25、,如图 2 所示,对于题目的知识概念,本文首先随机初始化一个嵌入矩阵,其中 为嵌入向量的维度.任意一个知识概念均可以用某一行向量对应地表征.众所周知的是,知识概念之间存在着广泛的联系,而不是孤立的存在29,在学生进行题目交互时,与该题目对应的知识概念相关的知识概念的掌握程度往往也会影响学生的表现.为了建模知识概念之间的关联,本文使用了一个嵌入矩阵,其中每行代表了某个知识概念与其他知识概念之间的相关性.本文直接使用了知识之间的关联构造了关系矩阵增强知识之间的相关性,以启发式地构建知识关联.在更复杂的场景中,可以将知识点构造为有向或无向的图结构,进一步采用图神经网络的方法,获得更具表达性的知识表征

26、.本文关注的重点是进行端到端的学生的序列建模以获得可信的学生知识画像,因此采用了直观的方法进行知识相关性的建模.最终基于知识相关性获得了综合的知识概念表征:kcei=kcei+RKiEK.(1)对于题目难度,本文采用了经典测量理论中的项目难度分析方法30-31:dq=|Si|i=0ai=1|Si|mod,(2)Siqiai=1其中是训练集中回答了题目的学生集合,表示回答正确的样本,为预定义的难度级别标准.类似地,对于知识概念难度,遵循相似的计算方法:dk=|Si|i=0ai=1|Si|mod,(3)Sikciai=1其中是训练集中作答了知识概念的学生集合,表示回答正确的样本,为预定义的难度级别

27、标准.基于式(2)(3),本文在题目和知识概念粒度上均统计了平均得分率并基于难度级别将其划分为多个难度级别,以用于后续的特征向量化.EDQ RDdEDK RDddqei,dkeiER R2daeix进一步地,本文随机初始化嵌入矩阵,对题目难度以及知识概念难度分别表示为;还随机初始化了嵌入矩阵,对作答结果0,1表示为向量.最后将上述交互特征组合后输入多层感知机(multi-layer perceptron,MLP),获得每次交互的表征向量,计算方式为:xi=WT1kceidqeidkeiaei+b1,(4)W1 R4ddb1 Rd其中是 MLP 的权重矩阵,是对应的偏差项.通过该交互表征模块,本

28、文考虑了一次交互过程中的重要特征,从而能够更好地区分学生在不同知识概念上练习的行为.同时利用了嵌入向量表示,增强了各个特征的表达能力.经过训练,本文提出的方法可以获得更加精准有效的交互表征.2.3知识状态序列建模模块基于交互表征模块输出的学生知识粒度上的表征序列,该模块旨在挖掘知识粒度上的学生知识状态变化,以保持预测粒度的一致性.特别是,学生的学习是一个动态的过程,学生在这个过程中逐渐熟练掌握或遗忘某些知识,因此学生的知识状态会随着学生与题目的交互动态地变化.如图 2 所示,本文提出的 DKP 模型使用循环神经网络对学生知识状态进行建模.具体地,本文采用了长短时记忆(LSTM)进行学生状态建模

29、.基于交互表征模块中建模的1826计算机研究与发展2023,60(8)xt某时刻学生交互输入,学生知识状态的具体计算公式为:it=(WTixtht1+bi),ft=(WTfxtht1+bf),ot=(WToxtht1+bo),ct=ftct1+ittanh(WTcxtht1+bc),ht=ottanh(ct),(5)Wi,Wf,Wo,Wc R2ddbi,bf,bo,bcRdhtht=ht,ht其中是权重矩阵,是偏差项.隐层参数被视为学生的知识状态,并被持续地更新和计算.传统的知识追踪场景中,模型关注连续时刻学生的表现,因此通常使用单向的网络进行连续单步推断和拟合,同时保障未来信息的不可见.然而

30、,学生知识画像预测任务倾向于一种静态的序列预测任务,虽然学生作答过程中的知识状态是动态变化的,但是在学生知识画像阶段,学生过去的所有序列均是可见的.同时,不同于表现预测中预测点通常是连续的,真实场景中学生掌握度预测的预测点通常是离散的,智能应用往往在学生经过一段时间的学习后对学生掌握度进行阶段性推断并生成学生知识画像.基于学生知识画像的场景时序,不同于使用单向的 LSTM 进行动态的训练,本文的DKP 使用一种双向双层的 LSTM 从而在画像前对学生的历史序列进行双向建模,避免了历史作答信息的过度遗忘,更好地捕捉作答的时序信息,增强学生知识状态的可信性.具体而言,如图 2 所示,本文使用的双向

31、 LSTM 包含了 2 个独立的 LSTM 结构,如式 5 所示.2 个 LSTM 分别使用正向的输入序列和反向后的输入序列作为输入,最终通过拼接 2 个 LSTM结 构 的 输 出,获 得 双向 LSTM 的 输 出 隐 层 参 数.2.4知识画像预测模块kcp与传统知识追踪任务对题目粒度的拟合和预测不同,本文关注的学生知识画像预测任务是面向学生历史交互序列,对知识粒度上学生掌握情况的推断,从而获得可信的知识状态.在对不同的知识概念进行画像时,对学生历史状态的关注是不同的,具体来说与当前被预测知识概念更相关的知识概念以及交互记录更应该被关注以增强画像的可信性.因此,在知识画像预测模块中,本文

32、设计了一个多头注意力池化层,从而选择出在学生历史中更加重要的交互,以构建最终的知识状态表征向量.具体而言,学生知识状态序列建模模块生成了H=(h0,h1,)kcep包含了学生在每个交互时刻的知识状态向量的历史状态矩阵.基于待预测的知识概念向量,本文使用多头注意力机制对学生知识状态进行聚合.首先该模块计算知识状态向量与待预测知识概念向量之间的相似度:i=WaWnhi,Wnkcep,(6)Wn Rnddn 1Wa Rd1hattn其中是一个映射矩阵.当时,该池化层将使用多头注意力衡量知识状态与待预测知识概念之间的相关性.将高维的相似表征映射为一个衡量相似度的标量.多头注意力机制为与待预测知识概念更

33、相关的知识状态赋予更高的权重,并通过将学生各个时刻的知识状态进行加权融合,计算出最终的学生知识状态表征:hattn=ti=0hiexp(LeakyReLU(i)exp(tj=0LeakyReLU(j).(7)最后本文通过将加权后的学生知识状态表征与待预测知识概念表征拼接后输入另一个 MLP 中计算学生某个知识概念上的画像值:r=WT2kcephattn+b2,(8)W2 R2ddb2 Rd类似地,其中是一个权重矩阵,是一个偏差项.基于该模块,由于使用了显式的知识概念信息的输入,并在知识粒度上对受关注的信息赋予了注意力,模型最终能够端到端输出对应知识概念的预测结果,增强了输出的可解释性,最终生成

34、可信的学生知识画像.ry为了在时序、预测粒度一致的先验下训练 DKP中的所有参数和随机初始化的表征向量,本文基于端到端的学生知识掌握度预测目标,使用预测知识概念画像 与真实画像(真实画像的相似构建将在3.2.2 节画像场景构建详细介绍)之间的交叉熵对数损失作为目标函数,目标函数表示:loss=(ylog(r)+(1y)log(1r).(9)3实验 3.1数据集为了验证本文提出的 DKP 模型的有效性,本文选取了 3 个真实数据集进行实验,这 3 个数据集的具体介绍为:1)Assist数据集收集自在线教辅平台ASSISTments王士进等:可信的端到端深度学生知识画像建模方法1827 https

35、:/ 4 217 名学生,属于 124 个知识点上的 26 687 个题目上的总计 401 756 条交互记录.平均每个学生的交互记录长度约为 95.2)JunYi数据集收集自基于可汗学院发布的开源代码和 2012 年建立的在线学习平台 Junyi Academy中的答题日志.该数据集包含来自 247 606 名学生,属于 39 个知识概念的 720 个题目上的总计 25 925 992条学习交互记录.平均每个学生的学习交互记录长度约为 104.3)MATH 数据集来自于某知名智能教育企业在线学习数据,该数据集收集了 20192022 年初中学生的在线答题记录.该数据集包含来自 16 661

36、名学生,属于 1 427 个知识概念的 49 853 个题目上的总计4 319 270 条学习交互记录.平均每个学生的学习交互记录长度约为 259.3.2实验设置 3.2.1数据划分在所有的数据集上,本文按答题时序将每个学生的答题日志组成一条序列数据.进一步地,本文随机地将 90%的序列作为训练集,10%的序列作为测试集.针对训练集,本文采用了标准的 5 折交叉验证进行模型训练和验证.所有的超参数都是在训练集上学习,在验证集上表现最好的模型被用来评估测试集.3.2.2画像场景构建本文关注学生知识画像场景对学生在各个知识概念上画像的效果,因此在进行基于学生知识画像预测任务的训练以及学生知识掌握度

37、预测时需构建可信的学生真实画像.本文首先按照答题的时间顺序对学生的所有学习交互记录进行排序.然后将交互记录进行切分,构造学生知识画像预测的输入与预测序列.其中对于 MATH 数据集,本文使用该数据中自然存在的学生测评时刻作为画像点,使用画像点前最长 150 条交互记录作为输入,对于短于该长度的序列,使用零向量将其填充到固定长度;画像点后最长 50 条交互记录作为预测序列,其中出现的知识概念作为待画像知识概念.学生的画像值应该能够代表学生短期内的预期表现,因此学生在知识概念上的画像值被定义为预测序列中每个知识概念前 3次交互的整体作答情况,其中 3 题都答对,意味着完全掌握该知识概念,对应画像值

38、为 1;否则意味着非完全掌握,画像值为 0.类似地,对于 Assist 和 JunYi 数据集,因为其不存在天然的画像点,本文在每条交互记录中,每隔 50 个交互记录定义一个画像点,并将该点前最长 150 条交互记录作为输入,画像点后最长 50 条交互记录作为预测序列,预测序列中出现的知识概念作为待画像的知识概念.进一步地,本文分析了不同的真实画像值计算方式与学生未来表现的一致性,如表 1 所示.表 1 展示了使用学生某个知识概念未来 2 道、3 道、5 道题的平均作答情况作为学生画像值时,学生未来至少3 道题的表现情况.能够看出,当计算画像题数目过多或过少时,学生未来表现的一致性都会下降,即

39、正例的平均得分与负例的平均得分之间的差距过小,难以区分学生掌握程度,因此本文选择了 3 道题计算学生真实画像.Table 1Consistency Between Different Portrait Valuesand Students Future Performance表 1 不同画像值与学生未来表现一致性数据集画像计算题数类别未来表现MATH2正例0.823 4负例0.672 53正例0.804 9负例0.609 95正例0.799 6负例0.658 6 3.2.3参数设置(6/(ni+no),6/(ni+no)ninod本文使用泽维尔初始化32模型训练中的所有参数,即使用采样于的均匀

40、分布参数,其中和分别是输入和输出的维度.然后以 128 为批数据大小进行模型训练,并采用学习率为 0.001 的 Adam 优化器进行优化.此外,对于 DKP中嵌入矩阵、MLP 和 Bi-LSTM,本文设置隐层维度=200,其 中 Bi-LSTM 的 层 数 为 2;难 度 级 别 标 准=0.2,从而将题目和知识概念难度划分为 5 个级别.3.2.4对比实验方法本文将 DKP 与现有典型知识追踪方法在学生知识画像预测任务上进行了对比.基线模型具体介绍为:1)基于 LSTM 实现的 DKT11.本文使用 DKT 建模的学生知识状态作为学生知识画像,其中知识状态的每个位置的标量表示了对对应知识概

41、念的掌握程度.1828计算机研究与发展2023,60(8)https:/pslcdatashop.web.cmu.edu/Files?datasetId=11982)基于动态键值记忆网络的 DKVMN16.本文使用 DKVMN 中表示学生知识概念掌握程度的值网络作为学生知识画像.3)基于自注意力机制的 SAKT17.类似地,本文使用其建模的学生知识状态作为学生知识画像,其中知识状态的每个位置表示了对对应的知识概念的掌握程度.4)对具有单调注意力机制和基于Rasch 模型题目表征的 AKT18.由于 AKT 没有显式地把学生表示与知识体系进行对齐,而是使用了一种抽象的隐层向量表示学生知识状态,最

42、终在题目粒度上进行知识追踪.因此,本文使用 AKT 在对某个知识概念下所有题目的预测作答结果的平均值作为该学生在这个知识概念上的掌握程度,通过这个方法,本文使用面向题目粒度的学生表现预测输出构建出了学生知识画像.5)考虑到学生学习过程中的记忆和遗忘因素来建模学生知识状态变化趋势的 LPKT15.该方法用向量而不是标量为学生在每个知识概念上提供了抽象的表示,并在题目粒度上对学生进行知识追踪.因此,本文使用 LPKT 对某个知识概念下所有题目的预测作答结果的平均值作为学生在某个知识概念上的掌握程度,即预测画像.对于所有数据集和模型,本文均沿用原始论文中的方法和配置11,15-19,并选择在验证集上

43、表现最好的模型来评估测试集.上述所有模型都在带有 4块 2.30 GHz Intel Intel Xeon E5-2650 CPU 资源和 2 块NVIDIA Tesla M40 GPU 资源的 Linux 服务器上进行训练.3.3学生知识画像预测为了评估 DKP 的有效性,本文将 DKP 与所有的基线模型在学生知识画像预测任务上进行比较.实验结果如表 2 所示,在 表 2 中本文展示了多次实验的平均指标与偏差,其中偏差代表了多次重复实验中指标的平均结果与最大(最小)结果的差距.为了提供可靠的对比结果,本文在所有实验中都采用了3 项评估指标:ROC 曲线下面积(AUC)33、均方根误差(RMS

44、E)和准确度(ACC),其中在计算预测准确性时将分类阈值设置为 0.5.从表 2 中可以观察到 2个重要的实验结果:1)受益于基于时序、预测粒度一致的端到端的学生知识掌握度预测目标优化的深度学生画像模型,本文提出的方法在学生知识画像预测任务上超过了基于知识追踪的方法.2)AKT 与LPKT 方法基于平均题目预测构建的知识画像较基于隐层知识概念的方法 DKT,DKVMN,SAKT 构建的知识画像在各个数据集上总的来看具有较高的预测准确率.这是因为 AKT 和 LPKT 这 2 个方法更好地将学生知识画像预测任务和题目预测任务在知识粒度上统一起来,因此增强了知识画像的可信性.然而一方面 DKP 在

45、时序粒度上更好地保持了任务的一致性,另一方面基于题目预测的方法,每个知识概念下预测题库的容量和选择也会带来一定偏差,DKP因此可以获得最好效果.Table 2Performances of Student Knowledge Portrait Prediction on Each Dataset表 2 各数据集上学生知识画像预测表现模型方法数据集AssistJunYiMATHACCAUCRMSEACCAUCRMSEACCAUCRMSEDKT0.628 20.0020.701 20.0090.662 70.0080.623 20.0070.685 80.0090.613 70.0050.569

46、10.007 0.701 10.005 0.656 30.005DKVMN0.639 50.0050.663 00.0060.578 50.0030.630 90.0040.660 40.0060.523 30.0070.615 60.006 0.649 30.004 0.552 00.003SAKT0.614 60.0090.708 90.0070.620 70.0050.633 90.0002 0.699 70.0002 0.605 00.00030.593 90.005 0.698 90.002 0.640 30.005AKT0.637 00.0080.664 40.0060.600 2

47、0.0020.626 70.0060.682 60.0030.559 40.0050.662 70.001 0.718 50.003 0.532 50.001LPKT0.668 10.0030.680 30.0030.554 10.0040.636 10.0010.703 10.0050.549 30.0030.645 50.002 0.689 30.001 0.525 80.000 2DKP0.695 50.000 2 0.720 60.000 2 0.439 80.000 10.673 40.000 7 0.704 90.007 0.451 20.000 30.685 90.003 0.7

48、47 80.002 0.448 90.002 进一步,考虑到真实场景对学生知识画像效率的需求,本文比较了 DKP 与基线方法的推理效率.实验结果如表 3 所示,从表 3 中可以观察到 DKP 方法的推理速度更具有竞争力.特别是其中基于隐层知识概念的方法 DKT,DKVMN,SAKT,由于每次进行学生知识画像时其可以一次性输出所有知识概念上的学生知识画像向量,并进行取舍和索引,因此具有较快的推理速度;基于题目预测的方法 AKT,LPKT在针对某个知识概念进行预测时需要在题目粒度上对该点对应的所有题目进行预测,因此推理速度相对较慢.因此,本文提出的方法在保障一定的推理速度的基础上,实现了可信的学生

49、知识画像预测.王士进等:可信的端到端深度学生知识画像建模方法1829 3.4消融实验=1=0.5=0.3=0.2为了进一步验证 DKP 中各模块的有效性,本文在各个数据集上对 DKP 模型进行了消融实验.本文构建了 4 种简化模型,对 DKP 的交互表征模块、知识状态序列建模模块以及知识画像预测模块进行了消融,消融过程分别是去除了相关知识概念的聚合,交互的难度表征,将建模交互序列的 Bi-LSTM 改为简单的 LSTM以及在预测过程中去除了注意力机制.实验结果如表 4 所示,总的来看,完整的学生知识画像方法 DKP 优于其他简化方法.特别是,由于 DKP引入了注意力池化,增强了知识粒度的一致性

50、,实现对学生历史状态中相关部分的关注,最终获得了更可信的画像预测.进一步地,为了对比不同的难度级别设置对模型效果的影响.本文设置了不同的难度级别,并对比不同设置下模型的效果,其中包括:1 个级 别();2 个 级 别();3 个 级 别();5 个级别().实验结果如图 3 所示,较精细的难度级别划分通常能够获得更优秀的结果,这说明了难度特征能够建模学生与试题交互时提供有效的信息,增强画像的可信性.Table 4Results of Ablation Experiment表 4 消融实验结果数据集消融版本ACCAUCRMSEAssist完整的 DKP 方法0.695 50.720 60.439

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服