收藏 分销(赏)

“互联网+”背景下学生网络学习行为分析及预警_孙泽军.pdf

上传人:自信****多点 文档编号:258846 上传时间:2023-05-25 格式:PDF 页数:10 大小:618.07KB
下载 相关 举报
“互联网+”背景下学生网络学习行为分析及预警_孙泽军.pdf_第1页
第1页 / 共10页
“互联网+”背景下学生网络学习行为分析及预警_孙泽军.pdf_第2页
第2页 / 共10页
“互联网+”背景下学生网络学习行为分析及预警_孙泽军.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、收稿日期:2022 09 08基金项目:河南省教育科学规划课题(2021YB0232);河南省高等学校重点科研项目(23A520051)作者简介:孙泽军(1979),男,四川省内江市人,工学博士,平顶山学院信息工程学院副教授,主要从事数据挖掘、复杂网络结构挖掘研究“互联网+”背景下学生网络学习行为分析及预警孙泽军,常新峰,王飞飞,杨开语(平顶山学院 信息工程学院,河南 平顶山 467036)摘要:随着“互联网+”模式的飞速发展和普及,信息技术改变了传统的教学模式,网络学习和智慧教学受到了大众的青睐 笔者针对当前网络学习行为分析存在的不足,基于工程教育认证理念,采用数据挖掘方法、机器学习算法和可

2、视化技术对学生的网络学习行为、课程目标达成度及期末成绩进行多维度分析,并根据学生学习行为对期末成绩进行预测,给出预警 该研究有利于探索蕴含在数据背后的学习规律,为管理者提供决策支持,为教师教学提供支撑数据,为学生提供学业指导和预警关键词:学习行为分析;互联网+;机器学习;数据挖掘;聚类中图分类号:TP391文献标识码:A文章编号:1673 1670(2023)02 0037 100引言目前,信息技术已经融入人们的学习、工作和生活等方方面面,随着数字技术、网络技术、5G、数据处理和分析技术的快速发展,教育技术也得到了大幅的提升,网络与各种新技术的融合促进了教学模式的巨大变革 教育从面对面课堂教学

3、为主的传统教学模式逐渐转变为线上、线下、翻转、混合等多种新型教学模式的融合1 自 2015 年国务院印发国务院关于积极推进“互联网+”行动的指导意见 以来,“互联网+”更进一步地促进了教育技术的革新和深入发展 各个高校、企业、政府都建立了大量的在线学习平台,这些网络教学平台为学生提供了各种优质的学习资源 在各类网课平台、钉钉、QQ、腾讯会议等平台和软件的支撑下,学生既可以通过网络面对面地和老师交流,又可以自行学习大量的网络课程,且这种学习不受时间和空间的限制,学生还可以根据自身需要选择学习内容,随时随地进行学习,这给学生的学习提供了极大的便利 因此,教学主体也由以教师为主转变为以学生为主在“互

4、联网+”背景下教师的教学模式和学生的学习方式都发生了变化,相应的学生的学习行为分析和评价方式也应该发生相应的改变 在传统的教学中,对学生的学习行为分析和评价主要是基于学生课堂表现、作业、实验和期末考核来进行 通过教师对各项数据的人工整理和分析,找出学生知识存在的缺陷,然后制定个性化的指导方案 这种传统的学习行为分析方式主要存在以下问题:1)教师对学生的学习行为分析和评价以自己掌握的学习行为数据和主观意见进行,不同教师由于掌握数据不同,认知不同,评价标准也不一样,导致分析和评价结果有较大偏差;2)对学习行为数据的人工分析停留在浅层次和面上,很难挖掘学生学习行为数据间的深层次关联,导致分析结果不准

5、确;3)各种学习数据的融合处理,给人工分析带来巨大的挑战,人工分析效率低,且操作过程中不可避免出现失误或差错;4)传统的学生学习行为数据较单一、片面,不能体现学生的全部学习行为 因此,传统的学习行为分析方式已经不能满足“互联网+”背景下学生学习行为分析的需求 在“互联网+”教学模式下,学生在学习课程中将会产生大量的过程数据,如学习时间、学习时长、作业提交情况、互动、测试、作业等,这些数据较全面地刻画了学生的学习行为,且这些数据由教学平台记录,可以很方便地采集 对这些数据进行清洗、预处理、挖掘和分析,第 38 卷第 2 期2023 年 4 月平顶山学院学报Journal of Pingdings

6、han UniversityVol 38 No 2Apr 2023可以探索蕴含在数据背后的学习规律,为管理者提供决策支持,为教师教学提供支撑数据,为学生提供学业指导和预警 因此,对“互联网+”背景下学生的网络学习行为进行分析有重要的意义和应用价值近年来,已有学者和相关机构对学生的学习行为进行研究,并提出了一些有效的挖掘和分析方法 赵丽等2 提出了传统课堂教学行为分析存在的问题 “多以人脑分析为主,依赖专家,分析效率低,分析不准确”,并分析了人工智能支持的课堂教学行为分析的困境与路径 朱冰洁等3 介绍了“金字塔”式网络学习平台的构建,并通过数据挖掘技术、频次统计和数据可视化方法分析了学生的学习行

7、为 廖雅琪等4 基于 SPSS 软件对学生的学习行为进行了简单的相关分析、等级相关分析、单因素方差分析等 彭涛等5 为有效地挖掘和分析网络教学平台的日志文件,提出了双路聚类建模方法,对学习者进行聚类 Sun Zhiru 等6 利用追踪数据和自我报告数据来识别学生的课前学习行为概况,并调查所识别的学习概况与随时间变化的成就轨迹和翻转本科数学课程中学生感知的成就目标取向之间的关系 采用多项逻辑回归分析、潜在轮廓分析、多元协方差分析等技术对学习者的学习行为进行了挖掘分析,并针对问题提供了相应的建议 综上,现有文献针对传统学习行为分析的不足,结合统计分析、数据挖掘、机器学习、数据可视化等技术,从不同角

8、度对学生的行为数据进行了深入的探索研究,且取得了一定的效果 然而,目前的挖掘分析还处于起步阶段,大多数研究只是针对学生的学习行为与取得成绩相关性进行分析,但是成绩只是学生学习结果的一个客观表现,并不能全面体现出学生解决实际问题的能力 以学生为中心,产出为导向,持续改进为理念的工程教育认证在各高校广泛推行,其重点是培养学生解决实际工程问题的能力 笔者针对工程教育认证标准进行分析研究,基于工程教育认证标准对学生学习行为进行建模、挖掘和分析1相关知识国内外有很多研究学者对学习行为数据进行了研究分析和预测,也提出了大量的研究方法,例如聚类分析方法、相关性分析方法、K-近邻算法、梯度下降算法、合成少数过

9、采样技术(SMOTE)算法、决策树等数据挖掘和机器学习分析方法 以下简单介绍几种常用的方法,更多的方法可以参考综述文献 7 9 1 1数据挖掘方法1 1 1聚类分析方法聚类指将具有相似特征或性质的个体聚集到一起 聚类分析方法广泛应用于工业、医学、交通、社交、教育等多个行业和领域 常用的聚类分析方法有划分聚类、分层聚类、密度聚类 划分聚类针对样本数据集,先建立一个初始划分,然后使用迭代方法优化划分结果 K-means 聚类算法是一种应用较广且较高效的划分算法,该方法根据给定的聚类个数进行划分,其缺点是对异常样本点较为敏感10 分层聚类也叫层次聚类,该类方法采用分层的树形结构,以自顶向下或自底向上

10、的方式进行聚类,近几年学者们也提出了多个改进的层次聚类算法 11 12 密度聚类主要是根据样本间的密度进行聚类,该方法的优点是可以识别任意形状 DB-SCAN 聚类算法是一种经典的密度聚类算法 13,为了适应大数据处理和并行云计算,近几年也提出了基于该算法的多个改进算法 14 15 1 1 2相关性分析相关性分析主要是指对两类或多类样本之间的关联性进行分析,用来衡量两个样本的相关密切程度 相关性分析使用非常广泛,例如市场上分析产品广告和销售量之间的相关性 生物学上分析生物的行为动作与环境的相关性 医学上分析疾病与患者行为之间的相关性 教育上分析学生在线学习行为与学习效果之间的相关性等16 18

11、 常用的相关性分析方法有图表相关分析方法、协方差及协方差矩阵分析方法、相关系数分析方法、多元回归分析方法、信息熵与互信息分析方法等 相关系数方法通过提取样本数据的特征矩阵,能较准确地反映样本之间的相关性 笔者采用相关系数方法对学生学习行为进行研究1 2机器学习方法1 2 1K-近邻算法K-近邻(K-Nearest Neighbor,KNN)算法是一个有监督学习的分类方法,该方法基于“物以类聚,83平顶山学院学报2023 年人以群分”的思想 在特征空间中,如果一个样本附近的 K 个最近样本的大多数属于某一个类别,则该样本也属于这个类别 KNN 方法简单、易懂,同时也很强大,对于手写数字的识别、鸢

12、尾花这一类问题来说,准确率很高 因此,KNN 方法广泛应用于图像识别、自然语言处理19 其缺点是需要人工给出 K 值,不同的 K 值结果可能会产生很大偏差,因此在分析预测中应选择合适的 K 值;另外该方法计算量较大、效率低,对训练数据的容错性太差 针对具体的应用场景,学者们提出了多类改进的 KNN 方法20 21 1 2 2梯度下降算法常用 的 梯 度 下 降 方 法 有 批 量 梯 度 下 降(BGD)、随机梯度下降(SGD)、小批量梯度下降(MBGD)BGD(Batch Gradient Descent)算法是一个求解相对较为精确,但是计算迭代速度比较慢的方法 BGD 在更新每一参数时都使

13、用所有的样本来进行更新 因此,该方法的优点是可以获得全局最优解,且易于并行实现 SGD(Stochastic GradientDescent)算法针对 BGD 迭代速度慢的问题而提出,它是通过每个样本来迭代更新一次,大大减少了计算量,但该方法不能获得全局最优解,且不易于并行实现 MBGD(Mini-batch Gradient Descent)是前两种方法的折中,算法的训练过程比较快,而且也能保证最终参数训练的准确率22 23 2学生学习行为分析笔者采集了所在学校网络学习平台中的学生行为数据 该平台开设课程数 2 499 门,开课教师数 1 167 人,学生人数(含往届生)56 143 人 笔

14、者选取了该校 20192021 学年不同学院不同专业部分学生的学习行为数据作为研究对象,数据的详细描述如表 1 所示 首先,基于学生行为数据,结合数据分析方法和工程教育认证理念建立学习行为分析模型 其次,基于所构建的模型采用数据挖掘方法和机器学习方法对学生的学习行为数据进行挖掘分析和预测研究 最后,学生、教师和决策者可以根据分析结果进行持续改进,根据预警信息,教师可以及时调整教学方法,学生可以有针对性地调整学习方式方法表 1数据描述序号课程专业班级人数1Python 语言及应用 物联网工程17 物联 1 班612电子电路基础物联网工程20 物联网工程 1、2 班1213数据结构通信工程、电子信

15、息工程19 通信 1 班、19 电子 1 班1224C 语言电气工程及其自动化、应用统计学、数学与应用数学、机械电子工程、城乡规划20 电气一班、19 应统 1 班、19 数学 1 班、19 机械 2 班、19 城规 1 班3125计算机基础播音与主持艺术、汉语言文学、环境设计、商务英语、戏剧影视文学、行政管理、音乐表演19 音表 1 班、19 戏文 1 班、19 商英 1 班、19 环境 2 班、19 行管 1 班、19 汉本 1 班、19 播音 1 班3032 1分析模型网络学习平台中大量的数据为模型分析提供了数据基础,笔者选取与学习行为相关的数据进行研究分析,主要包括课程学习情况(次数、

16、视频观看时长、章节测验)、互动情况(交流、答疑)、作业完成情况、实验完成情况等 与其他分析模型不同的是,本模型不但研究分析学生的学习行为与获得的成绩之间的相关性,而且进一步研究分析学生学习行为与课程目标达成之间的关联性 笔者所构建的学生学习行为分析模型如图 1 所示,该模型包含学生、教师、决策者三个主体,每个主体都形成一个持续改进的闭环 首先,从网络学习平台中采集相关数据;其次,对数据进行预处理,主要是对重复数据、异常数据、空值数据等进行处理;再次,采用数据挖掘分析和机器学习方法对学生的学习行为数据进行分析;最后,针对模型给出的分析和预测结果,学生、教师、决策者进行持续改进 学生可以根据分析和

17、预测结果调整学习的重点,改变学习方法;教师可以根据分析结果调整教学策略,有针对性地实施个性化教学,对预警的学生给予重点关注;决策者可以根据分析结果从宏观层面上考虑平台教学资源配置和过程管理的合理性,以及培养方案的调整93第 2 期孙泽军,常新峰,王飞飞,等:“互联网+”背景下学生网络学习行为分析及预警图 1学习行为分析模型2 2学习行为聚类分析聚类方法可以把具有相似特征的数据归类到一起,聚类分析可以从宏观层面了解学生的学习行为,笔者采用 K-means 聚类算法,选择 Python 语言及应用课程的学生学习行为数据进行聚类分析 笔者把学生学习过程中的过程成绩和期末考试成绩进行聚类 聚类过程中把

18、类的数量分别设置为从 2到 8 变化,当分类的数量为 5 时,聚类效果最为理想,其聚类结果如图 2 所示,横坐标表示过程成绩,纵坐标表示期末考试成绩 通过该图可以观察到总共 5 个分类,60 分以下有一个分类,60 分到 70 分有一个分类,75 分到 85 分有一个分类,85 分到100 分有两个分类 这些聚类表明,大部分过程成绩较好的学生期末考试的成绩也较好,当然也有少数学生过程成绩很好,但期末考试成绩不理想,这些学生需要教师进一步关注和分析,平时过程成绩是否存在抄袭,或是考试复习不到位,或其他原因图 2过程成绩和期末考试成绩聚类过程成绩包括学生平时作业、章节测验、交流互动、讨论等 为了进

19、一步分析学生的过程成绩,笔者选取了过程成绩中占比最大的两项学习行为,即章节测验和作业进一步聚类研究 同样地,让聚类数量从 2 到 8 变化,当聚类数量设置为 5 时,可以获得较好的划分效果,结果如图 3 所示,横坐标表示章节测验成绩,纵坐标表示作业成绩 该图说明大部分学生过程成绩都较好,有 3 个学生平时作业和章节测验成绩不理想,需要教师进一步关注 也有个别学生作业完成得较好,但章节测验并不理想,需要学生注意自己的学习方法图 3章节测验和作业聚类2 3学习行为与课程目标达成度的相关性分析为进一步分析学习行为,笔者研究了 Python语言及应用课程的学习行为数据与课程目标达成度的相关性 工程教育

20、认证强调的是以产出为导向,重点培养学生解决复杂工程问题的能力,课程目标达成度反映了学生在该课程上目标的达成情况,也是工程教育认证重查指标之一 笔者选取了大量的学习行为进行分析,如课程实验、大作业、课程设计、互动、讨论、章节测验等,将这些学习行为和该课程的目标 1、2、3 的达成度一起进行相关性04平顶山学院学报2023 年分析 为了更直观地呈现这些学习行为和课程目标达成度的相关性,笔者采用热力图来进行可视化展现,如图 4 所示 图中纵坐标和横坐标都表示学习行为和该课程的 3 个课程目标,可以观察到课程设计和章节测验与课程目标 1 的相关性比较大,分别是 0 92 和 0 82 课程目标 1 主

21、要指的是学生能够运用 Python 解决实际工程问题的能力,综合设计主要是应用设计题型,考查学生解决实际问题的能力,所以他们有很高的相关性 另外,章节测验中也有大量的应用设计题,主要培养和锻炼学生运用Python 进行设计和开发的能力,所以章节测验和综合设计、课程目标 1 都有很高的相关性 作业与课程目标 2 的相关性为 0 86 作业主要包括一些自主学习题目,考查学生自我学习能力和学生之间的团结协作能力,这也正是课程目标 2 的培养目标,所以其相关性较大 课程目标 3 与实验的相关性比较大,其相关性值为0 85 课程目标 3 指的是针对实际工程问题学生能够正确地选择运用 Python 相关工

22、具进行实验,并对实验进行分析,得出正确的结论,这也正是课程实验所要达到的目的 学习行为中的交流互动和答疑讨论与课程目标的相关性较小,也与其他学习行为的相关性较小图 4学习行为与达成度的相关性分析2 4学习行为与综合成绩的相关性分析为了更广泛地深入分析,笔者选取了所在学校不同学院不同专业的几门课程(电子电路基础、数据结构、C 语言、计算机基础)进行研究分析 电子电路基础为信息工程学院物联网工程专业的专业课;数据结构为通信工程和电子信息工程专业的专业课;C 语言和计算机基础为公修课程,涉及多个学院和专业 接下来,笔者主要分析平均成绩、章节学习次数、视频学习时长、讨论次数等学习行为与综合成绩之间的相

23、关性 采用散点图来展现学习行为与综合成绩的相关性,并且利用第三方库 matplotlib 进行可视化处理图 5 显示了各学生学习过程中提交作业的平均成绩与期末综合成绩间的相关性,横坐标表示各学生多次作业的平均成绩,纵坐标表示课程的期末综合成绩 作业内容一般是一些练习,用于巩固课堂上老师讲解过的知识点,培养学生的实际动手能力,因此,各课程培养的侧重点会有所不同 通过观察可以发现各门课程的作业平均成绩与期末综合成绩有较强的相关性,作业平均成绩较高的最终的综合成绩都比较高 其中:电子电路基础课程的作业平均成绩与期末综合成绩相关性最强;数据结构课程存在小部分同学作业成绩比较好,但期末综合成绩并不理想的

24、情况,通过与任课教师和学生交流,发现这部分学生的作业存在抄袭情况,学生并没有掌握课程相关知识 与数据结构课程14第 2 期孙泽军,常新峰,王飞飞,等:“互联网+”背景下学生网络学习行为分析及预警相似,C 语言和计算机基础课程也有小部分学生存在这种情况 另外,有少数几个同学平时作业成绩较低,却取得了较高的期末综合成绩图 5平均成绩(作业)和综合成绩章节学习次数是学生平常在课程章节的学习过程中所产生的学习次数 图 6 显示了章节学习次数和期末综合成绩之间的相关性,横坐标表示各学生的学习次数,纵坐标表示课程的期末综合成绩可以观察到图中的每门课程学生的学习次数与期末综合成绩之间存在着相关性,特别是电子

25、电路基础和数据结构课程所呈现的相关性更强一些,可能是因为这两门专业课知识难度相对大一些,学生需要花更多的时间来学习和消化,所以学习次数越多,知识掌握越牢固,取得的期末综合成绩越高 进一步观察,可以发现并不是学生学习次数越多,所取得的期末综合成绩就一定优秀 如图 6(d)所示计算机基础课程,有一部分学生的学习次数在 500到 800 之间,但取得的成绩在 65 到 78 之间,充分说明,在学习课本知识的同时应该多实践,多加练习才能掌握所学知识 另外,图中几门课也存在一些学生学习次数很少,但期末却取得了较好的成绩,尤其是 C 语言和计算机基础这两门课程,学生学习次数在 30 到 200 之间,取得

26、的成绩在 20 到100 之间,其中大部分学生取得的成绩在 80 到 100之间 可能是因为这两门课都是公修课,讲授的知识点比较简单,部分同学在高中时已经学习过相关知识,所以虽然学习次数不多,但已掌握相关知识点,取得的期末综合成绩也较高课程的视频学习也是一个重要的学习行为 由于学生网上课程视频学习的完成度基本上都是100%,这无法体现课程视频学习与期末综合成绩之间的相关性 因此,笔者选取学生视频观看时长进行分析,其相关性分析结果如图 7 所示,纵坐标表示综合成绩,横坐标表示学生观看视频的时长可以观察到视频学习时长与期末综合成绩之间有一定的相关性,学习时长较大的学生所取得的期末综合成绩普遍不错,

27、也存在一些学生观看课程视频时间并不长,但取得了不错的成绩,这在 C语言和计算机基础两门课程上表现比较明显,原因可能与图 6 相似,公修课知识较简单,学生已掌握,不需要过多地观看视频 反观电子电路基础和数据结构两门专业课,有一些学生观看课程视频时间较长,取得成绩并不理想 特别是电子电路基础课程,部分学生观看时长在3 000 到4 000 min 之间,但取得的成绩在 55 到 65 之间,24平顶山学院学报2023 年这说明电子电路基础课程知识点难度相对较大,学生取得的成绩普遍不高,这需要任课教师针对这些分析数据,对教学内容、方法、方式做出相应的修改和调整,以便于提升学生的学习成绩图 6章节学习

28、次数和综合成绩图 7视频观看时长和综合成绩讨论主要是指教师或学生在平台所发起的一些主题或实践问题,引起大家交流、提问和讨论,讨34第 2 期孙泽军,常新峰,王飞飞,等:“互联网+”背景下学生网络学习行为分析及预警论反映了学生对课程学习的兴趣和积极性,也是一项重要的学习行为 图 8 展示了 4 门课学生的讨论次数和期末综合成绩之间的相关性,纵坐标表示综合成绩,横坐标表示学生参与课程的讨论次数 可以观察到电子电路基础这门课程的讨论次数相对较少,学生讨论的积极性并不高,学生最高的讨论次数只有 6 次 数据结构课程的讨论次数相对较多一些,这可能与这门课程是考研专业课有关,一部分学生比较积极,讨论次数较

29、多,但大部分讨论次数都是零 C 语言和计算机基础课程的两门课程学生的讨论次数多一些,可能是因为这两门课程相对简单,也常用到,大家讨论更加积极 从整体上看,这 4 门课反映出学生的讨论次数和期末综合成绩之间的相关性很低图 8讨论次数与综合成绩总的来说,通过以上分析可以发现电子电路基础和数据结构课程知识点难度相对较大,学生取得的成绩普遍不高 特别是电子电路基础课程,大部分学生所取得的期末综合成绩在 50 到 60 之间,这需要任课教师针对这些分析数据,对教学内容、方法、方式持续改进,并做出相应的修改和调整,以便于提升学生的学习成绩 学习行为中,作业完成情况、章节学习次数、视频观看时长与学生期末综合

30、成绩相关性较大,学生参与讨论次数与期末综合成绩相关性并不大,但讨论次数可以反映出学生对课程的关注度和学习兴趣 另外,学生行为数据反映存在一些异常点,如有的学生平常作业完成很好,但期末综合成绩并不理想,需要任课教师针对这些学生进一步分析,在教学和策略上进行持续改进3预警分析前面采用聚类分析和相关性分析方法,从学生的作业、章节测验、观看视频时长、讨论、综合设计等多个维度,结合课程目标达成度和综合成绩对学生的学习行为进行了分析 本节结合学生的学习行为对学生成绩进行预警分析3 1成绩等级预测笔者结合学生的学习行为数据,采用 K-近邻算法对学生的成绩进行预测 由于成绩是连续样本,所以先对成绩进行离散处理

31、,分成 A、B、C、D、E五个等级,分别对应优、良、中、及格、不及格 这里选用与期末综合成绩相关的行为 “作业、章节测验、观看视频时长、讨论”进行成绩预测 首先进行数据的预处理,将学习行为数据进行数据归一44平顶山学院学报2023 年化;然后选择 80%的行为数据作为训练集数据,20%的行为数据作为测试集数据,K-近邻算法的K 值设为 5 表 2 显示了成绩等级预测结果,由于空间有限,这里只呈现了前 20 条样本数据的预测结果表 2成绩等级预测(前 20 条样本)序号 讨论次数 作业成绩 学习次数视频观看成绩等级预测结果10052 288 0749 750 0298 373 0095 146A

32、A200708 250 0144 665 0148 281AB30091 503 0791 500 0236 890 0186 836AA40137 255 0875 000 0306 510 0103 501AA500791 750 0394 213 0003 929AA60150 327 0875 000 0331 826 0193 605AA700541 500 0323 689 0186 907AA800875 000 0117 541 0068 235BB900633 250 0094 033 0175 877AB1000699 750 0255 877 0141 393AA1100

33、791 500 0331 826 0161 345AA120052 288 0875 000 0305 606 0173 582AA130006 536 0875 000 0117 541 0170 765AB140019 608 0875 000 0122 966 0046 247AB150084 967 0708 250 0135 624 0066 034BA1600225 000 0074 141 0142 363CC1700666 500 0205 244 0189 913AB180065 359 0749 750 0230 561 0183 877AA1900875 000 0196

34、 203 0154 198AA200006 536 0825 000 0179 928 0099 690AA3 2成绩预警学生课程考核成绩不合格,意味着重修,将耗费大量的时间和精力 因此,针对学生的学习行为提前对期末考核成绩进行预测,给学生和教师提供预警信息,有重要的意义 笔者仍以作业、章节测验、观看视频时长、讨论行为数据为基础,采用批量梯度下降算法(BGD)对学生的期末成绩进行预测 由于重点关注考核成绩是否合格,故将成绩预测分为及格和不及格两类 同时,采用合成少数过采样技术对数据进行过采样处理 采用 BGD 方法的预测准确率为 0 86,另外笔者还采用了逻辑回归模型对成绩不及格学生进行预测,

35、预测准确率达到了 0 95,逻辑回归模型预测效果如图 9 所示 该图显示了模型预测的 AUC 指标,AUC=1 表示完美预测,Logistic eg 1 表示模型采用默认参数预测的效果,Logistic eg 2 表示模型采用最优参数预测的效果,其预测结果都比较理想图 9成绩不及格预测 OC 曲线4结论笔者基于所在学校的网络教学平台,选取不同年级、不同专业、不同课程的学生学习行为数据,采用数据挖掘方法和机器学习方法进行研究,并根据预测结果给出学生的成绩预警信息 笔者以工程教育认证理念为指导,构建了基于“以学生为中心,能力为导向,持续改进”的学习行为分析及预警的模型 选取了课程设计、章节学习次数

36、、视频观看时长、作业成绩、讨论次数等重要学习行为,结合课程目标达成度和期末考核成绩进行了相关性研究 首先,采用经典聚类算法 K-means 分析了 Python 语言及应用课程过程成绩和期末考试成绩间的关系,并针对异常点给出了分析和建议;其次,采用相关系数方法,通过热力图可视化了学习行为与课程目标达成度之间的相关性,以及各学习行为之间的相关性;再次,对电子电路基础、数据结构、C 语言、计算机基础等四门课程的学生学习行为数据与期末综合成绩之间的相关性进行了分析;最后,根据学生的学习行为数据,采用经典的 K-近邻算法对学生的期末成绩进行预测,更进一步,利用批量梯度下降算法对不及格成绩进行预测,给学

37、生和教师提供预警 利用数据挖掘和机器学习技术对学习行为进行研究分析及预测,有利于发现潜在的学习规律、改进学习方法、提高学习效率,同时也有利于教师了解学生的学习状态,改进教学方法 这对提高学生学习效率,便于教师教学持续改进和决策者教学管理都具有重要的意义和深远的影响本文的研究方法还存在一些局限和不足 笔者只对线上的学习行为进行了研究和分析,并没有考虑学生在线下的学习行为 另外,选择的学习行为数据并不全面,有些数据教师并没有上传到网络学54第 2 期孙泽军,常新峰,王飞飞,等:“互联网+”背景下学生网络学习行为分析及预警习平台,如课程设计、实验和课堂情况等 将来的工作将采集更多的学习行为数据,同时

38、将线下数据和线上数据相结合进行分析,进一步提高分析和预测的准确率参考文献:1 沈宏兴 教育信息化 2 0 时代高校教育技术工作创新与实践 J 实验室研究与探索,2019(6):128 132 2 赵丽,贺玮,王洋 人工智能支持的课堂教学行为分析:困境与路径 J 电化教育研究,2022(1):86 92 3 朱冰洁,史同娜,施镇江,等“金字塔”式网络学习平台构建与学习行为分析J 实验技术与管理,2021(8):208 212 4 廖雅琪,杨杉,孙宇辰 基于 SPSS 的线上学习行为分析研究 J 现代制造,2021(7):21 24 5 彭涛,单志龙 基于双路聚类的在线学习行为分析研究 J 华南师

39、范大学学报(自然科学版),2021(6):122 128 6 SUN Z,XIE K How do students prepare in the pre-classsetting of a flipped undergraduate math course?:a latentprofile analysis of learning behavior and the impact ofachievement goals J The Internet and Higher Education,2020,46:100731 7 冯天敏,张如静 国内网络学习行为五年综述 J 新媒体研究,2019(7

40、):75 79 8 姬强,孙艳丰,胡永利,等 深度聚类算法研究综述 J 北京工业大学学报,2021(8):912 924 9 白璐,赵鑫,孔钰婷,等 谱聚类算法研究综述 J 计算机工程与应用,2021(14):15 26 10 王建仁,马鑫,段刚龙 改进的 K-means 聚类 k 值选择算法 J 计算机工程与应用,2019(8):27 33 11 王志飞,陆亿红 凝聚中心犹豫度恒定的模糊层次聚类算法 J 小型微型计算机系统,2021(1):20 26 12 周维柏,黄德波,李蓉 一种改进的模糊层次聚类算法 J 北京联合大学学报,2021(1):29 34 13ESTE M,KIEGEL H,

41、SANDE J,et al A density-based algorithm for discovering clusters in large spatial da-tabases with noise C New York:the 2nd InternationalConference on Knowledge Discovery and Data Mining,1996:56 69 14 邓定胜 一种改进的 DBSCAN 算法在 Spark 平台上的应用 J 计算机科学,2020(S2):425 429,443 15 郭艳婕 改进的 DBSCAN 算法及其应用研究D 太原:中北大学,2

42、020 16 胡钦太,伍文燕,冯广,等 深度学习支持下多模态学习行 为 可 解 释 性 分 析 研 究J 电 化 教 育 研 究,2021(11):77 83 17 柯森繁,陈渴鑫,罗佳,等 鲢顶流游泳速度与摆尾行为相关性分析 J 水产学报,2017(3):401 406 18 生俊青 在校大学生在线学习行为与效果相关性分析 J 产业与科技论坛,2021(9):97 99 19 MA Y C,XIE Q,LIU Y J,et al A weighted KNN-basedautomatic image annotation methodJ Neural Computingand Applica

43、tions,2020,32(11):6559 6570 20 CHAUDHAI P,AGAWAL H,BHATEJA V Data aug-mentation for cancer classification in oncogenomics:an im-proved KNN based approachJ Evolutionary Intelli-gence,2021,14(2):489 498 21LI N,KONG H P,MA Y F,et al Human performancemodeling for manufacturing based on an improved KNN al-gorithm J The International Journal of Advanced Manu-facturing Technology,2016,84(1):473 483 22 李兴怡,岳洋 梯度下降算法研究综述 J 软件工程,2020(2):1 4 23 史加荣,王丹,尚凡华,等 随机梯度下降算法研究进展 J 自动化学报,2021(9):2103 2119(责任编辑:王彦江)64平顶山学院学报2023 年

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服