收藏 分销(赏)

基于招生数据利用不同的机器学习方法预测大一学生成绩.pdf

上传人:自信****多点 文档编号:2357444 上传时间:2024-05-28 格式:PDF 页数:8 大小:1.42MB
下载 相关 举报
基于招生数据利用不同的机器学习方法预测大一学生成绩.pdf_第1页
第1页 / 共8页
基于招生数据利用不同的机器学习方法预测大一学生成绩.pdf_第2页
第2页 / 共8页
基于招生数据利用不同的机器学习方法预测大一学生成绩.pdf_第3页
第3页 / 共8页
基于招生数据利用不同的机器学习方法预测大一学生成绩.pdf_第4页
第4页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、现代计算机Modern Computer第 29 卷 第 14 期2023 年 7 月 25 日基于招生数据利用不同的机器学习方法预测大一学生成绩王琛*(温州肯恩大学信息技术中心,温州 325060)摘要:利用机器学习方法从招生数据中挖掘影响高校学生大一GPA的因素并构建预测模型。首先,进行了数据清洗、筛选了招生相关数据和大一GPA成绩。随后,将学生的招生信息作为特征,训练了三种机器学习模型,分别为线性回归模型、逻辑回归模型和神经网络模型。最后,对三个模型的性能进行了评估,并对神经网络模型进行了优化。研究的成果可以为高校大一GPA预测建模提供借鉴,并有助于推进学业预警、学业成绩预测和评价的实践

2、。研究结果表明,机器学习方法可以有效地挖掘影响高校学生大一GPA的因素并构建预测模型。通过训练和比较不同的机器学习模型,研究提供了一个可行的预测模型,并对神经网络模型进行了优化,提高了其预测精度。这些成果可以为高校学业预警、学业成绩预测和评价提供有用的参考信息,对于提高学生学习效果和改善教学质量具有积极的作用。关键词:机器学习;预测建模;学业成绩;神经网络;招生数据文章编号:10071423(2023)14003708DOI:10.3969/j.issn.10071423.2023.14.008收稿日期:20230329修稿日期:20230407作者简介:*通信作者:王琛(1988),男,浙江

3、温州人,硕士研究生,高级工程师,研究方向为教育信息化、人工智能、数字化改革、数字文化,Email:0引言随着高校信息化系统的不断完善,学生数据的信息量呈现出急剧增长的趋势。通过对数据进行适当的分析,可以获得有效的评估,从而预测学生的表现。近年来,机器学习技术在预测学生表现方面取得了显著进展13。与教育数据挖掘不同,机器学习技术可以结合任何学生属性对不同的学生群体进行有效的预测。本研究旨在借助不同的机器学习技术发现招生数据中的潜在规律或模式,继而为教学预警提供服务制定。通过招生数据进行建模,可以预测新生大一成绩,从而帮助高校教学管理者制定预警措施,如对学生进行预警警告或者尽早引导他们改进学习,以

4、便学生在后续的学习中提高成绩和学术水平,这将是教学预警研究中的一个新亮点。目前,对于招生数据和学业预测的相关研究多局限于对招生数据进行多维数据统计分析45。本研究将应用不同的机器学习模型对高校大一学生的平均学分绩点(grade point average,GPA)成绩进行预测,通过采集高校实际的招生数据和学业GPA成绩数据进行数据分析和模型预测,从而研究不同机器学习模型在大一学生GPA成绩预测方面的准确度。除了基本的招生数据处理和权重分析外,本研究还将添加大一各阶段性累计平均GPA,从而设计出一个具有预警功能的高校新生学业成绩评估模型,帮助教师及教学管理者为刚进入校门的学生提供初期成绩评估的预

5、警信息和教学帮助参考,有利于高校对学生早期生涯的学业预警进行干预。1研究内容与方法1 1.1 1研究内容研究内容本研究通过分析现有的招生基础数据和大一GPA成绩数据之间的关联,通过机器学习模型发现其中的规律,为高校学业成绩初期预警提供参考。为了达成这个目标,我们设计和采用了不同的机器学习模型。通过对这些模型进实践与经验 37现代计算机2023年行训练和对比其在测试集(test set)上的预测结果,我们研究和分析了线性回归模型(linearregression)、多元逻辑回归模型(logistic regression)和神经网络(neural network)在大一GPA成绩预测准确率方面的

6、表现。之后,我们还对进行了主成分分析(PCA),期望能够从高校招生历史数据中挖掘重要的信息,消除招生新生历史数据之间的重叠数据和噪声数据。最后,将PCA和精度较高的预测模型相结合,首先采用PCA降低数据维度,提取对预测结果影响较大的主成分因子,然后使用预测准确率较高的模型对招生基础数据进行预测。图1为预测模型的流程。高校历史招生数据建模和预测输出预测结果线性回归神经网络逻辑回归三个模型的分析比较选择模型多维数据PCA主成分提取图 1预测模型流程1 1.2 2研究方法研究方法本研究采用了模型研究和数据分析相结合的方法。在模型研究方面,使用PyTorch框架构建线性回归模型、多元逻辑回归模型和神经

7、网络模型,并对它们进行训练。PyTorch是一个基于Torch的Python开源机器学习库,可用于自然语言处理等应用程序,支持动态神经网络,具有强大的灵活性和扩展性。在数据采集和分析方面,我们将收集高校的招生基础数据和学生大一的GPA成绩(四分制)数据,对其进行学习和训练。此外,我们还对数据进行处理,以便发现数据中的主要特征,消除噪声和冗余信息。在选择机器学习模型方面,我们考虑了所采用的每个模型的优点和局限性,并根据实际情况进行了设计。在PCA步骤中,我们选择了最小化信息损失和最大化方差的方案,以确保提取到的主成分因子尽可能的准确和重要。在最后的优化步骤中,选择了最适合的模型来对GPA成绩数据

8、进行预测。1 1.2 2.1 1数据和数据预处理数据和数据预处理本研究采集的数据来自某大学 2016 年至2019年的招生基础数据和对应学生的GPA成绩(四分制)数据。使用的模型之一神经网络模型是一种基于大数据分析的人工智能模型,当数据量较大时,其预测精度较高。然而,当样本数据量较小时,模型容易陷入局部最优,出现过拟合现象,而降低预测精度。因此,在数据收集阶段,本研究将尽可能扩大数据样本的维度,收集新生的各种信息属性,以减少误差并提高准确率。本研究还将采用数据重构方法,获取高校新生多维基础历史数据和学生成绩历史数据。采用数据重构的原因是,高校招生受到当年国家政策、社会需求、社会经济状态等因素的

9、影响,导致招生数据变化存在非线性和复杂性。此外,不同省份给出的招生数据内容、格式和代码各不相同,成绩构成也各不相同,例如浙江省新高考改革后不分文理科。表 1展示了某省实际招生数据的变化。可以看出,该数据有着该省份特有的解析规则和信息,并且不同字段样本间存在数量级的差异。在数据采集之后,本研究进行了数据清洗、数据集成、数据变换等数据预处理步骤。比如,对于采集到的招生数据中的缺失值本研究采用了插值法,通过计算平均值将其填充到缺失值的位置上。同时,由于招生数据中存在大量的类别值或离散值,为了提高模型的准确性,以及为了让模型的距离计算更合理,本研究使用Pandas中的get_dummies()函数对所

10、有离散型特征进行了OneHot编码。经过处理后,得到的招生数据集为一个5615行、50列的矩阵,如表2所示。显然,上述数据具有高维度和高噪声等特性,并且不同省份或样本之间存在数量级的差异。当各招生数据指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在模型分析中的作用,相对削弱数值水平低的指标的作用。因此,在分析数据之前,我们还对数据集进行了标准化和归一化处理。通过归一化将招生数据按比例缩放至一 38王琛:基于招生数据利用不同的机器学习方法预测大一学生成绩第14期个小的特定区间,能有效降低数据集噪音,便于不同单位或数量级的指标能够进行比较和加权,这样便于后续数据处理和

11、加快模型收敛6。本研究采用了MinMax Scaling、ZScore Normalization 和 L2 Normalization 三种归一化算法进行尝试,基于训练样本上的总损失值比较结果,最终选择了 MinMax Scaling 作为归一化算法。具体算法公式如下:xi-min(xi)max(xi)-min(xi)(1)最后,将数据集划分为训练集(train_Set)、评估集(valid_set)和测试集(test_set),并进行了交叉验证(cross validation)。数据集的部分参数值详见表3。1 1.2 2.2 2基于数据统计的相关性分析基于数据统计的相关性分析本研究首先对

12、学生高考成绩和大一GPA成绩进行了皮尔逊相关系数的计算。皮尔逊(pearson)积矩相关系数是传统数据统计里常用的一种方法7,用于度量2个变量间相关程度,它是一个介于1和-1之间的值。其中:1表示变量完全正相关,0表示无关,-1表示完全负相关,计算结果见表4。表 1某省实际招生数据性别代码11111科类代码ZZZZZ毕业类别0000000000录取代号1111111111高考成绩582582586585579特长?112?高考裸分成绩582582586585579专业代码012007006006005录取身份1010101010外语代码11111外语分数8997102103106批次11111

13、表 2预处理后的招生数据集矩阵序号0123568056815614出生年份1999199819991999199819991998出生月份99384910考生类型0020000获奖情况0001101英语分数106114112110129130115高考分数473483485446505486467一段分数511511511511456456456一段分差-38-28-26-65493011录取均分458.78458.78458.78458.78477.46477.46477.46表 3归一化处理之后的训练集片段0.3295760.2845040.3418530.3139320.2911790.

14、2739330.2758830.0710340.0978490.2117670.0000000.0000000.0000000.3587790.0000000.0000000.0000000.0000000.0000000.3327760.0000000.0000000.0000000.0000000.3327760.0863170.1501550.0895330.1270680.1039930.1095730.1293200.1314140.0619710.0680680.1712080.1724270.1775860.1630810.151262 39现代计算机2023年表 4不同特征与大

15、一成绩间的相关系数特征高考外语高考数学高考语文高考总成绩Pearson相关系数0.1978460.2393720.2077560.339547Spearman相关系数0.2171810.2552860.2239720.293627Kendall相关系数0.1695180.1711520.1660890.189425从表 4可以看出,高考总成绩和学生大一GPA成绩之间的相关系数值略高于0.3,表明二者具有一定程度的相关性,但不显著。而单门课程的高考成绩和大一GPA成绩的相关系数值都小于0.3,可以认为相关性不高。此外,从图2也可以明显看出高考成绩对学生大一GPA的影响没有呈线性递增。分析原因我们

16、认为高校的教育以专业课程为主,更加细分化的专业知识减少高考成绩对学生大学学习的实际影响程度。因此,可以得出结论,虽然高考成绩与大一GPA成绩之间具有一定程度的相关性,但影响并不明显。此外,基于传统统计的相关性分析方法对于没有明显统计学规律的多元复杂数据的效果并不理想。GPA成绩(0,4)归一化后高考成绩(0,1)43210.00.20.40.60.81.0图 2高考成绩和大一GPA关系分布1 1.2 2.3 3多元线性回归模型分析多元线性回归模型分析线性回归是一种广泛应用的回归模型,其基于以下假设:自变量X和因变量y之间的关系是线性的,即 y 可以表示为 X 中元素的加权和8。我们假设招生数据

17、和大一GPA之间存在线性关系,可以表示为特征(如英语成绩、总成绩、年龄等)的加权和。当使用线性代数来建模时,我们输入包含 d 个特征(在本研究中为 50个)的高维招生数据集,将预测结果y表示为y=w1x1+wdxd+b(2)其中:每个xi代表数据集中的一个特征;wi代表该特征的权重;b表示偏差项。在给定招生训练数据特征X和对应的GPA成绩y,线性回归模型的目标是找到一组最优的权重向量W和偏差项b,这组权重向量和偏差能够使得新样本预测标签的误差尽可能小。为了寻找最好的模型参数W和b,我们需要定义损失函数和使用随机梯度下降方法来学习和训练模型参数。损失函数用来量化目标值和预测值之间的差距,在训练模

18、型时我们的目标是找到一组参数(w*,b*),通过计算训练集样本在损失函数L(w,b)上的损失均值,最小化在所有训练样本上的总损失:w*,b*=argmin L(w,b)(3)本研究使用PyTorch的MSELoss类来计算均方误差损失函数,也称为平方L2范数。梯度下降方法几乎可以优化所有机器学习模型。它通过在损失函数递减的方向上不断更新参数来降低误差。我们使用以下公式来表示这一更新迭代的过程(其中表示偏导数):w w-|i wl()i(w,b)=w-|i x()i()wTx()i+b-y()i(4)经过多次迭代后,我们就能通过有限的数据来训练模型参数(w*,b*)。为了更好地评估训练效果,本研

19、究会计算每次迭代周期后的损失,并使用更新后的参数计算评估集的准确率,以监控训练过程。记录的结果见表5。表 5线性回归模型每个迭代周期后的损失和评估集准确率迭代次数epoch 1epoch 2epoch 3epoch 4epoch 5epoch 6epoch 7epoch 8epoch 9epoch 10损失均值(loss)0.8915520.4619950.2613670.2545320.2527910.2450010.2148000.2269670.2282530.226371准确率(acc)0.2389970.5743870.6055960.6081160.6115020.6137540.

20、6311890.6175420.6188330.617951 40王琛:基于招生数据利用不同的机器学习方法预测大一学生成绩第14期通过这个已经训练好的线性回归模型,我们就可以使用招生数据测试集来预测未包含在训练数据和评估集中的学生大一GPA,并查看模型的准确度。1 1.2 2.4 4多元逻辑回归模型分析多元逻辑回归模型分析多元逻辑回归本质上是多元线性回归,只是在特征到结果的映射中加入了一层函数映射9-11。该映射函数为 Logistic 函数(也称为Sigmoid函数),其形式如下:s(z)=11+e-z(5)首先进行特征线性求和:Tx=0+i=1nixi(6)然后使用函数s(z)构造预测函数

21、来进行预测,逻辑回归的最终表达式如下:P()x=s()Tx=11+e-Tx(7)虽然逻辑回归是非常经典的分类算法模型,但主要用于解决二分类问题,因此需要对GPA数据进行预处理。在本次研究中,将学生大一GPA 大于等于 3.2 的样本作为一个类别,小于3.2的样本作为另一个类别,通过训练模型得到属于每个类别的概率。本研究使用 PyTorch 的BCELoss 类作为逻辑回归模型的损失函数。每次迭代周期后的损失以及使用更新后的参数计算的在评估集的准确率见表6。表 6逻辑回归模型每个迭代周期后的损失和评估集准确率迭代次数epoch 1epoch 2epoch 3epoch 4epoch 5epoch

22、 6epoch 7epoch 8epoch 9epoch 10损失均值(loss)4.661812353152.875094413754.381951849677.718326173823.054476178651.582172725835.035314269505.234221039034.350697984231.72436655642准确率(acc)0.810.830.820.780.830.840.810.810.820.84可以发现该模型在评估集上准确率很高,主要原因是该模型只将预测结果分为了两类。然而,这种分类方式颗粒度并不够精细,可能会导致欠拟合和精度不高的问题。1 1.2 2.

23、5 5神经网络模型分析神经网络模型分析前面两个模型都是基于单调性假设的线性回归模型,即任何特征值的增大或减小都会导致模型预测输出的增大或减小(对应权重为正或负)。例如,当我们试图预测学生大一GPA时,我们假设在其他条件不变的情况下,高考成绩高的学生可能比成绩较低的学生获得更高的GPA12。然而,即使高考成绩与大一GPA成绩之间存在单调性,它们之间的关系也不一定是线性的。高考成绩值在高分值段多5分的人可能比在低分值段多25分的人能获得更高很多的GPA。为了处理这类非线性问题,我们采用了神经网络模型。神经网络模型是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。该模型通过调整内

24、部大量节点之间相互连接的关系来实现信息处理,是目前应用最广泛的机器学习模型1315。如图3所示,通过在网络中加入一个或多个隐藏层,可以克服线性模型的限制,使其能够处理更普遍的函数关系类型。x1x2x3x4y1y2y3h1h2h3h4h5输入层输入层隐藏层隐藏层输出层输出层图 3一个单隐藏层的简单神经网络本研究设计的神经网络模型为单隐藏层神经网络,该网络包含20个隐藏单元的单一隐藏层,使用CrossEntropyLoss交叉熵损失作为损失函数,并采用ReLU作为激活函数。ReLU提供了一种非常简单的非线性变换。对于给定的元 41现代计算机2023年素 x,ReLU 函数被定义为该元素 x 与 0

25、 的最大值:ReLU(x)=max(x,0)(8)在本次研究中,我们采用传统的分段绩点法,将学生大一GPA成绩按照分数区间划分为11个等级类别,分别为A=4.0、A-=3.7、B+=3.3、B=3.0、B-=2.7、C+=2.3、C=2.0、C-=1.7、D+=1.3、D=1.0和F=0,因此设计的输出层包含11个输出单元。通过训练模型不断迭代来优化神经网络的权重和偏差参数,使神经网络可以学习到输入数据和输出之间的映射关系,从而能够准确地预测大一学生的 GPA 等级是多少。模型每次迭代周期后的损失和评估集的准确率如表7所示。表 7神经网络模型每个迭代周期后的损失和评估集准确率迭代次数epoch

26、 1epoch 2epoch 3epoch 4epoch 5epoch 6epoch 7epoch 8epoch 9epoch 10损失均值(loss)1.8425030.6118960.5723170.5571630.4771760.4298630.4182200.4041260.3956120.375495准确率(acc)0.6050.6740.7130.7110.7020.7940.7750.7920.7830.7832实验结果与优化2 2.1 1实验结果与分析实验结果与分析我们将训练好的三个模型在测试集上运行。三个不同的机器学习模型对测试集招生数据进行预测,结果显示多元线性回归模型构建

27、的预测模型的准确率最低,为 0.6019;其次是神经网络模型,准确率为 0.7227;逻辑回归的准确率值最高,为0.8035。表8列出了不同算法的预测分类结果。表 8不同模型方案在测试集上的准确率模型准确率多元线性回归模型0.6019逻辑回归模型0.8035神经网络模型0.7227可以看出,其中两种机器学习算法的准确率均在70%以上,预测效果良好。为了获得更好的分类效果和更高的精准度,本研究尝试利用主成分分析(PCA)对招生数据进行预处理,提取其主成分后,在三个不同的模型上运行。最终测试集的准确率见表9。结果表明,对招生数据进行 PCA 主成分提取处理,对模型的精准率提高并不显著,而在某些情况

28、下,可能会导致一定程度的信息丢失。表 9PCA主成分提取后模型方案在测试集的准确率模型准确率多元线性回归模型0.6594逻辑回归模型0.8145神经网络模型0.73822 2.2 2模型模型优化优化本次优化我们增加了学生大一不同阶段的累计GPA,包括大一上期中GPA、大一上期末GPA、大一下期中GPA数据。这样的优化考虑到了GPA的时序性,更能反映学生在大一不同时期的学习表现。这一优化有助于提高模型的预测精度,进而更准确地预测学生的大一期末GPA成绩。考虑到本研究在采用逻辑回归模型时分类颗粒度大,虽然准确度更高但在分类效果上存在一定的不足。相比之下,神经网络模型更适用于该任务。因此,本研究选择

29、使用神经网络模型进行优化调整,以提高预测精度。优化后的模型如图4所示。x1x2GPA2GPA3yAyFh1h2h19h20图 4增加了不同阶段累计GPA的模型使用训练集反复训练神经网络并进行权重和偏置的调整后,我们得到了一组优化后的神经网络模型。在测试集上的测试结果表明,这组优化后的模型预测准确率显著提高,其表现 42王琛:基于招生数据利用不同的机器学习方法预测大一学生成绩第14期见表10。表 10优化后模型方案在测试集的准确率模型准确率未优化的神经网络模型0.7382优化后的神经网络模型0.84743结语本研究的主要目的是通过分析招生数据的影响特征来预测学生的大一GPA,研究结果表明传统的统

30、计模型在满足预测需求方面存在不足,因此本研究使用了多元线性回归模型、多元逻辑回归模型和神经网络模型构建预测模型,并通过比较它们的准确率来评估它们的性能。结果显示,逻辑回归模型表现最佳,神经网络模型也比传统多元线性回归方法具有更好的预测性能,尤其适用于分类预测。考虑到本研究在采用逻辑回归模型时分类颗粒度大,因此优化神经网络模型对大一GPA进行预测更具有应用前景和参考价值。然而,本研究存在一些局限性。首先,所使用的数据量相对较少,因此在今后的研究中将进一步增加招生数据的训练集数据量以提高模型的拟合能力,使实验结果更具有普适性。其次,在选取的输出结果变量中,大一成绩分类颗粒度不够细。并且,神经网络模

31、型也只使用了单层模型。虽然单隐层网络能够学习任何函数,但如果使用更深的网络可以更容易地逼近预测结果并获得更高的精准度。最后,本研究使用的招生数据集存在一定程度的样本缺失,虽使用了均值填补法对缺失值进行了填补,但仍可能对模型的准确性产生一定程度的影响。未来的研究可以进一步扩大训练集数据量、增加招生数据变量并构建更细粒度的模型、采用更深层的神经网络模型等来改善模型性能。本研究有助于高校在入学阶段就预测学生未来的学业成绩,并提早规划出有针对性的学业辅助,从而提高学生整体成绩。本研究初步证明了机器学习模型通过招生数据对大一成绩的预测具有较好的准确性。未来可在此基础上进一步改良和优化机器学习模型,同时发

32、掘更多与成绩有相关性的学生信息,随着学生信息大数据规模的不断扩展和增长,这项研究的应用潜力将得到进一步评估和优化。参考文献:1 吕品,于文兵,汪鑫,等.基于机器学习的学生成绩预测及教学启示 J.计算机技术与发展,2019,29(4):200203.2 徐铭希.机器学习在学生成绩预测中的应用 J.电子制作,2019(2):4244.3 SUHAIMI N M,ABDULRAHMAN S,MUTALIBS,et al.Review on predicting studentsgraduationtime using machine learning algorithmsJInternational

33、 Journal of Modern Education and ComputerScience,2019,11(7):113.4 杨曼,高飞,朱倩,等.高考成绩与大学成绩相关性分析 J.云南民族大学学报(自然科学版),2022,31(3):360365.5 丁澍,缪柏其,叶大鹏.高考成绩与大学成绩的相关性分析 J.中国大学教学,2008(11):2931.6 班文静,姜强,赵蔚.基于多算法融合的在线学习成绩精准预测研究 J.现代远距离教育,2022(3):3745.7 刘辉,邵福波,宫响.经典相关系数及统计功效对比研究 J.青岛科技大学学报(自然科学版),2022,43(1):111119.

34、8 冯玉婷,黄雨欣,郭玉堂,等.基于多元线性回归模型的网络安全漏洞预测研究 J.长春师范大学学报,2021,40(12):1623.9 喻佳,白舒伊,吴丹新.基于机器学习的在线教学学生成绩预测研究 J.电脑编程技巧与维护,2021(8):118119,154.10 张俭鸽,李颖颖.基于多元线性回归预测模型的sensor 态势研究 J.计算机技术与发展,2011,21(9):229232.11 MOUSTRIS K P,NASTOS P T,LARISSI I K,etal.Application of multiple linear regression modelsand artificia

35、l neural networks on the surface ozoneforecast in the greater athens area,greeceJ.Advances in Meteorology,2012,2012:978988.12 汪朝杰,谭常春,汪慧.大学生在校成绩与高考成绩的统计分析 J.大学数学,2013,29(4):7986.13 袁利平,陈川南.人工智能视域下的宽度学习及在教育中的应用 J.远程教育杂志,2018,36(4):4956.14 STANKOVIC N L,BLAGOJEVIC M D,PAPIC MZ,et al.Artificial neural

36、network model for prediction of studentssuccess in learning programming J.J.Sci.Ind.Res.,2021,80.15 ZACHARIS N Z.Predicting student academic performance in blended learning using artificial neuralnetworksJ.Int.J.Artif.Intell.Appl.,2016,(5):1729.43现代计算机2023年Predicting freshman year college grades usi

37、ng different machine learningmethods based on admission dataWang Chen*(Information Services Office,WenzhouKean University,Wenzhou 325060,China)Abstract:Using machine learning methods to mine factors influencing college students first-year GPA from enrollment dataand construct prediction models.First

38、ly,data cleaning was performed and relevant enrollment data and first-year GPA scores werefiltered.Subsequently,students enrollment information was used as features to train three different machine learning models:linear regression,logistic regression,and neural network models.Finally,the performanc

39、e of the three models was evaluated,and theneural network model was optimized.The results of this study can provide a reference for modeling firstyear GPA predictions incolleges and universities,and help promote the practice of academic early warning,academic performance prediction,and evaluation.Th

40、e study shows that machine learning methods can effectively mine factors influencing college students first-year GPA andconstruct prediction models.By training and comparing different machine learning models,the study provides a feasible predictionmodel and optimizes the neural network model,improvi

41、ng its prediction accuracy.These results can provide useful reference information for academic early warning,academic performance prediction,and evaluation in colleges and universities,and have a positive impact on improving student learning outcomes and teaching quality.Keywords:machine learning;pr

42、edictive modeling;academic achievement;neural network;enrollment dataMeasurement of plant leaf area based on image processing technologyHao Xiaofeng*,Yu Rongrong(School of Computer Science,Xijing University,Xi an 710200,China)Abstract:Aiming at the measurement of leaf area,a method for measuring lea

43、f area based on image processing is designedand implemented.Use the CDD camera to obtain plant leaf images,perform image segmentation and edge detection on the collected plant leaf images,select ideal pictures by comparing Sobel,Robert,Prewitt and Canny operators,and then use morphologicalprocessing

44、 to smooth the gaps and noises,and finally The measured area is obtained by the pixel statistics method,and the correlation analysis is carried out with the real area.This method can accurately and conveniently measure the area of plant leaves.Keywords:image processing;edge detection;area;pixel(上接第36页)44

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服