收藏 分销(赏)

高校教务信息管理系统中关联规则挖掘算法改进研究和应用.pdf

上传人:自信****多点 文档编号:1484527 上传时间:2024-04-28 格式:PDF 页数:3 大小:2.06MB
下载 相关 举报
高校教务信息管理系统中关联规则挖掘算法改进研究和应用.pdf_第1页
第1页 / 共3页
高校教务信息管理系统中关联规则挖掘算法改进研究和应用.pdf_第2页
第2页 / 共3页
亲,该文档总共3页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、信息记录材料 年 月 第 卷第 期高校教务信息管理系统中关联规则挖掘算法改进研究和应用徐 飞(闽西职业技术学院 福建 龙岩)【摘摘要要】随着社会对于教育认知水平的不断提升,接受高等教育对人们来说越来越普及。在全面信息化的时代,提升高校信息化管理水平,提高管理的效率,成为各大高校亟需解决的问题。结合数据挖掘相关挖掘算法概念,基于传统 算法为基础,分析其所存在的不足,并提出一种优化后的关联规则 算法,采用三种实验对比改进的 算法与传统 算法在执行时间和效率的差异,实验结果表明改进的 算法在执行时间方面显著优于传统 算法,应用效果较好。【关关键键词词】高高校校教教务务信信息息管管理理系系统统;关关联

2、联规规则则;数数据据挖挖掘掘;算算法法【中中图图分分类类号号】【文文献献标标识识码码】【文文章章编编号号】()基金项目:福建省教育厅中青年教师教育科研项目()。作者简介:徐飞(),男,福建永定,硕士,讲师,研究方向:物联网技术,图像识别技术,系统开发和测试。引言有别于传统的数据处理方式,数据挖掘主要是一种以数据分析为基础的数据处理技术,能够高效地完成信息分类、聚类、关联挖掘等数据处理工作。如今,各个领域应用的数据挖掘关联规则算法主要以 算法为基础。但由于 算法其本身频繁进行数据库扫描及大量候选集的缺点,在应用过程中通常会对 算法进行优化和拓展,以更好地适用信息处理工作。本次研究以 算法为基础,

3、提出一种优化的 算法,并将其引入至高校教务管理中进行实验,探讨其应用效果。数据挖掘技术数据挖掘技术也被称作“数据库的知识发现”,其基本的运行逻辑是在大量无规则、不完全、模糊且随机的原始数据中,辨别并提取到在数据中所隐藏的,与之相关或有用的知识及信息。数据挖掘技术的特点数据挖掘技术在应用过程中有较为显著的要素或特征,如可以对、或者更大规模的数据进行处理;可以通过系统分析或通过模糊查询获取有用的信息;适用于数据更新快且反应速度快的场合,有利于对相应的决策提供支持;具有动态增长性,随着数据规模的扩展,数据挖掘系统可以发现新规则或对原规则进行更新。从以上特点亦可以看出,数据挖掘技术在高校教务系统中具有

4、较高的应用价值。数据挖掘技术的功能 关联规则分析功能数据仓库作为相关信息内容的集合,其中涵盖事务数据库、关系数据库以及其他相关的各类数据信息。数据挖掘过程中主要是通过对数据仓库信息的扫描,运用关联规则中的最小支持度及最小置信度实现信息获取,并通过相关关系和项集的确定对得到的信息进行挖掘分析。概念描述及聚类分析功能数据挖掘技术可结合数据库中相关的数据集特征对数据集进行汇总,并根据系统数据库中的数据集信息进行比较和描述;分析并确定数据集中最小化类内及最大化类外的相似程度,并把类中的数据集对象进行分组和聚类。预测、分类以及孤立点分析功能数据挖掘技术结合训练集完成模型构建,完成存储数据集的分类和处理工

5、作,并可以实现未知数据集的相关预测;在处理数据信息中特殊的数据信息时可以实现孤点处理并根据相应策略进行对应解决。关联规则作为数据挖掘技术中重要的技术之一,关联规则不仅适用性强且易理解程度高,也是数据挖掘技术中研究最为活跃的方法之一。关联规则的数据描述采用数学化的形式对关联规则描述,如下:在关联规则中,研究人员通常会将 作为基础项集。假设 ,为多个不同的项目组成的集合,在一个固定的数据库()中,所记录的每件事务(),均为 项集中的属性集时,那么。假设 为 项目集中的一种,若 那么研究人员可以认为事务 中包含,其中的关联规则就是形如?的蕴涵式。蕴涵式中的,且 。规则?在 事务集中成立的条件为其不仅

6、具有支持度,同时具有可信度,条件概率为:()()()()()()支持度和可信度是作为描述关联规则的两个重要的概念,支持度反映了项目在数据库中的占比,可信度则表示规则发现的强度,而同时满足最小可信度及最小支持度的规则通常称作强关联规则。关联规则种类关联规则根据分类方法的不同,有多种类别。布尔型关联规则和数值型关联规则是关联规则变量分类的主信息记录材料 年 月 第 卷第 期要形式,布尔型关联规则的主要优势在于能够直观描述变量间的关系,可以处理离散的变量值;数值型关联规则,顾名思义就是可以对数值数据进行处理;单维关联规则和多维关联规则是根据维数对关联规则分类,单维关联规则对应处理单属性数据,而多维关

7、联规则处理的是多属性数据;单层关联规则和多层关联规则是根据数据的抽象性进行的分类,其中单层关联规则不会涉及数据的层次性。传统关联规则 算法及改进在众多关联规则算法中 算法是最为基础、最为常见的一种,是一种采用布尔型关联规则挖掘频繁项集的迭代方法,由 世纪 年代 等提出。算法优化的基本思想在传统 算法执行过程中,由于候选频繁集的数量繁多,每次需要频繁、多次的扫描,扫描执行周期长,并且当系统内存容量有限时,频繁的扫描也会占用更多系统资源,严重影响挖掘效率和准确度。本文基于()算法核心思想的基础上提出一种改进的 算法,具体如下:()采用新的 计算算法,通过 将候选集 导出,若 中的元素数量不大于,将

8、会跳出循环,若数目大于,则 中的元素会成为两两相连的状态,并计算出连接后相同元素的数量。()通过扫描数据库 中的相关事务,对 中元素支持情况进行研究。若完全不能支持,则该事务移出数据库,且不再加入;若该事务支持 中的某一项元素,那么该元素会将此事务进行记录。并且随着 的产生,候选集 也会被分为两组,其中一组中()的支持度大于或等于最小支持度,另外一组 的支持度低于最小支持度,同时可以此为基础,删除仅支持 部分的事务。根据元素中的记录,对 及 中所有元素记录并进行操作,形成、两个事务标记集合,在 中删除 中的事务,那么下次操作则会在删除了冗余事务的新数据库 上进行。算法改进的优化步骤()首先定义

9、一个行类似于的矩阵,其中对角线元素,用以表示单个事务,的支持度,而 项集中,的支持度用,表示。使用的关联规则:当 个项目集在一个事务中同时出现时,此矩阵对 个项目集分别在对应的元素中加,当一个事务是,时,那么该矩阵分别在,计数加。()算法的优化步骤:首先,清零矩阵中各元素的全部计数;完成数据库 的扫描,根据规则将各个事务中的项目集重新计数;整个数据库相关事务信息扫描完成后,获取对称的矩阵,此时仅需要考虑上三角矩阵,并将 作为相对应的对角线元素,而将 作为其余元素的集合即可;在 中将频度小于最小支持度的元素删除,余下的项集为频繁 项集集合;在 中将频度小于最小支持度的元素删除,余下的项集为频繁

10、项集集合。运用基于 算法为核心思想的改造,仅需要完成一次数据库扫描即可生成,减少了数据库的扫描次数,同时使算法效率得到较大提升。特别是数据库中的信息数据量较大时,算法优化效果更为显著。改进的 算法实验及分析通过实验的方式对传统 及改进 两种算法进行对比分析。本次实验研究环境为 结构,选用 作为数据库软件,服务器计算机处理器选用 ,客户端和服务器间用 以上速率局域网连接,选用 作为本次实验的集成开发环境,为本次算法的编程语言。本次实验选用高校教务信息管理系统中的学生事务管理的部分数据,数据共有 条,人员为 人。实验前已对数据库进行了前期处理,表内数据均转为整型数据,其中 对应事务记录 没有参与的

11、人员。对应事务记录 参与的人员。运用三种方式进行对比,如下:实验一设定事务项目数均为,事务数均为,对比在不同支持度的情况下,两种算法的执行时间,见图:图 事务数和项数相同,支持度不同时两种算法执行时间对比通过图 可以看出,在不同支持度、相同数据规模的情况下,改进的 算法在执行时间方面较传统 算法更短,并且传统 算法在设定支持度越小时耗时越长。实验二设定事务项目数均为,支持度 均为 时,对比在不同事务数量时传统 及改进 两种算法的执行时间,见图:通过实验二可以看出,事务项目数均为,支持度 均为 时,算法与传统 算法执行时间均呈现增长的情况,不过改进的 算法的执行时间明显短于传统 算法。信息记录材

12、料 年 月 第 卷第 期图 相同支持度和项数不同事务数的两种算法执行时间对比 实验三设定事务数 均为,支持度 均为 时,对比在不同事务项数时传统 及改进 两种算法的执行时间,见图。图 实验中支持度及事务数均相同,事务项数不同时对比两种算法执行时间 通过图 可以看出,在不同事务项数、相同支持度及事务数的情况下,传统 算法执行时间呈现快速增长的现象,而改进的 算法的执行时间增长速度明显低于传统 算法。通过以上实验分析可以看出,改进后的 算法相比于传统 算法执行时间更短,效率更高。结语本文分析了传统 算法在该校信息管理中的应用特点,并在此基础上提出改进的 算法,改进后的 算法在数据扫描中更加快捷,整

13、体执行时间更短,效率更高。随着互联网技术应用不断深入,大力推进教育行业的信息化建设和创新不仅是高校发展的条件,也是时代发展的需求。有关教育工作者应进一步加强数据挖掘技术的开发及应用,提升高校信息管理的应用价值,促进高校全面信息化管理的实现。【参考文献】王红旗学生信息管理系统中数据挖掘技术的运用 数字化用户,():古荣龙,赵文杰,王磊大数据时代数据挖掘技术的应用 科技创新与应用,():刘璎川 基于 算法的高校教务管理系统设计与实现 现代电子技术,():,孙金鑫 数据挖掘中的关联规则的研究 智能计算机与应用,():(上接第 页)数据库提供数据处理接口,最后打包部署,将前后端分别部署到阿里云平台,通

14、过浏览器访问界面进行任务管理。本文的创新之处在于突显可视化,激发人们使用个人任务管理系统的兴趣。相对于市面上的任务管理系统做了两方面的优化,一方面基于个人任务的特殊性,将三列任务流调整为两列,使得任务从待办状态拖拽到进行中状态和已完成状态更加便捷;另一方面,一改常规的在日历上创建任务日程,而是延续任务流的操作,根据需要将任务以拖拽形式分配到日程,并在任务列表和日历中保持任务同步更新。【参考文献】于北瑜 软件项目管理系统开发 电脑知识与技术,():邹珺 任务管理系统的设计与实现 软件工程,():享知:用敏捷开发管理思维,做团队协作的 软件 软件产业与工程,():蒋梦云 看板模型在敏捷软件开发流程中的应用 计算机与网络,():王丽 基于 的教案管理系统的设计与实现 电脑知识与技术,():宁竞 基于云平台和 的高校任务管理系统设计 电子技术与软件工程,():

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服