1、关于数据挖掘技术在课堂教学质量评估体系中的应用文献综述依兰县职业高中 刘勋力摘 要:随着计算机数据库技术、计算机信息技术的蓬勃发展,使得各个行业的数据信息量急剧增加,但如何从海量的数据中获得有价值的信息,是当前所面临的共性问题。数据挖掘是一种新的数据信息筛选、分类、理解的智能技术,而关联规则是数据挖掘中重要的算法技术之一,是为了分析大量的相关数据之间的关系,获得有价值的信息,用来作为决策的依据。本文是在阅读相关文献材料的基础上,简略地对“数据挖掘技术在课堂教学质量评估体系中的应用”这一研究的问题进行叙述,重点对数据挖掘技术的相关理论知识、课堂教学质量评估体系的建设内容、Apriori算法的理论
2、结构和Apriori算法关联规则在课堂教学质量评估中的应用进行简单的描述,本文的实验数据来自于东北师范大学数字图书信息资源。关键字:数据挖掘技术、课堂教学、评估体系、Apriori算法、关联规则On data mining technology in classroom teaching quality assessment system for the application of literature reviewChongqing Normal University, 2010 serving in the post professional Master of Computer Sof
3、tware and TheoryLiuxun-liAbstract:With the computer database technology, computer information technology boom, the amount of information to various industry data increased dramatically, but how vast amounts of data to obtain valuable information, is currently facing common problems. Data mining is a
4、 new data selection, classification, understanding, smart technology, and data mining association rules is an important algorithm technology is one of the large amount of data to analyze the relationship between access to valuable information, used as a decision-making. This article is in the readin
5、g material on the basis of relevant literature, briefly on the data mining technology in classroom teaching quality assessment system in the application This study describes the issues, focusing on data mining technology, the theory of knowledge, teaching quality assessment system of the building co
6、ntents, Apriori algorithm and the theoretical structure of Apriori algorithm association rules in the classroom teaching quality assessment in the application of a simple description of this experimental data from the Northeast Normal University digital library information resources.Keywords: Data m
7、ining technology, teaching, assessment system, Apriori algorithm, association rules引 言:教学评估是对教学活动的评估,也就是说对教学过程作出有价值的的判断。有效地教学评估是要对实际教学工作产生指导意义的,但是面对实际教学工作进行全面的、客观的、科学的评价并不是一件容易的事,而面对中等职业学校的特殊教育模式,教学评估工作则显得更加复杂。教育评估要实现科学性和人性化,就要全面地、系统地进行数据的收集、合理地进行分析、理解和总结,最终形成有效地评估结论。近年来,随着我国教育事业的快速发展,课堂教学质量问题日益成为学校
8、和社会关注的焦点问题,如何提高课堂教学质量,培养出符合社会需求的高素质人才,建立科学合理、人性化的课堂教学评估体系。如何利用先进的关联规则算法数据挖掘技术,寻找在教学中出现的普遍性、关联性和规律性问题,用以及时的、科学的、客观的发现教学中的问题,分析问题、解决问题,对推动计算机教育教学的发展将会有一定的现实意义。目前,计算机网络技术、计算机数据库技术和计算机算法分析技术的飞速发展,使得我们教育评估系统产生了质的飞跃,但在数据分析的实时性、准确性和可信度还有一定的不足,这也是我们将要进行研究的目标。近十几年来,数据挖掘技术的发展使得数据分析技术有了更深层的提高,为我们的数据分类和分析研究工作提高
9、了理论依据。数据挖掘(Data Mining)是一种通过数理模式来分析数据库中储存的大量信息资料,以寻找到不同数据信息的关联和划分,分析出数据信息内在联系的方法,在教学评估中利用该技术找到评估决策的出发点用来指导我们的课堂教学,是一件可行而又有意义的研究工作。正 文:一、数据挖掘技术(一)数据挖掘的定义、作用及发展趋势1.数据挖掘(data mining)是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的过程。在人工智能领域,习惯上又称为数据库中的知识发现(Knowledge Discovery in Database, KDD), 也有人
10、把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下三个阶段组成:第一阶段为数据准备,第二阶段为数据挖掘,第三阶段为结果表达和解释。数据挖掘可以与用户或知识库进行交互。 近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。 数据挖掘利用了来自如下一些领域的思想:首先来自统计学的抽样、估计和假设检验,其次是人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些
11、领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。2数据挖掘技术是人们长期对数据库技术进行研究和开发的成果,经历了十几年的的研究和发展,数据挖掘技术已经进入了更高的理论研究和实践应用阶段,目前数据挖掘技术在商业、金融业、高等教育领域、科研领域等方面都得到了广泛的应用,数据挖掘中的关联规则是指在数据挖掘过程中能够发现大量数据中项集之间有效的关联或相关联系,特
12、别是随着大量数据不断地收集、存储和分析,找出数据库中隐藏的关联网,为决策分析提供有效地依据。3数据挖掘最早出现在20世纪80年代,在1989年第十一届国际联合人工智能学术会议上提出了“从数据库中发现知识(Knowledge Discovery in Databases,KDD)”一词,是数据挖掘概念的基础,数据挖掘技术在90年代有了迅猛的发展,2001年高德纳咨询公司(Gartner Group)的一次调查活动中,将数据挖掘、人工智能等列为“未来三到五年之间将对工业产生深远影响的五大关键技术”之首。2001年1月美国麻省工学院的科技评论(Technology Review)提出了数据挖掘是一个
13、在未来5年对人类产生重大影响的十大新兴技术之一,为此,数据挖掘技术现已经成为国际上一个研究的热点,数据挖掘技术已经应用于各个领域,如:IBM公司针对NBA联赛数据库开发的AS(Advanced Scout)系统,加州工学院针对喷气推进试验而开发的SKICAT系统,大量应用于银行、商业中的客户数据分析系统等。在我国,数据挖掘的科学研究最早出现在1997年,在国内期刊共计检索到3篇,这表明我国在数据挖掘的科研上与国际研究的时间差距不大,近些年来,我国有许多学者对数据挖掘的理论和应用进行了系统地研究工作,发表了大量的、有学术价值的科研论文,但是相对研究的领域而言,我国的数据挖掘技术的研究没有形成强大
14、的整体科研优势,国内从事数据挖掘研究的学者主要集中在高等院校、部分科研单位和部分大型国有企业。并且研究方向主要集中在数据挖掘算法研究、数据挖掘理论以及在大型企事业中的数据挖掘实际应用方面的研究,而企事业运用数据挖掘技术来协助业务决策的的研究还处于初级阶段,成功的案例较少,我国的数据挖掘有着巨大的市场和可开发性,这对于数据挖掘技术研究人员来说无疑是一个最佳的科研时期。(二)数据挖掘的方法1类聚算法(Clustering Algorithm)是指通过对变量的比较,把具有相似特征的数据信息划分为同一类别,即通过计算后,数据就转化为类集。用来区分不同类中的数据信息是属于数据挖掘过程的范畴。类聚算法一般
15、可分为分层类聚(基于数学标准属性)和概念类聚(基于数据信息的非数值属性)两类。2遗传算法(Genetic Algorithm)是基于基因重组、突变和自然选择等规律产生的算法。该算法是对某一特定问题的一组可能的解决思想,利用自然选择规律寻找优选,淘汰较差的因素。3分类算法(Classification Algorithm)是一种普遍应用数据挖掘方法之一,该方法是按照事先定义的标准对数据进行归类,然后再进行数据的挖掘过程。分类算法一般分为决策树归纳法和规则归纳法两类。4神经网络算法(Neural Networks Algorithm)是根据模拟人类的形象5粗糙集算法(Rough Set Algor
16、ithm)是通过引入不可分辨关系、等价关系、上、下近似等概念考察数据表达中不同属性的重要性,来确定哪些属性是冗余的,哪些属性是必不可少的。6覆盖正例排斥反例算法(Exclusion of the positive examples covered by counter-example Algorithm)是改进的AQ15和AES方法。7统计分类算法(Statistical Classification Algorithm)是利用数理统计关心的一种算法,该算法是在数据库字段项之间建立两种关系:行数关系和相关关系,对他们进行数据挖掘操作。8模糊论算法(Fuzzy theory Algorithm)
17、是利用模糊结合理论,对实际问题进行模糊判断、模糊决策、模糊模式的识别、模糊簇聚的分析。(三)关联规则1关联规则(Association Rule)是数据挖掘技术中的重要任务之一,通常用来发现大量数据库中项集之间的关联关系的。关联规则发现的这些关系不是数据中固有的,也不表示任何的因果性和相关性。关联规则侧重于确定数据中不同域之间的联系,即寻找给定数据集中相关内在的联系。2关联规则问题的描述关联规则的概念和模型是首先由R.Agrawal等人在1993年提出来的,下面对关联规则的进行定义:设I=i1,i2,im是项的集合,事务数据库DB=,其中的每个事务T是项的集合,TI,并且每个事务T都有一个唯一
18、的标识符TID。如果XT,则称X是一个项集,如果X中有k个元素,则称X为k-项集。关联规则是形如AB的蕴含式,其中,AI,BI且AB=。规则AB在事务数据库DataBase中的支持度,是DataBase中包含AB的事务占事务总数的百分比,即概率P(AB)。一个项集X的支持度一般用sup(X)表示。规则AB在DataBase中的可信度,是在DataBase中的那些包含A的事务中,B也同时出现的概率,即条件概率P(B|A)。关联规则的挖掘一般可分成两个步骤:首先,找出所有支持度大于等于最小支持度阈值的频繁项集。其次,由频繁模式生成满足可信度阈值的关联规则。第一步的工作是相当费时的,而第二步在第一步
19、的基础上很容易实现,因此关联规则挖掘算法的性能主要由第一步决定。(四)Apriori算法Apriori算法是1994年由R.Agrawal等人提出来的,Apriori算法是关联规则挖掘的一个经典算法,后来的许多算法都是基于该算法的思想。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成
20、所有频集,使用了递推的方法。算法的名称来源于在算法中应用了频繁项集的先验知识,即一个频繁项集的任一非空子集必定是频繁项集;因此只要某一项集是非频繁的,则其超集就无须再检验。算法首先扫描一遍数据库计算各个1-项集的支持度,从而得到频繁1-项集L1;然后采用迭代的方式,逐步找出频繁2-项集,3-项集,直至不再产生新的频繁项集为止。在计算频繁k-项集Lk(k=2,3,)时,先通过Lk-1自连接产生候选集Ck,利用一定的剪枝策略缩减Ck;再通过扫描数据库来计算候选集的出现频率,消除非频繁项,从而得到Lk。Apriori算法广泛应用于商业中,应用于消费市场价格分析中,它能够很快的求出各种产品之间的价格关
21、系和它们之间的影响。通过数据挖掘,市场商人可以瞄准目标客户,采用个人股票行市、最新信息、特殊的市场推广活动或其他一些特殊的信息手段,从而极大地减少广告预算和增加收入。百货商场、超市和一些老字型大小的零售店也在进行数据挖掘,以便猜测这些年来顾客的消费习惯。同时Apriori算法也被广泛应用于移动通信领域。移动增值业务逐渐成为移动通信市场上最有活力、最具潜力、最受瞩目的业务。随着产业的复苏,越来越多的增值业务表现出强劲的发展势头,呈现出应用多元化、营销品牌化、管理集中化、合作纵深化的特点。针对这种趋势,在关联规则数据挖掘中广泛应用的Apriori算法被很多公司应用。依托某电信运营商正在建设的增值业
22、务Web数据仓库平台,对来自移动增值业务方面的调查数据进行了相关的挖掘处理,从而获得了关于用户行为特征和需求的间接反映市场动态的有用信息,这些信息在指导运营商的业务运营和辅助业务提供商的决策制定等方面具有十分重要的参考价值 此外Apriori算法应用于高校管理中。随着高校贫困生人数的不断增加,学校管理部门资助工作难度也越加增大。针对这一现象,提出一种基于数据挖掘算法的解决方法。将关联规则的Apriori算法应用到贫困助学体系中,并且针对经典Apriori挖掘算法存在的不足进行改进,先将事务数据库映射为一个布尔矩阵,用一种逐层递增的思想来动态的分配内存进行存储,再利用向量求与运算,寻找频繁项集。
23、实验结果表明,改进后的Apriori算法在运行效率上有了很大的提升,挖掘出的规则也可以有效地辅助学校管理部门有针对性的开展贫困助学工作。二、课堂教学质量评估体系的建设(一)课堂教学质量评估的程序课堂教学质量评估是一项技术性很强的工作,是按照科学的工作程序开展并组织教师的课堂评价,对保证课堂教学质量评估的科学性和实效性有一定的意义。根据现有的观点,课堂教学质量评估的程序一般可以按照两个不同层面进行讨论。1按照课堂教学活动的角度,把评估置于课堂教学活动之中,这样课堂教学评估的一般程序为:(1)计划;(2)过程;(3)成果三个阶段。2按照课堂教学质量评估的角度,根据评估自身进行的过程换分,这样课堂教
24、学评估的一般程序为:(1)预备;(2)实施;(3)分析三个阶段。预备阶段一般包括:教学目标条件的分析,制定课堂教学评估方案和建立评估机构三个环节。实施阶段一般包括:收集相关信息数据,分析评价评分和整理综合汇总三个环节。分析阶段一般包括:形成综合评估报告、反馈评估信息和实现课堂教学评估系统三个环节。(二)课堂教学质量评估遵循的原则1课堂教学质量评估要具有全过程的原则(1)科学性与教育性原则(2)目的性与选择性原则(3)标准化与可比性原则(4)客观性与实践性原则(5)分析与综合相结合的原则(6)定性评估与定量评估相结合的原则2课堂教学质量评估方式和方法的原则(1)客观性与目的性相结合的原则(2)整
25、体性与部分性相结合的原则(3)定性分析与定量分析相结合的原则(4)静态分析和动态分析相结合的原则3. 课堂教学质量评估目的与功能的原则(1)要求的统一性原则(2)科学的全面性原则(3)过程的教育性原则(4)实施的可行性原则总之,课堂教学质量评估的原则应该是根据实际课堂教学的客观规律,结合教学质量评估的规律而提出的,课堂教学质量评估遵循的原则是充分反映课堂教学质量评估客观规律的概括和基础。(三)课堂教学质量评估体系指标的建构课堂教学评价指标体系是进行课堂教学评价工作的重要依据和关键,它的设计如何,直接关系到课堂教学评价工作的效果。课堂教学评价的标准需要选择的是课堂教学中最基本的共同的东西。但是,
26、由于教学本身的复杂性决定了课堂教学评价的复杂性,它既不能用劳动强度、工作时间和教学对象等方面简单的量来衡量,又不能以某一个模式来参照给分,因此,究竟依据哪些因素对课堂教学做出评价,一直是教学评价研究的重要课题之一。国外有的研究提出从教学过程和教学效果两方面进行评价,国内也有人提出根据目标、过程和条件等项内容去评价课堂教学。综合国内外的研究,我们认为,下列项目可以作为课堂教学评价的一级指标1教学目标和教学内容包括教学目的的明确性和具体性,是否符合教学大纲的要求。高校课程无论是必修课还是选修课,是基础课还是专业课,其教学都要依据教学大纲来进行。因此,评价其课堂教学质量的标准就是看它是否达到大纲中有
27、关理论知识、基本技能和基本能力的要求。当然,在设计具体的二级指标时,教学目标的明确性还可以进一步细化,如不仅符合大纲的要求,而且切合学生实际,是学生经努力能够实现的,这一点在当前尤为必要。教学内容包括内容阐述的科学性和思想性、知识结构的逻辑性与系统性,课堂内容、信息量,重点、难点,教材的分析和挖掘,理论联系实际情况,反映本学科的最新成果等。2教学组织和教学能力包括教学机智,教学面向全体学生,因材施教,注重差异;在教学中气氛和谐,充分发挥教与学的积极性,激发学生的兴趣;教学思路清晰,语言组织恰当,表达清晰、生动,富于表情,以及积极创设符合教学内容和学生心理特点的课堂教学情境。3.教学方法包括使用
28、启发式教学,师生配合的协调性,方法的灵活性、多样性,积极运用各种多媒体,讲授深入浅出,能引导学生独立思考等。4.教学态度包括教学是否认真,如备课充分、讲授认真、有规范化的教案;对学生有爱心和责任心,以及严格要求、严格管理等。5教学效果 包括教学总体设计妥当,学生对基本概念的掌握情况,学生对学习过程的理解情况,学生独立思考能力的形成、学习方法的掌握、自学能力的培养等。 为提高评价的区分度,除了设计上述评价内容以外,还增加了4个子项目。这些是就当前高校教学中易出现的问题而提出来的补充项目,如讲授随意性大,基本知识、基本原理讲解存在着明显错误等,凡具有这两项问题者为教学效果差。三、基于Apriori
29、关联规则算法在课堂教学质量评估体系中的应用1数据集成过程:是指将来自多个数据库中不同数据源的数据信息进行合并,借鉴东北师范大学高校教学质量评估体系研究资源数据进行采集,并获得多个数据库中的信息数据,利用计算机数据库技术生成学生评估分析数据表(数据表1)。随机取样评估记录如下:xhu1u2u3u4u5u6u7u8u9uaubuc0195987682938190938298969502869587988787878798989881037268907889999989789595970495908498838395839895929505949195799089899079629172069794
30、9887858595858793879707989760678967828799907687089078677978878485868790900977879569908993906689947810868784858990839086838789注:xh是学生的学号,ui表示为第i项评估指标,ua表示为第10项,ub表示为第11项,uc表示为第12项。2数据转化过程:该过程主要是对以上数据进行规则化操作,根据关联规则原理的要求对学生的评估进行数据挖掘,在操作中,使用布尔型数据信息,因此需要把学生的评估分析数据表转换成布尔型数据表示,所以在数据挖掘时确定各个指标之间的关联度,90分以上的数据布
31、尔字段值为“1”,表示事务存在项,其他分数为“0”, 表示事务不存在项,将表1转换为事务数据库表(表2)如下:TID项集T1u1,u2,u5,u7,u8,ua,ub,ucT2u2,u4,u9,ua,ubT3u3,u6,u7,ua,ucT4u1,u2,u4,u7,u9,ua,ub,ucT5u1,u2,u3,u5,u8,ua,ubT6u1,u2,u3,u7,ua,ucT7u1,u2,u9,T8u1,ub,ucT9u3,u5,u7,u8,ubT10u 6,u8T11u4,u8,ucT12将事务数据库表(表2)转化为数据挖掘矩阵,即事务矩阵I(表3)如下:swu1u2u3u4u5u6u7u8u9uau
32、bucxzT11100101101118T20101000011105T30010011001116T41101001011118T51110100100106T61110001001016T71100000011004T81000000000113T90010101100105T100000010100002T110001000100013T1200000000000003频繁集求解的步骤:(1)对事务数据库表(表2)进行扫描,求出1-项频繁集。根据事务数为12,给出最小支持度为0.30,所以最小支持数为120.3=3.6(约为4)因此u4,u5,u6,u9的支持数小于最小支持数,删除掉u4
33、,u5,u6,u9在事务矩阵I中的对应列,再一次计算事务矩阵中的xz的值,根据Apriori算法的要求删除元素值小于2的元素所在行,所以删除T10和T12所在行,最终得到事务矩阵II(表4)如下:swu1u2u3u7u8uaubucxzT1110111117T2010001103T3001101115T4110101116T5111010105T6111101016T7110001003T8100000113T9001110104T11000010012通过以上所述,现计算L1= u1, u2, u3, u7, u8, ua, ub, uc,各部分的支持度,计算如下:sup_count(u1)
34、=6,sup_count(u2)=6,sup_count(u3)=4,sup_count(u7)=5,sup_count(u8)=4,sup_count(ua)=6,sup_count(ub)=7,sup_count(uc)=6(2)依据2-项集来对事务矩阵II(表4)进行第二次挖掘,由于sup_count(u3)=4和sup_count(u8)=4,计算2-项频繁集L2(u3)=1.2 和L2(u8)=1.2,都小于最小支持数,所以依据Apriori算法和各项支持度的计算结果,先将表4中u3和u8的列进行删除,同时删除T11(其值为2)的行,得到事务矩阵III(表5)如下:swu1u2u7u
35、aubucxzT11111116T20101103T30011114T41111116T51100103T61111015T71101003T81000113T90010102(3)根据事务矩阵III(表5)所示,求出3-项频繁集是L3=u1,u2,ua , u7,ua,uc,所以| L3|4,其最大频繁集次数为3,计算L3各个项集支持度,sup_count(u1,u2,ua)=4,sup_count(u7,ua,uc)=4,到此为止算法实验结束。4实验结果分析:根据数据挖掘原理和Apriori算法的要求,在实验中,根据事务数为12(随机抽取的12名学生),假定最小支持度为0.30,匹配度为0
36、.60,所以可以计算出最小支持数为120.3=3.6(约为4),根据实验步骤,具体产生关联规则的过程如下:(1)根据以上计算出的频繁集L,当I1=u1,u2,ua时,它的非空子集合有u1,u2,ua,u1,u2,u1,ua,u2,ua。当I2=u7,ua,ua 时,它的非空子集合有u7,ua,ua,u7,ua,u7,ua,ua,ua。那么,由I1产生的关联规则的匹配度和可信度对比,生成对比表I(表6)生由如下:关联规则匹配度可信度u1 u2ua0.50000.6666u2 u1ua0.66660.6666ua u1u20.50000.6666u1u2ua0.51400.8000u1uau20.
37、75001.0000u2uau10.51400.8000由I2产生的关联规则的匹配度和可信度对比,生成对比表II(表7)生由如下:关联规则匹配度可信度u7 uauc0.80000.8000Ua u7uc0.66660.6666Uc u7ua0.66660.6666U7uauc0.75001.0000U7ucua0.75001.0000Uaucu70.87501.0000根据以上分析,当设定最小可信度为0.6,则以上所有的关联规则都符合条件,但是如果用支持度和匹配度来评价,当前最小匹配度设定为0.6时,据表6和表7的分析数据,将低于0.6的匹配度关联u1 u2ua,ua u1u2,u1u2ua和
38、u2uau1删除可以得出强关联规则输出(表8)如下:关联规则匹配度u2 u1ua0.6666u1uau20.7500u7 uauc0.8000Ua u7uc0.6666Uc u7ua0.6666U7uauc0.7500U7ucua0.7500Uaucu70.8750从强关联规则输出(表8)中可以看出u1uau2和Uaucu7这两条规则的匹配度最高,可以抽样分别代表各规则指标之间的关系。因此,在本次抽样试验中得出两条结论:(1)根据强关联规则输出(表8)的数据信息,从这两条强关联规则中,可以看出学生对教师素质的全面评估的结果,对于教的全面发展是有一定要求的,那么提高课堂教学质量,首先要全方位地培
39、养我们的教师。(2)从规则u1uau2中可以看出,作为u1,u2,ua的一个子集,同时属于强关联规则。这说明了第一项集、第2项集和第10项集之间关联度非常的大。因此,在评估指标确定的时候,可以将这三项合并,权重分配总比例和为1,以保证评估的科学性、减少系统的资源开销。总 结:数据挖掘的方法已经越来越丰富,性能也在不断提高,但与现实中的各种需求相比仍存在着一定的差距。在教育信息化的大背景下,数据挖掘技术应用于教育领域内,必然是前景广阔。而关联Apriori算法技术是数据挖掘中重要的技术之一,本文在其他学者研究的前提下,简单地总结并描述了数据挖掘技术在课堂教学质量评估中的应用技能。通过相关文献资料
40、的阅读,感受到了数据挖掘技术的广阔的发展空间和实用的算法技术,统统论述,认识到了数据挖掘技术的理论知识、应用的现状,研究了Apriori关联规则算法的基本理论,描述了Apriori关联规则算法的应用技术、以及算法与教学评估数据之间的结合点和应用技能。参考文献:1 陈文伟、黄金才,数据仓库与数据挖掘,人民邮电出版社,2004年;2 徐志伟,关联规则方法在高校课堂教学质量评估体系中的应用研究,东北师范大学硕士论文, 2009年;3曾希君、秦杰,数据挖掘在计算机教育中的应用,中国科技论文在线,2008年;4李政杰,数据挖掘的理论方法及其在教学管理系统中的应用,5彭慧,数据挖掘技术在网络教学中的应用,
41、计算机教学与教育信息化,2010年;6 袁万莲、郑诚,数据挖掘技术在高校课堂教学评价中的应用,计算机技术与发展,2008年;7熊熊、张雄,数据挖掘技术及其实现,天津大学学报,2010年;8刘红岩、陈剑、陈国青,数据挖掘中的数据分类算法综述,清华大学学报,2000年;9朱玉全、孙志辉、季小俊,基于频繁模式树的关联规则增量式更新算法,计算机学报,2003年;10杜孝平、马秀丽、唐世渭,快速关联规则挖掘算法,计算机工程与应用,2002年;11秦亮曦、史忠植,关联规则研究综述,广西大学学报,2005年;12徐章艳、张师超、区玉明,挖掘关联规则中的一种优化的Apriori算法,计算机工程,2003年;13李菁菁、邵培基、黄亦萧,数据挖掘在中国的现状和发展研究,电子科技大学学报,2004年;14刘大友、刘亚波、尹志东,关联规则最大频繁项目集的快速发现算法,吉林大学学报,2004年;15陆丽娜,挖掘关联规则中Apriori算法的研究,微型计算机系统,2000年;16张海峰、张建伟,基于Apriori算法的有效关联规则挖掘算法研究,计算机工程与应用,2003年;17周玉敏,基于Rough集的数据挖掘在教学评价中的应用,重庆邮电大学学报, 2008年;18严泽元、吕宗宝、刘兴丽,频繁项目集发现算法Apriori研究,黑龙江科技学院学报,2005年。