收藏 分销(赏)

Apriori算法实验报告及程序.doc

上传人:快乐****生活 文档编号:4006133 上传时间:2024-07-24 格式:DOC 页数:29 大小:247.50KB
下载 相关 举报
Apriori算法实验报告及程序.doc_第1页
第1页 / 共29页
Apriori算法实验报告及程序.doc_第2页
第2页 / 共29页
Apriori算法实验报告及程序.doc_第3页
第3页 / 共29页
Apriori算法实验报告及程序.doc_第4页
第4页 / 共29页
Apriori算法实验报告及程序.doc_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、pri算法实验报告学 号: 姓 名: 专 业: 计算机应用技术教 师: 计算机学院目 录1 APRIORI实验11、 实验背景1、1、 国内外研究概况1、1、2 发展趋势1、2 实验内容与要求1、 实验内容11、2、2 实验要求11、3 实验目得2 APRORI算法分析与实验环境2、 rior算法得描述32、2 Ariri算法得步骤3、 开发环境3、3、 软件环境32、 硬件环境2、 本章小结43 算法得设计53、1 Apri算法整体框架、 主要得数据结构与函数3、2、 数据结构3、2、 主要得程序63、2、3 连接与剪枝操作6、3 本章小结64 数据库得设计与数据得来源4、正确性验证数据74

2、、2 实验数据7、3 本章小结 实验结果与性能分析95、 Apiori实验界面95、实验得正确性验证9、3实验性能分析10、1固定最小支持度改变数据量05、3、2固定数据量改变最小支持度115、3、3实验结果分析115、4 本章小结16 总结与体会131 Apror实验1、1 实验背景现在,数据挖掘作为从数据中获取信息得有效方法, 越来越受到人们得重视。关联规则挖掘首先就是用来发现购物篮数据事务中各项之间得有趣联系。从那以后, 关联规则就成为数据挖掘得重要研究方向,它就是要找出隐藏在数据间得相互关系。目前关联规则挖掘得研究工作主要包括:Apiori算法得扩展、数量关联规则挖掘、关联规则增量式更

3、新、无须生成候选项目集得关联规则挖掘、最大频繁项目集挖掘、约束性关联规则挖掘以及并行及分布关联规则挖掘算法等。关联规则得挖掘问题就就是在事务数据库D中找出具有用户给定得满足一定条件得最小支持度inp与最小置信度Minconf得关联规则。1.1国内外研究概况1993年,Agral等人首先提出关联规则概念,关联规则挖掘便迅速受到数据挖掘领域专家得广泛关注、迄今关联规则挖掘技术得到了较为深入得发展。piori算法就是关联规则挖掘经典算法。针对该算法得缺点,许多学者提出了改进算法,主要有基于哈希优化与基于事务压缩等。1.1.2发展趋势关联规则挖掘作为数据挖掘得重要研究内容之一, 主要研究事务数据库、关

4、系数据库与其她信息存储中得大量数据项之间隐藏得、有趣得规律。关联规则挖掘最初仅限于事务数据库得布尔型关联规则, 近年来广泛应用于关系数据库, 因此, 积极开展在关系数据库中挖掘关联规则得相关研究具有重要得意义。近年来,已经有很多基于Apiori算法得改进与优化。研究者还对数据挖掘得理论进行了有益得探索,将概念格与粗糙集应用于关联规则挖掘中,获得了显著得效果。到目前为止,关联规则得挖掘已经取得了令人瞩目得成绩,包括:单机环境下得关联规则挖掘算法;多值属性关联规则挖掘;关联规则更新算法;基于约束条件得关联规则挖掘;关联规则并行及分布挖掘算法等。1、2 实验内容与要求1、1 实验内容编程实现Apri

5、ori算法:要求使用a,,c,d,,f,,h,i,10个项目随机产生数据记录并存入数据库。从数据库读取记录进行piori实验,获得频繁集以及关联规则,实现可视化。并用课堂上得实例测试其正确性。1、2、2实验要求、程序结构:包括前台工具与数据库;2、设定项目种类为10个,随机产生事务,生成数据库;3、正确性验证(可用课堂上得例子);4、算法效率得研究:在支持度固定数据量不同得时候测量运行时间;在数据量固定,支持度不同得时候测量运行时间;5、注意界面得设计,输入最小支持度与最小可信度,能够输出并显示频繁项目集以及关联规则。、3 实验目得1、加强对Apriori算法得理解;2、锻炼分析问题、解决问题

6、并动手实践得能力。 Aprr算法分析与实验环境2、1 Apriri算法得描述Arior算法就是一种找频繁项目集得基本算法。其基本原理就是逐层搜索得迭代:频繁项Lk 集用于搜索频繁(K+1)项集k+1,如此下去,直到不能找到维度更高得频繁项集为止。这种方法依赖连接与剪枝这两步来实现。算法得第一次遍历仅仅计算每个项目得具体值得数量,以确定大型l项集。随后得遍历,第次遍历,包括两个阶段。首先,使用在第(1)次遍历中找到得大项集Lk-1与产生候选项集Ck。接着扫描数据库,计算k中候选得支持度。用Hash树可以有效地确定Ck中包含在一个给定得事务中得候选。如果某项集满足最小支持度,则称它为频繁项集。、2

7、 Apr算法得步骤步骤如下:1、设定最小支持度与最小置信度c;2、Aprio算法使用候选项集。首先产生出候选得项得集合,即候选项集,若候选项集得支持度大于或等于最小支持度,则该候选项集为频繁项集;、在prii算法得过程中,首先从数据库读入所有得事务,每个项都被瞧作候选1项集,得出各项得支持度,再使用频繁-项集集合来产生候选2-项集集合,因为先验原理保证所有非频繁得1-项集得超集都就是非频繁得;4、再扫描数据库,得出候选2-项集集合,再找出频繁2项集,并利用这些频繁项集集合来产生候选3-项集;5、重复扫描数据库,与最小支持度比较,产生更高层次得频繁项集,再从该集合里产生下一级候选项集,直到不再产

8、生新得候选项集为止。2、开发环境.3.1软件环境 (1)编程软件:Jdk开发包cipse集成开发环境 Elpse 就是一个开放源代码得、基于ava得可扩展开发平台。就其本身而言,它只就是一个框架与一组服务,用于通过插件组件构建开发环境。幸运得就是,Ecpse 附带了一个标准得插件集,包括Jv开发工具(Jav Deveopment Kit,JD)。 (2)数据库软件:LSerer 08SQL Srver2008 在icoft得数据平台上发布,可以组织管理任何数据。可以将结构化、半结构化与非结构化文档得数据直接存储到数据库中。可以对数据进行查询、搜索、同步、报告与分析之类得操作。数据可以存储在各种

9、设备上,从数据中心最大得服务器一直到桌面计算机与移动设备,它都可以控制数据而不用管数据存储在哪里。 (3)办公软件:Exl 010 xe就是一款试算表办公软件。它就是微软办公套装软件offic得重要得组成部分,它就是集统计分析、数据处理与辅助决策等功能于一身,现在金融、统计财经、管理等众多领域广泛应用。本实验主要用来为固定数据量改变最小支持数以及固定最小支持数改变数据量两种情况进行时间分析提供可视化图表。2.3.硬件环境装有Wndow 旗舰版电脑。2、4本章小结本章得内容主要就是为了引出本实验得主要算法以及对算法得实现环境做了介绍。 算法得设计3、1 priori算法整体框架图、1 piri实

10、验流程图3、2主要得数据结构与函数、2、1 数据结构clasTrnsction publiinid;pblicString temet;该类表示表中得一条记录。clss aopbc rayLsTrasaon Query(tring q)该类用于访问数据库操作。cls Kfppublc char fpstr=newhapor、EMSE;pulicit index=-1;pubicint supo=0;pbic boolean ifp=tru;该类代表一个频繁项目。3、2、2 主要得程序Java 中最常用得集合类就是ist与Mp。 List 得具体实现包括 Araist 与 Vctor,它们就是可

11、变大小得列表,比较适合构建、存储与操作任何类型对象得元素列表。 List 适用于按数值索引访问元素得情形。HasMap:Ma接口得常用实现类,系统当成一个整体进行处理,系统总就是根据Hsh算法来计算key,vale得存储位置,这样可以保证能快速存、取 ap得key,vlue对。ArLi alTrasacions:保存表中得所有记录AraListKfpalfpl:临时存储频繁项目得集合,存储连接后得结果rrayList ueFpserio:保存频繁k-1项集AraList noFpList:保存一定不就是频繁项目得集合,用于剪枝HaMapalTsctionsnll;rrListalfp=ull;

12、ArayLstStrn notFpListnull;AraListKfp Fst=nu;AraLst SurFsetrio=null;sMapString,ntger fpSupprt=nul;ArrayLitStrig lsurekpstr=nul;Hashap ualiaizenul;ArayLisString isadarrtring=null;in AxArr=nll;puic tatc oiain(Srng ars) rrA=newApiori();pbli Apii()Jan up=ew Jal(new Gridayou(2, 1));Panel pupnew JPel(n Gid

13、Layo(1, ISZE);/Field exFile=new TextFielIMSIZE;/for(inti=0;ITMSZ;i+)/txtFildmein eFied();/u、ad(txtFidamei);/c1=ewJbel( 数);pup、dd(c);c2ne JLabel( 据);p_u、dd(c2);c3ew Label( 挖);up_up、add(c3);c4newJLabl( 掘);pu、ad(c4);c5=e Je( 实);uup、add(c);6=new JLal( 验);upup、add(c6);c7neJLal( -);p_p、add(c7);c8ne JLbel(

14、 Apir);pup、ad(c8);up_do=w Pane(new GridLyut(1, 2));up_dw_lft=nwJPanel(ew rdLayou(1, 4);nflabel=newJLael(可信度:);c=new JextField();onf、setText(0、);upotlaelnew JLbl(支持度:);suppot=ew TextFiel();spt、stText(0、2);u_n_lft、add(cnlael);p_own_ft、add(cof);u_don_lft、d(sportbel);u_dow_let、ad(support);up_donrigtnew

15、Panl(ne GridLaout(,2));joBoxDteSi= Jbox();/下拉框jboBxDate、addItem(tet);jboBoDateize、addIt(aa1);boBxateSe、addItem(data2);joBxDateSze、addItm(dta3);jbBDateSze、addItem(dat4);joBoxDateSize、addItem(data5);jboBDateSze、adActionistenr(hs);jButtnMinenew JButton(开始挖掘);uttnMe、ddcionLitne(ths);udorght、add(jboBoxDt

16、eSi);u_down_rit、dd(jButtonMie);up_own、ad(_ownlft);updown、add(updown_rigt);up、add(up_up);up、add(up_dw);dow=ne an(ne derLayou() ;textrea=ne TextAa();/textAr、stFot(ne Fot(Font、IALO,Ft、TALIC , 20);extAea、setFont(nFont(Fot、DILOG,Font、LI , 20));down、ad(textArea);this、setyout(nw ordeayou();this、setSi(FMWDT

17、H,FRMEHEGHT);this、setLon(0, 1);this、stSize(tis、FAMEWIDT,ti、RAMEHGHT);ths、sDefautloseOprio(JFame、XIT_N_COSE);tis、settle(Airi);/、etze(his、FRMEWIDT, 100);ths、add(u,BorderLout、NORTH);/do、stLocain(0,100);/d、seSie(his、FRAMEWITH, thi、FRAMHI-10);ths、a(down);ts、setisible(rue);pulic void IntDate(Stri tae)fpst

18、ep=1;AxArr=new iTEMSIE+ITMSIZE+1;aKnewArrayLst();otFpLit=ew AraitStg();SureFpsetewArrayListKfp();SureFetPri=eAraystK();d=new Dao();fpSupport=newHashMa();luekfpstrnew ArayLstig();guanangu=new HhM();isddarStrinsnew rrayLttring();alTransactinsdao、ey(seec romtale);this、DteizealTransctos、sie();blicvoi So

19、wkFp(ArayList urFpset)int septemp=ptep;extAra、apped(频繁+(stptemp)+项集rn);Sym、out、prinln();or(int i=0;iSureFpset、sie();+)Kfp k=Surepet、ge();nt tmpinx=k、indx;ting string=Strng、coyValeOf(k、kfpsr, 0, +tempindx);int sppoKfpuppo、get(sring);textAre、pend(trin-+suport+-+upport/Daei+rn);/stem、ut、print(strng);pu

20、blc vid ShowF(ashp SreFpset)txtAr、append(关联规则rn);SetSng kes=(StStrig)SurFps、kySet();fr(Strg keytrn:ke)xtArea、pend(keyStrng+-uree、gt(keyStrig)rn);blicvod DatMine()i pstetem=;if(fptep = 1)fr(int i0;iApriori、TMSI;i+)Kf kfp=newKfp();kfp、pstr+p、index=(char)(a+i);kp、uport=0;kfp、isfalse;alKps、add(kf);DealS

21、upport();avNotpBuppor();SaveSureFp();Showkp(lKfp);pstep+;hile(!lfps、isEmy()alKfps、lea();fr (int i = ; repset、siz(); i+)Kp k1 = SueFs、ge(i);fr (ntj = i1; jaStrings=bSet、dplySube1(tring、tChrArray();inp=0;fo(;palSrins、sie();p+)Strin stng=alSting、et(p);f(noFpLis、contains(strin)beak;f(!alStigs、size())cni

22、ue;if (!iadarSrings、otin(strn))isaddartig、add(sring);aKps、a(resltp);ureFpstPrio、clr();for(in i=0;iureFpe、sze();i+)eFpetPrio、add(SureFpet、get(i));Gulanguiz();SureFpset、clear();Deaupport();SaeNotFySupor();/Cu();i (!aKfps、isEmty())SavereF();ShwkFp(SureFet);fpstep+;pubic voi Guanlnge()o(int i=0;ieFsPrio

23、、sze();+)Kfk=SureFpePri、g(i);iten = k、dex;Stng strinSrg、cpylueOf(k、kp, ,en1);if(!alsurekfps、cona(string))surpstr、add(tring);b s=newSuSet();or(inti=0;ialurepstr、sze();i+)Sting kfpstr=alsurefsr、get();cr kfpchar=fstr、tharay();ArrayListSting aList=s、Sut3(phararr,ktr、legt();for(intj=;jaLis、si();j+)Sring

24、guizetem=;tng kfpsr=aLit、g(j);har kfprarr=ftr1、tCharAry();itindxikf=0;nt indexinchrrr=;whle(indexifp kfpchaarr、lnth& ndexincarar1 ar1、let)if(kfpchrarr1ideichararr! kfpchrarridinkp)guizetep=gietem+kfpchararindxnk;ndexnkp+;elseindexincharar1+;indexinkf+;w(indeikf MinCnfi)Strintepkfpstr-+guizetem;guligue、pu(tem,suppt1/upport2);Showkp2(guanlianguiz);asurkfpsr、ear();gualiauize、cear();pubic oint(Kfp k,fp k2)Kfp reultKfp=new K();int temp_ln=k1、idx+1;har temp=new chartmpen;h tempnew charepen;

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服