收藏 分销(赏)

竞赛网站用户行为分析及服务推荐.pdf

上传人:曲**** 文档编号:231118 上传时间:2023-03-21 格式:PDF 页数:25 大小:1.16MB
下载 相关 举报
竞赛网站用户行为分析及服务推荐.pdf_第1页
第1页 / 共25页
竞赛网站用户行为分析及服务推荐.pdf_第2页
第2页 / 共25页
竞赛网站用户行为分析及服务推荐.pdf_第3页
第3页 / 共25页
竞赛网站用户行为分析及服务推荐.pdf_第4页
第4页 / 共25页
竞赛网站用户行为分析及服务推荐.pdf_第5页
第5页 / 共25页
点击查看更多>>
资源描述

1、专业综合设计说明书题目:竞赛网站用户行为分析及服务推荐姓 名:_学 院:专业班级:学 号:课 程:_指导教师:成 绩:_时间:2年l月日至2年月上日说 明1、专业综合设计进行期间,学生应按教学计划,将每天的学习情况(包括 学习内容、遇到问题及解决办法、心得体会等)如实进行记录。2、结束时,根据专业综合设计内容和学习记录书写报告。3、指导教师应综合考虑学生的学习态度、报告内容和实际操作情况等,给 出评语和成绩。专业综合设计报告撰写格式1、专业综合设计说明书用纸一律采用A4纸。打印正文用宋体小四号 字;版面页边距:上2.5cm,下2.5cm,左3cm,右2cm;页码用小五号字底 端居中;左边装订。

2、2、专业综合设计报告一般由以下几部分组成:A.任务书;B.目录;C.正文;D.参考文献;E.附录。3、报告正文撰写的题序层次格式:第一种第二种第一章(居中、小二号黑体字)1.(居中、小二号黑体字、)第一节(顶格、小三号黑体字)1.1(顶格、小三号黑体字)一(顶格、四号黑体字)1.1.1(顶格、四号黑体字)(一)(顶格、小四号黑体字)学专业综合设计任务书题目_竞赛网站用户行为分析及服务推荐_专业班级学号=112_姓名主要内容、基本要求、主要参考资料等:主要内容:1.Python编程基础2.Python数据分析与应用3.Python数据分析实训4.Python数据可视化5.案例:汽车销量数据可视化

3、分析6.案例:电子商务网站用户行为分析及服务推荐7.竞赛网站用户行为分析及服务推荐项目基本要求:1.掌握Python编程基础,熟练编辑代码,有良好的代码编写习惯2.掌握Python常用库分析核心思路,可以利用Python常用库对数据进行清洗与 预处理3.掌握常见的可视化分析图表,从数据中找到可分析内容并绘制图表4.掌握项目开发流程,能够独立完成完整分析项目5.了解Python进行人工智能推荐的流程6.了解企业项目开发、分析思路、文档编写汇报流程竞赛网站用户行为分析及服务推荐摘要随着计算机技术与通信技术的日益成熟和广泛应用,互联网自90年代初开始 得到迅猛发展,随之而来的是网上信息资源越来越丰富

4、,人们要在浩如烟海的互联 网信息世界中找到自己真正感兴趣信息却存在很大的困难,具体表现在:用户不知 道如何贴切表达真正想要的网上资源的需求,也不知道如何去更准确有效地寻找,即所谓“信息迷失”,对收集到的大量无关的信息难以消化,即所谓“信息过载”。虽然我们可以借助于搜索引擎来检索Web上的信息,但仍不能满足不同背景、不 同目的和不同时期的查询要求,因为大多数搜索引擎缺少主动性,没有考虑用户的 兴趣偏好和用户的不同,无法有效地解决信息过载和信息迷失的问题。关键词个性化推荐;相似度矩阵;函数构建目录摘要.1 项目介绍.1.1 项目背景1.2 项目目标2 项目内容.3 项目模型.错误!未定义书签。错误

5、!未定义书签。错误!未定义书签。错误!未定义书签。错误!未定义书签。错误!未定义书签。I3.1 数据探索与分析3.2 数据预处理.3.3 网址分类.3.4 模型构建.错误!未定义书签。错误!未定义书签。错误!未定义书签。错误!未定义书签。小结.错误!未定义书签。参考文献.错误!未定义书签。II1项目介绍1.1项目背景随着计算机技术与通信技术的日益成熟和广泛应用,互联网自90年代初开始 得到迅猛发展,随之而来的是网上信息资源越来越丰富,人们要在浩如烟海的互联 网信息世界中找到自己真正感兴趣信息却存在很大的困难,具体表现在:用户不知 道如何贴切表达真正想要的网上资源的需求,也不知道如何去更准确有效

6、地寻找,即所谓“信息迷失;,对收集到的大量无关的信息难以消化,即所谓“信息过载”。虽然我们可以借助于搜索引擎来检索Web上的信息,但仍不能满足不同背景、不 同目的和不同时期的查询要求,因为大多数搜索引擎缺少主动性,没有考虑用户的 兴趣偏好和用户的不同,无法有效地解决信息过载和信息迷失的问题。为了适应用户不断增长的信息需求,有效地解决信息过载和信息迷失给人们 带来的种种问题,研究人员纷纷从人工智能中寻找突破口。在许多探索性研究中,个性化推荐服务作为一种崭新的智能信息服务方式,应用前景广泛,十分引人注目。与搜索引擎不同,推荐系统并不需要用户提供明确的需求,而是通过分析用户的历 史行为,根据用户的行

7、为主动推荐能够满足他们兴趣和需求的信息。因此,对于用 户而言推荐系统和搜索引擎是两个互补的工具。搜索引擎满足有明确目的的用户 需求,而推荐系统能够帮助用户发现感兴趣的内容。因此,在电子商务领域中推荐 技术可以起到以下作用:第一,帮助用户发现其感兴趣的物品,节省用户时间、提 升用户体验;第二,提高用户对电子商务网站的忠诚度,如果推荐系统能够准确地 发现用户的兴趣点,并将合适的资源推荐给用户,用户就会对该电子商务网站产生 依赖,从而建立稳定的企业忠实顾客群,提高用户满意度。本案例研究的对象是泰迪智能科技有限公司的泰迪杯竞赛网站,泰迪智能科 技是一家专门从事大数据挖掘研发、咨询和培训服务的高科技企业

8、。泰迪杯竞赛网 致力于为用户提供丰富的泰迪杯竞赛信息、数据挖掘培训咨询,为参赛者提供了往 届优秀作品作为参考,为高校提供了丰富的教学资源,如:案例教程、教学视频、教学书籍、建模工具等。随着网站访问量的增大,数据信息量也在大幅度增长。用 户在面对大量信息时无法及时从中获取自己需要的信息,对信息的使用效率越来 越低。这种浏览大量无关信息的过程,造成了用户需要花费大量的时间才能找到自 己需要的信息。为了能更好地满足用户需求,依据其网站海量的数据,研究用户的 兴趣偏好,分析用户的需求和行为,发现用户的兴趣点。引导用户发现自己的信息 需求,将网页精准推荐给所需用户,帮助用户发现他们感兴趣但很难发现的网页

9、信,目、O目前,该竞赛网站已经存在部分推荐,如当点击教学资源时可以在网页的左边 栏目发现如下的推荐。但这样的推荐是比较粗放的,目前还不能根据用户的浏览行 为精准的推荐,不能满足用户的个性化需求,基于此背景下,本案例采用协同过滤 和关联规则算法建立推荐模型,给用户提供精准的智能推荐服务。1.2项目目标(D.借助大量用户的访问记录,发现用户的访问行为习惯,对不同需求的用户 进行相关服务页面的推荐。(2).根据用户访问内容、访问次数等属性特征,深入了解用户对访问网站的行 为和目的及关心的内容。2项目内容任务清单:TASK1:数据探索与分析TASK1.1读取用户访问数据TASK1.2提取所需要的字段以

10、及以jhtml结尾的网址TASK1.3网址规整化(将网址补充完整、去除含有“”的网址去除主页类网 址)TASK1.4删除content_id的取值既不是NA,也不在100999之间的记录TASK2:数据预处理TASK2.1将网址中 改成7TASK2.2 将网页中的/.jhtml 改成.jhtm 1 TASK2.3将网址中的 jmg/改成jmgj/TASK2.4将网址与内容对应2TASK3网址分类TASK3.1对网址进行处理,以!符合划分网址,获得其类别TASK3.2对每个list型的数据,将其组合成数据框的格式TASK3.3构造新的属性labelTASK3.4对各类网址进行分类TASK4模型构

11、建TASK4.1建模前数据准备TASK4.2模型构建物品相似度矩阵TASK4.3模型推荐TASK4.4模型性能评价3项目模型3.1 数据探索与分析(1)读取用户访问数据读取用户访问数据代码如下:setwd(E:smart)user_cluster-read.csv(E:/smart/user_cluster.csv,header=T)tipdm.data-user_cluster,c(content_id,page_path,userid,sessionid)运行结果如图3-1、3-2、3-3所示idcontent_idpage_pathusernameuserid11/zytj/irdex.

12、jhtml22/zytj/irdex.jhtnnl33/xtxm/incex.jhtml44614/nctice/614.jhtml55626/stpj/626.jhtml66/thirdtipdm/indexjhtml77/zytj/irdex.jhtml3图3-1读取用户访问数据的结果sessionidipDE80E7C9835F8AB1A38196185305=DBC218.28.23,137ED095CA37D328D1404124B49B8CAFB9F218.28.23.137773F9B491EF1027B76698C489DEB9D39188.165.225,224E321444

13、06C1 D=AB298F=467786A-iZ9D18-3.153.214,152FBD4EB0F3E6390A9399732230DE51AD18-3.153206203430EF037E5CD8A3831E78293DD2CED3111206.36.19CDAFE54767E2AAEFEE513F48B161CCA4218.28.23.137图3-2读取用户访问数据的结果content.idpage_pathuseridsessionid1/zytj/irdex.jhtmlDE80E739835F8AB1A38196185B05FDBC2/zytj/irdex.jhtmlED095CA3

14、7DB28D1404124B49&8CAFB9:3/xtxm/index.jhtml773F9B491EF1027B76698C489DEB9DB94614/notice/614.jhtmlE32144406C1DEAB298FE4677 弘 6A449D5626/stpj/626JbtmlFBD4EB0F3E6390A493997B22B0DE51AD6/thirdtipdm/index.jhtmlO430EF0B7E5CD8A3831E78290DD2CED37/zytj/irdex.jhtmlCDAFE54767E2AAEFEE513F48B161CCA48/zytj/irdex.jht

15、mlCDAFE54767E2AAEFEE513F48B161CCA49667/jxsp/667JhtmlCDAFE54767E2AAEFEE513F48B161CCA410667/jxsp/667jhtmlCDAFE54767E2AAEFEE513F48B161CCA411/D934F705D6F30C2F4C9CF50C4AB4B19312758/notice/758.jhtmlD934F705D6F30C2F4C9CF50C4AB4B19313758/notice/758.jhtmlD934F705D6F30C2F4C9CF50C4AB4B19314/jszz/index.;htmiD93

16、4F705D6F30C2F4C9CF50C4AB4B193/rri on,图3-3读取用户访问数据的结果(2)提取所需要的字段以及以jhtml结尾的网址 提取的代码如下:jhtml.page-tipdm.datagrep(jhtml,user_cluster,page_path,value=F),运行结果如图3-4所示4content_idpage_pathuseridsession id1/zytj/irdex.jhtmlDE80E709835F8AB1A38196185B05FDBC2/zytj/irdex.jhtmlED095CA37D328D1404124B4988CAFB9:3/xt

17、xrr/indexjhtml773F9B491EF1027B76698C489DEB9DB94614/notice/614.jhtmlE32144406C1DEAB298FE4677846A4Z9D5626/stpj/626JhtmlFBD4EB0F3E6390A493997B22BCDE51AD6/thirdtipdm/indexjhtml0430EF087E5CD8A3831E7829ODD2CED37/zytj/irdex.jhtmlCDAFE54767E2AAEFEE513F48B161CCA48/zytj/irdex.jhtmlCDAFE54767E2AAEFEE513F48B161

18、CCA49667/jxsp/667.jhtmlCDAFE54767E2AAEFEE513F48B161CCA410667/jxsp/667.jhtmlCDAFE54767E2AAEFEE513F48B161CCA412758/notice/758.jhtmlD934F705D6F30C2F4C9CF50C4AB4B19313758/notice/758jhtmlD934F705D6F30C2F4C9CF50C4AB4B19314/jszz/index.;htmlD934F705D6F30C2FC9CF50C4AB4B19B16758/notice/758.jhtmlDCD646D8C7EC4A

19、6B34A4C56B81BB190317/index.jhtmlCDAFE54767E2AAEFEE513F48B161CCA4图3-4提取所需要的字段以及以jhtml结尾的网址的结果(3)网址规整化(将网址补充完整、去除含有“”的网址、去除主页类网址)规整化代码如下:jhtml.page,page_path-pasteO(tipdm.org,jhtml.page,page_path)jhtml.page-jhtml.page-grep(tipdm.org/index.jhtml,jhtml.page,page_path,value=F),jhtml.page-jhtml.page-grep(

20、%,jhtml.page,page_path,value=F),运行结果如图3-5所示contentjdpage_pathuseridsessionid1tipdm.org/zytj/irdex.jhtmlDE80E7C9835F8AB1A38196185B05=DBC2tipdm.org/zytj/index.jhtmlED095CA37DB28D1404124B49S8CAFB9F3tipdm.org/xTxrr/indexJbtrr773F9B491EF1027B76698C489DEB9D394614tipdm.org/nctice/614 htm IE32-44406C1 DEAB2

21、98FE467786A9D5626tipdm.org/stpy/626JbtfrlFBD4EB0F3E639CA-i93997B223CDE51AD6tipdm.org/tbirdtipdm/irdexjhtml3430EFC87E5CD8A3831E78290D22CE237tipdm.org/zytj/irdex.jhtmlCDAFE54767E2AAEFEE513F48B161CCA48tipdm.org/zytj/irdex.jhtmlCDAFE54767E2AAEFEE513F48B161CCA49667tipdm.org/jxsp/667JhtmlCDAFE54767E2AA5FE

22、E513F8B161CCA410667tipdm.org/jxsp/667亦 tm ICDAFE54767E2AAEFEE513F48B161CCA412758tipdm.org/nctice/758JhtmlD934F705D6F30C2F4C9CF50C4AB4B19B13758tipdm.org/nctice/758vhtmlD934F705D6F30C2F4C9CF50C4AB4319B14tipdm.org/jszz/indexjbtrrD934F705D6F30C2F4C9CF50C4AB4319316758tipdm.org/nct ce/TSShtmIDCD646D8C7EC4

23、A6&34A4C56B81 BB1903,cLC、LLL/r/rLf A LrL L.L C Y Z.LL A Jk5图3-5网址规整化的结果(4)删除content_id的取值既不是NA,也不在100999之间的记录删除的代码如下:content_id.nona-jhtml.pagewhich(is.na(jhtml.page,content_id)=F),content_id.isna-jhtml.pagewhich(is.na(jhtml.page,content_id)=T),num-which(content_id.nona,content_id1000)content_id.non

24、a-content_id.nona-num,jhtml.page 3F7212E716E9AFF46D18D485C44028690tipdm.org/tbirdtipdm/690.Jbtm479MF7212E716E9AFF46D18D485C44029614tipdm.org/nctice/614,;html0BE14E27E02EB96372A3E59A0B67877E30614tipdm.org/ncfce/614,;htm I0BE14E27E02EB96372A3E59A0367877E31758tipdm.org/nct ce/758,;htmI75D879DAFFESE3FDB

25、CADA76508E8AAEE32762tipdm.org/sJ/762jbtml4790F7212E716E9AFF46D18D485C44033623tipdm.org/ts/623JbtfrlM583EB6EB230F492F0711424424BC4F34649tipdm.org/nctice/649.;htmlAD2CBF5A3S3E3D764EECEF6BF950A3FD36654tipdm.org/ts/654JbtrrlB13E81E6FC8938737B2984C4E75EDDD037737tipdm.org/nctice/7377htm ID6CD955EF5C3237E9

26、EC3CF7AD1CD78C9图3-6删除content_id的取值的结果6content_idpage_pathuseridsession id1tipdm.org/zytj/indexjhtmiDES0E739835F8AB1A38196185B05FDBC2tipdm.org/zytj/indexjhtmlED095CA37DB28D1404124B49S8CAFB9F3tipdm.org/xtxm/indexjbtrr773F9B491EF1027B76698C489DEB9D396tipdm.org/tbircTpdm/irdexJhtmlO430EFC37E588A3831E782

27、9ODZ)2CEn37tipdm.org/zytj/indexjhtmlCDAFE54767E2AAEFEE513F48B161CCA48tipdm.org/zytj/indexjhtmlCDAFE54767E2AAEFEE513F48B161CCA414tipdm.org/jszz/indexjhtrrD934F705D6F30C2FC9CF50C4AB4B19318tipdm.org/zytj/irdex.Jhtm ICDAFE54767E2AAEFEE513F4SB1 61CCA419tipdm.org/jrrgLi/indexjhtrrCDAFE54767E2AAEFEE513F48B

28、161CCA421tipdm.org/stpj/irdexhtml78E04B27E87953CFFEF7E60BE3CCE3CC22tipdm.org/jszz/indexjhtrrD934F705D6F30C2FC9CF50C4AB4B19324tipdm.org/xtxrr/mcexjrtrr&CD2ZEF362335a6DDAFO9FD74B4943D225tipdm.org/yxzp/irdexjhtml479MF7212E716E9AFF46D18D485C44035tipdm.org/xtxm/indexjhtrrD5B23F626A47A977DC34457B21 5EB9FD

29、39tipdm.org/zytj/index.jhtm ICDAFE54767E2AAEFEE513F-48B161CCA440tipdm.org/ts/indexhtrrCDAFE54767E2AAEFEE513F4SB1 61CCA443tipdm.org/zytj/indexjhtmi8738CDAFE54767E2AAEFEE513F48B161CCA444tipdm.org/irforrration/indexjhtml8738CDAFE54767E2AAEFEE513F48B161CCA448tipdm.org/xtxrr/indexjhtrr8738CDAFE54767E2AAE

30、FEE513F48B161CCA454tipdm.org/zytj/irdex.Jhtm I8738CDAFE54767E2AAEFEE513F4SB161CCA464tip3m.org/zytj/indexjhtml8738CDAFE54767E2AAEFEE513F48B161CCA466tipdm.org/ts/indexjhtrr8738CDAFE54767E2AAEFEE513F48B161CCA467tipdm.org/zytj/index.jhtm IDFDFF2464D613-45CF23A1 EA98FDBC3D8图3-7删除content_id的取值的结果3.2 数据预处理

31、(1)将网址中 改成/代码如下:jhtml.page,page_path-gsub(7/,7,jhtml.page,page_path)结果如图4-1所示一 r 1 尸-1373NN333-7 51d-I51G3-ZSNV-I8msoT今321,OI1-11 NmasT 313 871图4-1将网址中改成7的结果(2)将网页中的/.jhtml改成.jhtml”7代码如下:jhtml.page,page_path-gsub(7.jhtml,.jhtml,jhtml.page,page_path)结果如图4-2所示contentjdpage_path4614tipcrr).crg/nctice/6

32、14,;htm5626tipGm.org/stpj/626jbtrr9667tipcm.org/jxsp/667Jhtm12758tipdm.crg/nctice/75Shtm20572tipcm.org/jrrg_i/572.jftml23464tipcrn.org/irfcrrr at or/464.Jttm26693tipcm.crg/thirc,:ipdm/693.;l trr32762tipam.crg/sj/762jbtrr?l33623tipdn.org/ts/623jbtnnl34649tipcm.org/ncti ce/649)htm36654tipcm.crg/ts/654

33、jrtrrl37737tipcm.org/nctice/737Jhtm38578tipcm.crg./ts/578jFtml476S8tioam.ora/si/638.ibtrrl图4-2将网页中的/.jhtml改成.的结果(3)将网址中的 jmg/改成jmgj/代码如下:jhtml.page,page_path-gsub(jmg/,jmgj/,jhtml.page,page_path)运行结果如图4-3所示contentjdpage_pathuseridsession id4614tipdm.org/notice/614JhtmlE32144406C1 DEAB298FE467786A9D5

34、626tipdm.org/stpj/626.jhtmlFBD4EB0F3E6390A493997B22B0DE51AD9667tipdm.orgjxsp/667JhtmlCDAFE54767E2AAEFEE513F4SB161CCA410667tipdm.org/jxsp/667JhtmlCDAFE54767E2AAEFEE513F48B161CCA412758tipdm.org/notice/758JhtmlD934F705D6F30C2F4C9CF50C4AB4319313758tipdm.org/notice/758.;htmlD934F705D6F30C2FC9CF50C4AB4319

35、316758tipdm.org/notice/758.;htmlDCD646D8C7EC4A6B04A4C56381BB190320572tipdm.org/jrrgj/572.jhtmlCDAFE54767E2AAEFEE513F4SB161CCA423464tipdm.org/irfcrT aton/464.;btnrD3D7D5C752792CD64E84W7A3BDDF27F26690tipdm.org/tbirdtipdm/Sbtrr47900F7212E716E9AFF46D18D485C4402869。tipdm.org/thirdtipdm/CO.Jhtrr47900F7212

36、E716E9AFF46D18D485C44029614tipdm.org/notice/614Jhtm I0BE14E27E02EB96372A3E59A0B67877E30614tipdm.org/nctice/614Jhtm I0BE14E27E02EB96372A3E59A0367877E图4-3将网址中的 jmg/改成jmgj/的结果8(4)将网址与内容一一对应代码如下:#对content_id.nona提取内容id,网址这两个属性并去重content.page-unique(content_id.nona,c(content_id,page_path)#对content.page按c

37、ontent.id统计,并将统计结果转化数据框content.count-as.data.frame(table(content.page,content_id)#找对计数大于1对应的content.id,并转化成数值型morethan 1.id 1),1)#使 content_id 与 page_path 一一对应for(i in 1:length(morethan 1.id)numl-which(content_id.nona$content_id=morethanl.idi)content_id.nonanuml,2-content_id.nonanum 1 1,2model.initd

38、atal-content_id.nona运行结果如图4-4所示 content_id page.pathuseridsessionid1tipdm.org/zytj/irdex.jhtmlDES0E7M835F8AB1A38196185B05FDBC2tipdm.org/zytj/irdex.jhtmlED095CA37D328D1404124B4988CAFB9:3tipdm.org/xtxrr/incexjbtrr773F9B491EF1027B76698C489DEB9D396tipdm.o rg/tbi rdtipdm/i r dex.jhtm IO430EF0B7E5CD8A3831

39、E78293DD2CED37tipcm.org/zytj/irdex.jhtmlCDAFE54767E2AA 三 F三E513F48B161CCA48tipdm.org/zytj/irdex.jhtmlCDAFE54767E2AAEFEE513F4SB161CCA414tipdm.orgjszz/incexjbtrrD934=r705D6F30C2F4C9CF50C4AB4B19B18tipdm.org/zytj/irdex.jhtmlCDAFE54767E2AAEFEE513F4SB161CCA419tipdm.org/jrrgj/indexjhtrrCDAFE54767E2AAEFEE51

40、3F4SB161CCA421tipcm.org/stpj/irdexhtml78E04B27E87953UFEF7E603E3CCE3CC22tipcm.org/jszz/incexjbtfrD934:z705D6F30C2F4C9CF50C4AB4B193图4-4将网址与内容一一对应的结果3.3网址分类(1)对网址进行处理,以!符合划分网址,获得其类别 web-strsplit(model.initdatal,page_path,/,fixed=T)9运行结果如图5-1所示O webl ist 46515List of l ength 46515inncharacter 3tipdm.org

41、 notice 614jhtmr2character 3tipdm.org stpj*626.jhtmr3character 3tipdm.org jxsp 667jhtml IWcharacter 3tipdm.org jxsp 667jhtmr5character 3tipdm.org notice 758jhtml 6character 3tipdm.org notice 758jhtml 7character 3tipdm.org notice 758jhtml 8character 3,tipdm.org jmgj 572,jhtmr9character 3tipdm.org inf

42、ormation 464jhtmrnoncharacter 3tipdm.org thirdtipdm 169O.jhtmrm叨character 3tipdm.org thirdtipdm 69O.jhtmr112ncharacter 3,tipdm.org notice 614jhtml 13character 3tipdm.org notice 614jhtml 14character 3tipdm.org notice 758jhtmr图5-1对网址进行处理的结果(2)对每个list型的数据,将其组合成数据框的格式代码如下:bine-ldply(web,rbind)构造新的属性labe

43、l代码如下:bine$label-rep(0,nrow(bine)(4)对各类网址进行分类代码如下:competition.label-c(jszz,stpj,qk,yxzp,cgal,firsttipdm,sm,td,secondti pdm,thirdtipdm,fourthtipdm,jingsa,kjxm,sdfasf)#竞赛类teaching.label-c(zytj,jmgj,yxsp,ts,information,asdf,dsjkf,jiao,ts,sjfxs,sjsdf)#教学资源类enterprise.label-c(xtxm,wjxq,zxns,qyal,zzszl)#企

44、业合作类notice-c(notices,sj,news,notice)#新闻动态类bine$labelwhich(bine,2%in%competition.label)-;bine$labelwhich(bine,2%in%teaching.label)教学资源bine$labelwhich(bine,2%in%enterprise.label)企业合作”bine$labelwhich(bine,2%in%notice)新闻动态model.data-model.initdatal,c(sessionid,page_path)model.data$user.id-as.numeric(mod

45、el.data$sessionid)#用户编号(user.id)model.data$label-bine,label#类标号(label)#提取各类的记录competition.input-model.datawhich(model.data,label=;W),c(user.id,page_path)teaching.input-modeLdatawhich(modeLdata,label=教学资源),c(user.id,page_path)enterprise.input-modeLdatawhich(modeLdata,label=企业合作),c(user.id,page_path)n

46、otice.input-modeLdatawhich(model.data,label=新闻动态),c(user.id,page_path)#导出样本表write.csv(competition.input,E:/smart/competition.input.csv,row.names=F)write.csv(teaching.input,E:/smart/teaching.input.csv,row.names=F)write.csv(enterprise.input,E:/smart/enterprise.input.csv,row.names=F)write.csv(notice.in

47、put,E:/smart/notice.input.csv,row.names=F)运行结果如图5-2所示11图5-2对各类网址进行分类的结果uisr.icl5SI 06-4t ifOCnn.or g/stpJ/626 Jttr rN81-4662t i m r g/tL i r u:ipci e/69。、L:r r2817 Q5 e.o r q/tL f r u:iQd E/69O二 L:r r78tiplm.or g/r t ir c*ipim/G93 tTr r1 i96041tip2m.or g/tclZ65Jhtm 16041tipcm.or Q/sr r ZTBGjr ttnn 1

48、123206sot*p3 m-o r g/tdZ 6 5 jhtm 16041t i p3 m.o r g/tciZ 6 5 Jhtm 113345697tipdm.or g/r tir aTipcjm/GTI、L:r r155t ip2m.or g/tcJ/5ejr itm 118437O&Opd jhitm 1190-453-43tipcm.or g/-r sttipcim/3SBJhtm 123-421-421t i q3 m.o r g/stpj/26J Ft r r2356912t i pd m.o r g/cq kZ7.29.jhtm“一 一 3.4模型构建(1)建模前数据准备代码

49、如下:setwd(E:smart)library(recommenderlab)competition.input-read.csv(E:/smart/competition.input.csv)teaching.input-read.csv(E:/smart/teaching.input.csv)competition.model-unique(competition.input)teaching.model-unique(teaching.input)competition.input.data-as(competition.model,binaryRatingMatrix)teachin

50、g.input.data-as(teaching.model,binaryRatingMatrix)#采用基于物品的协同过滤算法对模型进行建模,形成数据模型competition_re-Recommender(competition.input.data,method=IBCF)teaching_re-Recommender(teaching.input.data,method=IBCF)#利用模型对原始数据集进行预测并获得推荐长度分别为4、6的结果competition_p-predict(competition_re,competition.input.data,n=4)teaching_

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 应用文书 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服