ImageVerifierCode 换一换
格式:DOC , 页数:107 ,大小:1.29MB ,
资源ID:4725251      下载积分:20 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/4725251.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     留言反馈    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(电子游戏教学资源库的设计与实现模板.doc)为本站上传会员【精***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

电子游戏教学资源库的设计与实现模板.doc

1、电子游戏教学资源库的设计与实现96资料内容仅供参考,如有不当或者侵权,请联系本人改正或者删除。索取号: TP311/7.520 密级: 公 开 硕 士 学 位 论 文电子游戏教学资源库的设计与实现研究生:张辉指导教师:王蔚 教授培养单位:教育科学学院一级学科:教育学二级学科:教育技术学完成时间: 3月10日答辩时间:学位论文独创性声明本人郑重声明: 1、 坚持以”求实、 创新”的科学精神从事研究工作。2、 本论文是我个人在导师指导下进行的研究工作和取得的研究成果。3、 本论文中除引文外, 所有实验、 数据和有关材料均是真实的。4、 本论文中除引文和致谢的内容外, 不包含其它人或其它机构已经发表

2、或撰写过的研究成果。5、 其它同志对本研究所做的贡献均已在论文中作了声明并表示了谢意。作者签名: 日 期: 学位论文使用授权声明 本人完全了解南京师范大学有关保留、 使用学位论文的规定, 学校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版; 有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅; 有权将学位论文的内容编入有关数据库进行检索; 有权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。作者签名: 日 期: 目录摘要IAbstractII第一章 前言11.1论文研究背景及研究意义11.1.1相关概念界定11.1.2选题理由及研究意义

3、21.2研究现状分析41.2.1游戏式教育理论研究现状41.2.2主题式爬虫技术研究现状51.2.3信息抽取技术研究现状61.3研究内容61.4本文的组织结构7第二章 电子游戏资源分析92.1 CELTS标准92.1.1 CELTS简介92.1.2 教学资源建设规范与元数据标准102.2电子游戏教学资源库概述102.2.1电子游戏教学资源库102.2.2电子游戏资源112.3电子游戏资源元数据122.3.1页面特征分析122.3.2基于CELTS标准的电子游戏元数据142.4本章小结15第三章 电子游戏资源自动搜集的关键技术及改进163.1主题式爬虫163.1.1关键词库的设计173.1.2种

4、子库设计203.1.3 相关度判定203.1.4线程机制233.2电子游戏主题信息抽取243.2.1 Web信息抽取综述243.2.2电子游戏主题信息抽取方法273.3本章小节31第四章 电子游戏教学资源库原型设计324.1系统功能结构324.2系统设计334.3数据库设计354.4本章小结36第五章 实验设计及结果分析375.1实验设计375.2实验结果分析39总结与展望40参考文献41致谢44攻读硕士学位期间论文发表及科研情况43摘要”寓教于乐”的教育思想, 已经存在了千百年, 在互联网大行其道的今天, 电子游戏对青少年产生的影响越来越大。因此, 将一板一眼的教育活动与生动有趣的电子游戏有

5、机的结合起来, 实现”游戏者即学习者, 学习者即游戏者”的目标, 成了教育界新的研究热点。电子游戏, 经历了被教师、 家长从”堵”到”疏”的转变, 已越来越被教育者应用于教育, 电子游戏作为一种教学资源的口号也随之而出。互联网是一个信息量巨大的资源库, 富含大量的电子游戏资源。越来越多的教育者期望从这个庞大的资源库中搜集到自己所需要的电子游戏资源, 然而, 面对如此浩瀚的资源海洋, 从中寻找游戏资源变成了一件颇为复杂的事情, 在这种情况下, 我们以主题式爬虫技术、 信息抽取技术为基础, 提出了构建电子游戏教学资源库的设想, 并付诸实现, 旨在使此类资源能够充分被共享。本文经过对电子游戏类网站特

6、征的分析, 结合CELTS标准, 定义了描述一个电子游戏具体信息的”元数据”, 并构建了教育资源的核心部分电子游戏资源自动搜集系统, 用来抓取互联网上的电子游戏式页面, 同时按”元数据”的格式抽取出主题信息, 结构化存放在数据库中组建资源库。并提供一个用户交互的前台界面, 同时设计兼容量表测试与多元智能标注系统的接口模块, 为用户提供查询、 推送服务。其中具体研究了基于Web的电子游戏描述信息的自动搜集系统所涉及到的关键技术和系统的相关实现。包括用到的主题爬虫技术与基于Web的信息抽取技术。本课题的研究与开发, 为构建电子游戏教学资源库提供了一个新思路, 并实现了一个系统原型, 有利于将电子游

7、戏这种新资源应用于教学活动。关键词: 电子游戏资源, 主题爬虫, 信息抽取, 元数据AbstractThe thought of learning through playing has existed for thousands of years. Electronic games are playing more and more important role in Education through the popularity of the Internet. In the new situation, the combination of the e-games and the ed

8、ucation will be the focal point of the research. Teachers and parents never regard the e-games as a terrible thing. And the slogan of electronic games as a teaching resource comes out. The Internet is a tremendous amount of information resource database, which is rich in e-games resource. More and m

9、ore educators want to find these resources from the ”big” database; however, it is definitely difficult. In this case, we proposed to build a e-games teaching resource database using the focus crawler and the WEB information extraction technology. It will strive to organize educational games all ove

10、r the internet and provide a new way of making such resources can be fully shared.On the basis of some research work on the e-game sites, combined with the standard CELTS, we introduce an intelligent system for collecting e-game resources and define a concept of e-game-metadata. The system finds e-g

11、ame web pages and defines whether it is the pages we need through the Internet. According to the ”metadata” format, this system also extracts the information that the ”metadata” needs and stores them in our database. We also build a WEB interface for users and provide services for them.In this paper

12、, both of the key technologies and the function modules are described in detail. The research and development of this project has supplied a useable solution to build the e-game teaching resource database. Keywords: Electronic-game, resource, Focus crawler, Information extraction Metadata第一章 前言1.1 论

13、文研究背景及研究意义互联网是一个信息量巨大的资源库, 根据互联网调查公司Netcraft 11月份调查显示, 当前全球拥有正式网点总数( 申请了域名而且有内容的网点) 达到149, 784, 002个, 其中相当一部分网站被频繁访问, 而且一直保持更新1。这个庞大的资源库所包含的资源无论从种类上还是数量上正在以几何级增长。电子游戏, 经历了被教师、 家长从”堵”到”疏”的转变, 已越来越被教育者应用于教育, 将电子游戏作为一种教学资源的口号也随之而出。近年来, 国内外出现了许多电子游戏作为教学资源使用的例子, 美国国防部推出了一款名为美国陆军的游戏, 它强调”以团队精神、 价值和责任感来完成目

14、标”, 用以美军的日常单兵训练; 文明游戏曾经作为美国中学的教学内容之一; 模拟飞行, 多少飞行员的梦想从这里开始。与此同时, 国内的游戏教学市场也蓬勃发展起来, 各种类型的游戏教学主题网站如雨后春笋般出现在互联网上, 像将学科学习、 百科知识、 智力开发、 休闲娱乐等与网络游戏相结合的中国第一款大型网络教育游戏平台K12play快乐教育世界( ) , 中国教育服务网主办的、 面向小学生的VCM教育游戏频道( ) , 还有以培养孩子英语学习乐趣为主的南天门英语乐园( ) 等等都是反响不错的游戏类教学资源门户网, 提供了大量的电子游戏式教学资源。”教育游戏”这一名词开始被提出并广泛应用, 在国外

15、, 一般称教育游戏为”Edutainment”或”Educational Games”, 国内翻译成教育游戏、 教学游戏或学习型游戏。教育游戏产业研究报告把教育游戏定义为: 能够培养游戏使用者的知识、 技能、 智力、 情感、 态度、 价值观, 并具有一定教育意义的计算机游戏类软件2。当前, 网络上的电子游戏资源种类齐全、 数量繁多, 而且由于互联网即时更新的特性每天都在不断扩充。随着互联网的飞速发展, 越来越多的教育者期望从这个庞大的资源库中搜集到自己所需要的电子游戏资源, 然而, 面对如此浩瀚的资源海洋, 从中寻找游戏资源变成了一件颇为复杂的事情, 在这种情况下, 我们以主题式爬虫技术、 信

16、息抽取技术为基础, 提出了构建电子游戏教学资源库的设想, 并付诸实现, 旨在使此类资源能够充分被共享。1.1.1 相关概念界定本章节将对电子游戏、 电子游戏教学资源库及电子游戏资源作一个概念界定。自1971年第一台街机游戏机诞生于麻省理工学院以来, 在30年的时间内, 以电子游戏为代表的数字娱乐业已经从当初的一种边缘性的娱乐方式日益成为当前全球( 特别是发达国家) 娱乐的一种主流方式。电子游戏概念的出现就是在这个时候。 中国网页游戏产业发展报告中对电子游戏的定义为: 电子游戏是以电子媒介为载体的游戏程式3。当前, 电子游戏根据运行的硬件平台, 大致分为以下四类: 电视游戏、 电脑( PC) 游

17、戏、 手机游戏和街机游戏( 见图1-1) 。四类游戏之间, 以PC游戏发展得最为完善丰富。随着个人电脑的不断更新换代, PC游戏也分出了网络游戏和单机游戏两类。图1-1 电子游戏分类在这里, 本文研究的电子游戏主要是指随着电子科技发展而孕育产生的各种电子、 电脑游戏与伴随网络产生的网络游戏。教学资源库是指按照统一的符合国际标准的技术规范和课程内在逻辑关系构建的, 由全国优秀的数字化媒体素材、 知识点素材及示范性教学案例等教学基本素材构成的, 可不断扩充的开放式教学支持系统。文章中的电子游戏教学资源库是为教学、 科研提供丰富的、 多元化的”游戏式教学素材和学习资源”描述信息, 并以数据库的方式组

18、织、 存储、 管理, 以主题网站的形式向使用者提供查询交互、 资源推送等服务。用以引导电子游戏向健康的方向发展, 推进以资源库为代表的信息技术与学科的深入整合, 开拓教育领域新资源。资源库中的电子游戏资源并不是具体的电子游戏, 而是关于某个电子游戏资源的描述。对资源的描述信息主要来源于互联网中的网页资源, 这些网页包含了各种类型的电子游戏的描述信息, 比如游戏名称、 游戏介绍等。电子游戏教学资源库的核心功能是经过一个自主开发的电子游戏资源自动搜集系统完成的, 系统借助主题式爬虫技术从互联网中抓取具体的电子游戏网页, 借助信息抽取技术将抓取下来的网页中的诸如游戏名称、 游戏介绍、 原始URL等敏

19、感信息抽取出来, 结构化存放在数据库中并为用户提供各种类型的服务。关于电子游戏资源的具体内容, 笔者将在第2章详细介绍说明。1.1.2 选题理由及研究意义”寓教于乐”的教育思想, 已经存在了千百年, 在互联网大行其道的今天, 游戏特别是网络游戏对青少年产生的影响越来越大。因此, 将一板一眼的教育活动与生动有趣的电子游戏有机的结合起来, 实现”游戏者即学习者, 学习者即游戏者”的目标, 成了教育界新的研究热点。电子游戏, 经历了被教师、 家长从”堵”到”疏”的转变, 已越来越被教育者应用于教育, 电子游戏作为一种教学资源的口号也随之而出。由于电子游戏本身具有的教育潜质, 使得它能够作为一种教学资

20、源、 教学素材使用; 当今互联网条件下, 电子游戏种类繁多、 信息过量但星罗棋布, 迫切地需要一种系统使得此类资源被充分共享, 因此建设电子游戏教学资源库切实可行。1、 电子游戏在教学中有着独特的教育潜质, 电子游戏能够作为一种教学资源使用。电子游戏的教育潜质表现在以下三个方面: ( 1) 电子游戏提供了一种完善、 互动、 虚拟的学习环境。与传统的枯燥无味的教育活动不同, 数字化的今天, 游戏能够借助数字化虚拟手段为学习者创设一种游戏式的带有会话协作性、 竞争挑战性的学习环境, 在这里, 游戏者是绝正确中心, 有利于培养她们迅速而有效的学习能力和自我解决问题的能力。( 2) 电子游戏能够作为一

21、种知识载体与认知工具, 具有教化作用。游戏本身也能够作为一种知识载体, 一种很好的认知工具, 有利于培养游戏使用者的知识、 技能、 智力、 情感, 锻炼她们的思维能力和反应能力, 培养游戏使用者的态度和价值观。例如大航海时代这款游戏中就包含了大量的地理、 商业知识, 如果玩家没有相关知识很难通关。还有就是比较著名的日本光荣公司的三国志系列游戏。这一款游戏一直拥有广大的玩家群, 特别是80年代后出生的年轻人, 她们中的大多数对这段历史都没没什么非常浓厚的兴趣, 甚至不愿意去看四大名著。可是三国志系列游戏却让许多年轻人捧起了三国演义, 这不能不说是对玩家们起到了教育作用。电子游戏的教育潜质不但仅能

22、够以比较直接的方式实现教育目的的实例, 还能够从更深层上实现了教育的目的, 即经过游戏改变玩家们的人生观、 世界观。可是这类游戏需要借助人的引导才能真正的体现出它的教育意义。以经典游戏仙剑奇侠传为例, 其中主角李逍遥便是对”一诺千金”最好的解释, 不论对谁, 只要做出承诺便从不反悔。或许有些玩家会模仿游戏中人物的行为, 但这种模仿是盲目的, 我们显然并不能奢望涉世未深的孩子们能够从中领悟出人生观的深刻道理, 孩子们还需要家长的引导或启发。因此, 优秀的游戏从某种程度上来讲可传达一种人生观、 世界观, 实现教化作用。( 3) 游戏过程是一种创造的过程, 它本身极具诱惑力, 而且, 它拥有广阔的玩

23、家范围。电子游戏运用技术手段来表现现实的情况, 满足人们的幻想, 同时, 游戏过程即没有固定的模式也没有强制完成的结果, 充满了不确定性, 一切都需要游戏者自己完成去创造与众不同的游戏过程。因此有着广阔的玩家范围, 大量的潜在群体, 这些群体一般为儿童、 学生居多。以上这些都显示出游戏独特的教育特质。2、 当今互联网条件下, 游戏式教学资源种类繁多、 信息过量但星罗棋布, 不利于用户查找具体游戏资源, 建设电子游戏教学资源库能够有效的把它们聚合起来。近年来, 随着网络信息的迅速膨胀, 国内外出现了许多游戏作为教学资源使用的例子, 均提供了大量的电子游戏资源, 迫切需要一种能把分散在各地的游戏式

24、教学资源有效的聚合在一起的系统, 在这种情况下, 我们提出了构建电子游戏教学资源库的设想, 并付诸实现, 旨在使此类资源能够充分被共享。总之, 做好本课题有如下四个方面的意义: 首先, 建设电子游戏教学资源库为教师教学、 学生学习提供了一种新型资源库, 有利于电子游戏资源的整合。该资源库收集资源为游戏类教学资源, 针对性强。力求把分散在各地的游戏式教学资源聚合组织起来, 为教师教学和学生学习提供丰富、 优质的教学素材, 避免重复性劳动, 提高教育教学效果。其次, 资源库收集信息丰富, 为教学提供全面、 准确的电子游戏资源。采用主题式爬虫技术( Focus-Crawler) , 查找相关电子游戏

25、教学资源, 查全率与查准率高, 为游戏式教学提供服务。第三, 资源库游戏信息罗列清晰, 有利于用户的检索查询。该资源库经过信息抽取技术对蜘蛛程序下载的网页进行处理, 提取了电子游戏的游戏名称、 引用网址、 游戏介绍、 所属类型等相关属性, 逻辑性强, 信息丰富, 方便用户查询。同时, 它可扩充性强, 支持用户上传游戏资源, 推荐游戏站点, 支持玩家填写游戏心得。第四, 提供相关游戏推送, 有利于提高游戏玩家( 用户) 的智能。结合项目组开发的其它功能模块电子游戏多元智能标注模块与电子游戏多元智能量表评测模块, 对每个游戏添加多元智能标签, 为用户作多元智能测试, 向某项智能有缺憾的玩家用户作相

26、关游戏推送, 目的性强。1.2 研究现状分析电子游戏的教育意义很早就被一些国内外学者、 专家研究, 她们普遍认为游戏能够用来帮助学生学习, 使学习过程变得生动有趣, 从而调动学生的积极性。与此同时, 随着Internet的爆炸性增长, WWW已经发展成为包含多种信息资源、 站点遍布全球的巨大信息库。自从1991年诞生以来, 它已经发展为拥有上亿用户, 上百亿页面的大型分布式式信息空间, 而且这个数字仍以每4到6个月翻一倍的速度增加4。在互联网教育资源不断增长的同时, 如何快速、 准确、 方便的从中获取自己需要的信息, 是互联网用户面临的一个重要问题。资源获取的有效性和便捷性被提上日程。搜索引擎

27、的出现, 整合了众多站点信息, 为快速查询起到了信息导航的作用。信息的价值得到众多商家的认可, 成为互联网最有价值的领域。Google、 百度等都是通用搜索引擎的杰出代表, 为互联网的发展做出了重要贡献。可是, 用户使用这些搜索引擎的时候, 输入一个关键词往往会出现几万甚至几十万的查询页面, 其中不乏大量重复信息和垃圾信息, 这使得用户难以迅速找到符合她们要求的信息。因此, 如何对现有的搜索引擎技术改进, 并结合信息抽取技术, 使查询的结果符合用户的要求, 成为信息处理领域近期的研究热点。1.2.1 游戏式教育理论研究现状国外很早就有教育界学者着手研究如何利用游戏来帮助学生学习( Bowman

28、 1982; Amory et al 1999) , 她们认为游戏能够使得学习过程更有趣, 调动学生的主动性, 提高学习效率( Malone 1980) , 并能够使学生在”做”中”学”( Thiagarajan 1998; Kirriemuir & McFarlane ) , 从而提高学生解决问题的能力、 协作学习能力和其它学习能力( Whitebread 1987; Bruckman 1998) 。 Kirriemuir和McFarlane提出能够采用主流游戏的”清淡( Lite) ”版本给课堂教学使用, 也就是删除游戏中所有与教学不相关的内容。下面介绍一些具有代表性的游戏教学站点: FU

29、nbrain( ) 网站为各个年龄阶段的孩子提供按学科分类的在线交互小游戏; GameGOO( ) 这是依据美国各州小学二年级语言课课程标准制作的语言学习教学游戏网站; Learning planet( ) 这是一个商业性网站, 提供了很多从幼儿园到六年级的各科教学游戏等等。国内研究比较晚, 当前相关理论研究与产品开发正步入了正轨。为解决”教育性”与”游戏性”的平衡问题, 有关学者提出了”轻游戏”的概念。国家教育部”面向教育的电子游戏分级分类标准研究”项目, 主要考证电子游戏中的教育性, 建立电子游戏的教育评价体系并对游戏从教育角度进行分级分类研究。1.2.2 主题式爬虫技术研究现状本文研究的

30、电子游戏教学资源库主要采用主题式爬虫技术和信息抽取技术。当前, 主题式爬虫技术的研究发展迅速, 已经成为人们关注的热点。同时, 利用它搜索的结果再经过专业人士的加工而形成的面向某一学科、 领域的垂直搜索引擎也己经出现。面向主题的Web信息搜索策略主要有两种: 基于内容的搜索与基于链接分析的搜索。前者工作方式是先建立一个针对主题的关键词表, 爬行程序根据主题与链接文本的相似度来评价链接价值的高低。后者考虑到Web页面的半结构特征, 经过对网页之间的链接进行分析, 从而确定链接的重要性。下面介绍一些典型的主题式信息搜索系统: 1、 Elsevier的Scirus系统Scirus科学搜索引擎是一种专

31、为搜索高度相关的科学信息而设计的搜索引擎, 获得 搜索引擎观察授予的”最佳专业搜索引擎”奖。Scirus是当前互联网上最全面、 综合性最强的科技文献门户网站之一。它只面向包含有科学内容的网站, 如大学和作者个人主页以及Elsevier自己的数据库。2、 NEC研究院的CiteSeerCiteSeer是互联网上使用最广泛的针对计算机领域的科学论文检索系统。CiteSeer能够自动地对网上的电子文件( Postscript和PDF等格式) 进行索引并分类。3、 Berkeley的Focused Project该系统经过两个程序来指导爬行器: 一个分类器和一个净化器。前者用来计算下载文档与预订主题的

32、相关度; 后者用来确定那些指向很多相关资源的页面( 在HITS算法中, 称之为中心网页) 。在国内, 主题搜索技术的研究刚刚起步, 主要为一些大学的研究机构和一些搜索引擎公司, 比如北京化工大学就曾经推出过化工方面的专业搜索引擎, 还有像赛迪网( .com) 推出的中文IT垂直搜索引擎”IT罗盘”, 中国搜索( .com) 推出的行业搜索等。一些大型的通用搜索引擎, 百度、 Google等推出的图片搜索、 MP3搜索都能够看作是主题搜索技术的运用。1.2.3 信息抽取技术研究现状主题式搜索引擎作为一种信息检索系统, 它的输出为与游戏相关的网页信息, 然而用户关注的是更加准确、 更加详细、 更加

33、深层的专业信息, 而非仅仅是一些文档列表, 因此要进行基于这些主题网页的信息抽取。信息抽取( Information Extraction, IE) 是信息检索的进一步发展, 是指从非结构化和半结构化的文本中抽取出用户所感兴趣的信息( 本系统抽取的是游戏名称与游戏内容) , 形成结构化的信息并存入数据库, 供用户查询和使用的过程。国外的信息抽取技术研究始于20世纪60年代中期, 主要从自然语言中获取结构化信息, 它以美国纽约大学和耶鲁大学的两个长期的、 研究性的自然语言处理项目为代表。20世纪80年代末, 由于消息理解系列会议( MUC, Message Understanding Confe

34、rence) 的推动, 信息提取研究蓬勃开展起来。MUC系列会议使信息抽取发展成为自然语言处理领域一个重要分支, 并一直推动这一领域的研究向前发展。近几年, 信息抽取技术在研究方面, 主要侧重于以下几个方面: 利用机器学习技术增强系统的可移植能力、 探索深层理解技术、 篇章分析技术、 多语言文本处理能力、 Web信息抽取( Wrapper) 以及对时间信息的处理等等。在应用方面, 信息抽取应用的领域更加广泛, 除自成系统以外, 还往往与其它文档处理技术结合建立功能强大的信息服务系统。国内方面, 中文信息抽取方面的研究起步较晚, 主要的研究工作集中在对中文命名实体的识别方面, 在设计实现完整的中

35、文信息抽取系统方面还处在探索阶段。近年来国内外涌现了多种信息抽取方法, 根据自动化程度能够分为人工方式的信息抽取、 半自动方式的信息抽取和全自动方式的信息抽取三大类; 根据抽取原理和抽取方式的不同能够大致分为以下5类: 基于自然语言处理方式的信息抽取、 包装器归纳方式的信息抽取、 基于Ontology方式的信息抽取、 基于HTML结构的信息抽取和基于Web查询的信息抽取。这些方法各有侧重地解决了上述Web信息抽取中面临的问题, 总体上取得了良好的效果, 但在某些方面存在不同程度的局限或缺陷。因此, 为了更好地解决从已有的游戏网页上获取游戏元数据信息, 有必要对Web信息抽取问题作进一步研究。1

36、.3 研究内容经过本课题的研究, 设计并实现电子游戏教学资源库。电子游戏教学资源库的核心实际上是一个电子游戏资源自动搜集系统, 它包括前台和后台两个部分。前台部分方便与用户交互, 支持用户查询电子游戏、 上传游戏的功能。同时, 设计兼容由项目组自主开发的其它模块量表测试与多元智能标注系统的接口模块相关功能由全国教育科学”十五”规划教育部重点基金项目”面向教育的电子游戏分级分类标准研究”( 项目编号: DCA050056) 项目组实现。, 为用户提供相关游戏推送服务。后台部分由网络爬虫模块( eGameCrawler) 与游戏主题信息抽取模块组成。网络爬虫模块下载电子游戏相关的网页, 存入一级数

37、据库( DateBase1) 保存, 供游戏主题信息抽取模块提取出敏感信息, 主要包括游戏名称、 游戏介绍、 游戏出处等, 存入二级数据库( DB2) , 然后再由我们项目组自主开发的电子游戏多元智能标注系统对各个游戏打上多元智能标签, 向某项智能有缺憾的玩家用户作相关游戏推送5, 如图1-2所示。图1-2 内容构架具体研究内容包括以下四个步骤: 1、 对游戏式样本网页的特征分析, 摘录部分关键词, 选择种子url, 制定规则集与定义游戏元数据结构。2、 基于主题爬虫( focus-crawler) 技术的网络爬虫模块设计, 收集并下载游戏式教学资源原始网页信息, 入数据库1( DB1) 保存

38、。包括三个方面: 定义关于游戏的原始数据结构, 将游戏的名称、 简单介绍、 源URL等作为描述一个具体游戏的元数据; 主题词库与种子库设计; 文本网页主题相关度计算等。3、 游戏主题信息抽取模块设计, 对DB1保存的原始网页进行处理, 抽取主题信息, 初步设计提取出游戏名称、 游戏介绍等, 存入数据库2( DB2) 。 分析网页特征, 制定规则集, 比如游戏名称往往为页面中最大的字号、 粗体或带书名号; 又如游戏介绍的文本一般前面都包含”游戏说明”、 ”游戏介绍”、 ”操作指南”等。 网页预处理, DOM树转换、 去除广告等无关信息; 根据规则集对DB1中的网页进行基于游戏原始数据结构的信息抽

39、取。4、 前台用户交互设计。以门户网站形式建立, 提供用户接口, 供用户查询检索游戏资源。同时在前台设计兼容多元智能标注模块与量表评测模块的部分。1.4 本文的组织结构本文共分五章, 文章的组织结构如下: 第一章”前言”部分主要介绍了论文研究背景及意义、 电子游戏等相关概念的界定、 国内外研究现状分析、 电子游戏教学资源库原型系统的基本架构、 本文的研究内容以及论文的组织结构。第二章”电子游戏资源分析”部分, 对资源库中的电子游戏资源做了具体介绍, 同时也介绍了建设资源库时符合的标准。经过对页面特征的分析提出了电子游戏资源的元数据。第三章”电子游戏资源自动搜集的关键技术及改进”部分主要介绍了主

40、题式爬虫, 信息抽取的关键技术, 以及对相关技术的改进。第四章”电子游戏教学资源库原型设计”, 介绍了教学资源库系统的结构图, 并给出了系统中部分程序的运行界面图以及数据库设计等。第五章”实验设计及结果分析”部分对系统的稳定性、 可用性、 受压力性进行了测试, 根据结果找出系统改进的方向; 经过查全率与查准率对系统提取的结果进行实验分析。第二章 电子游戏资源分析随着互联网技术向宽带、 高速、 多媒体方向的发展, 网络教育已经完美地承继了广播、 电视等教育方式的优点, 同时又凭借其信息形式多样性的特点, 把获取信息的途径由教室、 实验室和图书馆, 扩展到因特网所覆盖的任何场所, 为渴望获取知识的

41、人们提供了更多的选择。然而, 网络只是信息传播的载体, 信息资源的汲取和共享才是人们使用网络的目的所在。要发挥网络教育的优势, 就必须有丰富的教学信息资源支持。因此, 发展网络教育的核心应是网络化信息资源库的建设6。自从AECT94定义传到中国, 中国辽阔的土地上就揭开了建设教育教学资源库的新篇章, 近两年更是掀起了建设的新高潮, 从国家基础教育资源库到各省电教馆开发的新课程教育资源库, 从K12教育资源库到浙大教育资源库、 科利华教育资源库, 不下几十家。教学资源建设是教育信息化的基础, 是需要长期建设与维护的系统工程。由于教学资源的复杂性和多样性, 使得人们对它的理解各不相同, 会出现大量

42、不同层次、 不同属性的教育资源, 因而不易于管理和利用。为了更有效地建设好各级各类教育资源库, 促进各资源库系统之间的数据共享, 提高教育资源检索的效率与准确度, 保证资源建设的质量, 资源库对资源的描述必须遵循一定的标准与规范。我们对电子游戏资源库的建设遵循CELTS标准体系, 该标准体系是由中国信息技术标准化技术委员会教育技术分委员会研制的, 相关标准内容将会在2.1节详细介绍。根据CELTS标准体系, 我们对电子游戏资源进行了仔细分析, 确定了描述该资源的相关元素, 制定了基于电子游戏资源的元数据结构。本章2.1节主要介绍了资源库中描述电子游戏资源应遵循的标准CELTS体系; 2.2节介

43、绍了电子游戏教学资源库, 并对库中的电子游戏资源进行了分析; 2.3节介绍了描述电子游戏资源的元数据结构。2.1 CELTS标准2.1.1 CELTS简介20世纪末随着信息技术的飞速发展, 信息化教育应运而生并蓬勃发展起来, 各种类型的教育资源建设越来越受到重视。近年来, 中国各级教育部门、 各级学校以及一些软件开发公司开发了不少的教育资源, 诸如媒体素材、 课件、 题库、 网络课程、 学科主题网站等不同形式的教育资源活跃在互联网上, 促进了中国信息化教育资源的建设和发展。然而, 在实际应用中, 人们也发现教育资源在建设、 组织和管理方面存在一些问题。如: 各单位在开发教育资源时采用的标准不一

44、致, 在资源库的结构、 资源类型、 资源属性等方面缺乏规范。这使得资源不易管理和利用, 各个平台、 系统之间无法交换和共享资源, 许多同类资源重复建设, 造成人力物力上的浪费。在这种大背景下, 中国信息技术标准化技术委员会教育技术分委员会经过分析国际标准工作, 参照IEEE 1484标准, 并根据中国教育实际情况编写了CELTS标准体系。CELTS( Chinese e-Learning Technology Standardization) , 即中国网络教育技术标准体系, 由5类标准项目组成: 指导性标准、 学习资源相关标准、 学习环境相关标准、 学习者相关标准、 教育管理相关标准。到当前

45、为止, 已立项的标准草案项目36项, 其中国家标准化管理委员会立项18项, 已完成并发布的国家标准3项7。在这个标准体系里, 通用规范( 编号小于40) 具有广泛的适用面, 给标准用户留有较多的发展余地, 允许她们在遵从统一的基本框架下选择及改制一些数据项目; 专用规范( 编号为40以后) 是针对某一特定领域的或给出特定的实现方法, 具有更强的约束力。2.1.2 教学资源建设规范与元数据标准CELTS标准体系中, 我们教学资源库建设参照的标准主要有教育资源建设规范( CELTS-41) 、 学习对象元数据( CELTS-3) 和基础教育资源元数据应用规范( CELTS-42) , 它们同属于学

46、习资源类相关标准8。CELTS-41侧重点在于统一资源开发者的开发行为、 开发资源的制作要求、 管理系统的功能要求等; CELTS-3和CELTS-42主要是规范资源对象的元数据标准。”教育资源建设规范( CELTS-41) ”规定, 教育资源建设能够有四个层次的含义, 一是素材类教育资源建设, 主要分八大类: 媒体素材、 试题、 试卷、 文献资料、 课件、 案例、 常见问题解答和资源目录索引; 二是网络课程建设; 三是资源建设的评价; 四是教育资源管理系统的开发; 在这四个层次中, 网络课程和素材类教育资源建设是基础, 是需要规范的重点和核心。”学习对象元数据规范( CELTS-3) ”是针

47、对教育资源的元数据规范。所谓学习对象是指任何具有重用特性并用来支持学习的数字化资源9。元数据是指关于数据的数据( Data to data) , 它的作用在于描述数据资源的关键属性, 以便于资源的检索查询。规范中定义了大量的项目, 共9类80多项, 这些项目规定了该如何描述学习对象, 即应对资源的哪些属性进行描述, 这些属性该如何表示等等。为学习者和教育者等查找、 评估、 获取和使用学习对象提供支持。”基础教育资源元数据应用规范( CELTS-42) ”是在CELTS-3的基础上, 结合中国基础教育的实际, 定义的一组面向基础教育的教学资源元数据元素。其主要目的是为各单位开发网络教育资源而制定开发的指导规范, 使各学校开发的资源能够在大范围内共享。同CELTS-3相比, CELTS-42更具体。CELTS-3定义的是一种概念上的数据模型, 针对通用学习对象进行定义, 较为宏观, 指导面广。CELTS-42) 则针对中国基础教育, 具有本土化色彩, 符合国内资源建设的现状, 可操作性强。2.2 电子游戏教学资源

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服