1、 毕业设计(论文) 设计(论文)题目: 基于应用本体的个性化 E-learning系统的研究与应用 学生姓名: 学生学号: 专业班级: 指导老师: 系主任(院长): 年 5 月 25 日 毕业论文
2、 毕业论文 第 50 页 毕业论文原创性声明 本人郑重声明:所呈交的论文是本人在老师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。 学生签名: 日期:200 年 月 日 毕业论文版权使用授权书 本毕业论文作者完全了解学校有关保留、使用论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人
3、授权湖南大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本论文。 本论文属于 1、保密 ,在______年解密后适用本授权书。 2、不保密√。 (请在以上相应方框内打“√”) 学 生签名: 日期:200 年 月 日 指导教师签名: 日期:200 年 月 日 基于应用本体的个性化E-learning系统研究与应用 摘 要 随着Internet的迅速发展和全球对终身教育的需求,以异步教育方式为主要特征的E-learning正成为Internet上的一种重要应用,
4、它使不同时间、不同地点的人们开展高效率的学习成为可能。 但是,传统的网络学习系统往往以系统自身为中心,并没有充分考虑用户的个性化需求,要求人来适应系统而不是系统去适应用户,没有充分按照学生的个人学习特点来进行教育,所以造成了交互性差、学习效果不明显等诸多问题。这些问题的解决都要求语义采用明确、一致的方式表达。元数据标准是为了统一资源的描述而提出的规范,本体是为了解决语义问题、实现某种程度的共享与重用而提出的技术,因此,本文使用元数据和本体从学习资源的描述、组织及基于语义的学习资源查询等方面来解决上述问题。主要研究内容如下:: 1、个性化实现。通过个性化学习问卷调查的结果分析,主要通过学习策
5、略推荐机制、资源浏览记录机制、资源质量评价机制、测试机制及历史学习记录机制等实现个性化学习。 2. 元数据标准。为了统一学习资源的描述,研究了描述教育资源的元数据标准。 3. 本体构建。 本文构建了四种本体:学科类别本体、知识体系本体、课程本体、资源本体,本体间是上下从属关系。 4. 学习资源的导航检索。提出了根据课程本体、资源本体对学习资源进行分类组织的方法,学习资源之间的概念导航给学习者提供一种直观的检索资源的方式。 关键词:E-learning;个性化学习;本体;应用本体 Research and Application of Individual Learning Sys
6、tem Based on Applied Ontology Abstract With the rapid development of Internet and global requirement for life education, E-Learning which provides asynchronous education has been becoming an important application on Internet. E-Learning enab
7、les people from different place and at different time to learn efficiently. However, in the traditional web-based instruction system, without the full consideration of user's requirements and individualities, the system self is centric,learners have to adapt to the system instead of adapted by the
8、system. This kind of system doesn't carry out instructions according to people's learning rule, resulting in the poor interaction and bad learning efects. In order to resolve these problems, semantics is required to be expressed in a formal and unambiguous way. Metadata standard is the criterion pro
9、posed for unifying the description of resources, and Ontolgoy is the technology proposed for expressing semantics and realizing a certain extent of reusing and sharing. So, in this paper, metadata and Ontology are used to resolve these problems from the description and organization of learning resou
10、rces, and semantic-based information retrieval. The main researches are focused as follows: 1,Personalized achievement. Through a personalized study the findings of the survey analysis , I primarily use learning strategies recommended mechanism,View resources records mechanisms, resources and quali
11、ty evaluation mechanisms testing mechanism to achieve individualized learning. 2. Relevant metadata standards. In order to unify the description of learning resources, I study the relevant metadata standards that describe educational resources. 3. Ontology. In this paper, four kinds of ontologie
12、s are constructed: subject ontology,lore ontology, course ontology and resource ontology. 4. The navigation of learning resources. The method of classifying learning resources in terms of course ontology and resource ontology is proposed. The corresponding algorithm is introduced. The navigation p
13、rovides an intuitionistic retrieval way for learners. Key words: Ontology; E-learning; Personalized learning; Applied ontology 目录 1.绪论 1 1.1课题的研究背景 1 1.2 E-learning的定义与特征 2 1.3课题的研究现状 3 1.3.1 E-learning的主要研究方面 3 1.3.2 E-learning研究中存在的问题 5 1.4本文的主要工作 5 1.5本文的组织结构 6 2.个性化学习与本体理论 7 2.1个性
14、化学习 7 2.1.1 个性化学习的必要性 7 2.1.2 个性化学习问卷调查结果分析 8 2.2本体理论 10 2.2.1 本体的概念 10 2.2.2 本体的分类 11 2.2.3 领域本体 12 2.2.4 应用本体 13 2.2.5 本体理论在系统中的运用 14 3.基于应用本体的个性化E-learning系统的需求分析 15 3.1系统用户简介 15 3.2系统用例描述 15 4.基于应用本体的个性化E-learning系统的设计与实现 25 4.1开发环境介绍 25 4.2数据库设计 25 4.2.1 数据库逻辑设计 25 4.2.2 物理结构设计
15、30 4.2.3 数据结构与程序的关系 30 4.3系统功能模块划分 30 4.3.1 系统功能模块框架 30 4.3.2 数据访问层介绍 30 4.3.3 业务逻辑层介绍 34 4.4系统详细设计节选—教师部分 37 4.5部分主要页面设计图 42 4.6系统测试 45 4.6.1 测试环境 45 4.6.2 单元测试 46 4.6.3 系统测试与集成测试 46 4.6.4 测试结果 46 总 结 47 致 谢 49 参考文献 50 1.绪
16、论 1.1课题的研究背景 目前,万维网正在改变着人类活动的许多领域,包括学习领域。传统的学习方式都体现出以下特征[1]: (1) 教育者驱动。教师选择内容和授课方式,并安排学习日程和学习进度。 (2) 线性学习。教师按一种预先安排好的顺序讲授知识,学习者不能偏离这个顺序。 (3) 依赖于时间和地点。在特定的时间和地点来学习。 因此,这种学习方式不能满足个性化学习的需求,它关注的是大量学习者的参与。虽然这种传统的学习方式是有效的,并在大多数情况下被采用,但是它并不适合于每一个有潜力的学习者,而因特网的出现加快了实施新的教育过程的步伐。 在高等教育领域己经看到了因特网带来的变化
17、越来越多的大学为学习者提供更为灵活的学习方式。据美国联邦教育部国家教育统计中心对高等教育机构远程教育的查,1997-1998年,美国5020所大学中有1690所提供远程教育课程,占高等学校总数的34%。约166万学生注册接受各种形式的远程高等教育,占所有类型高校在校生总数(约为1434)的11.6%,而这些数字正在逐年上涨。除了高等教育领域,E-Learning也对企业培训和终身学习活动产生了更大的影响。在1998年,IDC(国际资料公司)发布研究报告,E-Leaming当年占整个培训市场份额的21%,而面授培训占75%,其它类型培训占4%,现在全美500大企业中已有接近60%开始以E-Le
18、aming作为教育训练的主要辅助工具。组织的竞争力得以提高的一个关键性的支持机制就是员工技能的提高。部门需要一个及时的,满足他们特殊需要的学习过程,理想的情况是能够将这个学习过程与日常的工作结合起来。这种需求与传统的学习不兼容,而E-Learning却可以很好地解决这一问题。目前,E- Learning正以其高效的培训效率、个性化的课程设置、灵活的学习时间安排,特别是经济的培训成本赢得了世人的青睐。 1.2 E-learning的定义与特征 根据美国教育部2000年度“教育技术白皮书”的比较权威的论述,关于"E-Learning"这一概念,有以下几种不同的说法[2]: (1)E-Lear
19、ning是一种受教育的方式,包括新的沟通机制和人与人之间的交互作用。这些新的沟通机制是指:计算机网络、多媒体、专业内容网站、信息搜索、电子图书馆、远程学习与网上课堂等。 (2)E-Learning指的是通过因特网进行的教育及相关服务。 (3)E-Learning提供了学习的随时随地性,从而为终身学习提供了可能;学生在E-Learning中是以一种全新的方式进行学习。 (4)E-Learning将改变教师的作用和师生之间的关系,从而改变教育的本质。 (5)E-Learning是提高学生批判性思维和分析能力的重要途径。 (6)E-Learning能很好地实现某些教育目标,但不能代替传统的
20、课堂教学。 (7)E-Learning不会取代学校教育,但会极大地改变课堂教学的目的和功能。 北京师范大学何克抗教授在总结上述说法的基础上,给出了一个比较权威,比较完整的定义:"E-Learning是指通过因特网或其他数字化内容进行学习与教学的活动,它充分利用现代信息技术所提供的、具有全新沟通机制与丰富资源的学习环境,实现一种全新的学习方式;这种学习方式将改变传统教学中教师的作用和师生之间的关系,从而根本改变教学结构和教育本质。”[3] 与传统学习相比,E-Learning表现出以下特征: (1)学习者驱动。以学习者为主体,教师起辅助指导作用。 (2)非线性学习。学习者根据需要可
21、以随时调整学习过程。 (3)不依赖时间和地点。学习者可以根据自己的情况选择合适的时问和地点。 从学习效果上来讲,E-Learning具有传统教学所无可比拟的优势。根据美国教育协会,于1999年采样研究了传统面授教学和E-Learning方式教学的效果(样本来源:美国陆军,施乐公司,联邦快递公司,IBM公司)来看,E-Learning不仅缩短了学生的学习时间,提高了信息内容的长期记忆力,而且可以提供极其丰富的学习资源。但是师生之间的情感交流、同学之间的友好互助、团结协作及成长过程中的环境、氛围等等,这些都是E-Learning无法替代传统教育的地方。可以预见,未来的E-Learnin
22、g将是传统教育的重要补充,主要表现在[4]: (1) 满足人们求知的欲望 即使是在发达国家,现有高校尚不能完全满足人们求学的需求。我国高等教育的规模更是十分有限,而受经济、师资力量等因素的限制,高校的数量和规模短时间内不可能迅速扩大。传统高等教育规模和培养能力的严重不足,可通过络大学来加以弥补与补充。利用网络将普通大学现有师资、教材、设备等充分共享,使更多的人能够接受高等教育,培养社会急需的高层次人才。 (2) 有利于教育的均衡发展 由于历史原因和经济发展水平的差异,我国教育资源尤其是高等教育资源主要集中在大中城市和东中部地区,并导致大中城市人才密集,而小城市和农村地区高等教育资源不足
23、教育专业门类不齐全,高等学历人才极度贫缺。网络教育不受限于地域,并能够集中最优秀的教师资源,使最优质的教育达到全国各地,可以不受地域限制地培养高层次人才,对师资力量薄弱地区的学校也是有益的参考和补充。远程网络教育打破了传统教育的办学模式,打破了城市化地域限制,使高等教育学历人才向多方位均匀分布发展,极大弥补了传统教育的不足。 (3 )有助于构建终身学习体系 在信息时代 ,新知识、新事物随时随地都在大量涌现,终身学习成为必须,Internet则为终身学习提供了强有力的支持。在未来若千年内,教育将从学校走向家庭,走向社区,走向任何信息技术普及到的地方,因特网将成为没有围墙的学校,网络化学习将
24、成为人们日常生活的有机组成部分。 1.3课题的研究现状 1.3.1 E-learning的主要研究方面 E-Learning方面的研究主要集中在以下几个方面: (1) 网络教育技术标准研究 目前,进行网络教育技术标准研究的组织有很多,美国主要有AICC(美国航空工业计算机辅助训练委员会,Aviation Industry CBT Commitee)[5],ADL(美国高级分布式学习研究项目,Advanced Distributed Learning Initiative)[6], IMS(美国全球学习联合公司)[7]等。AICC最早提出计算机管理教学(CMI) 规范,现成为广泛采用的
25、行业标准;美国国防部(DoD)的ADL项目借鉴AICC的CMI标准建立了可共享课程对象参考模型SCORM (Sharable Course Object Reference Model); IMS是在19%年由EDUCOM (美国大学校际交流委员会)设立的一个研究项目,己经建立了内容包装规范、元数据规范等。欧洲的网络教育技术标准研究主要有ARIADNE(欧洲远程教学创作与销售网联盟)[8]等,我国与2001年开始启动了教育信息化技术标准研究项目,成立了中国教育信息化技术标准委员会(CELTSC),通过跟踪国际标准研究工作和引进相关国际标准,并根据我国教育的实际情况修订与创建各项标准,最终形成“
26、中国教育信息化技术标准体系(CELTS)[9]。有关国际组织的标准化研究主要有DCMI(都柏林核心元数据研究行动)[10], IEEE-LTSC (IEEE学习技术系统标准化委员会)[11]、ISO-JTC1/SC36(国际标准化组织)[12], W3C(万维网联盟)[13]、 ASTD-ELC(国际课件证书标准)[14],其中DCMI建立了DC元数据规范及DC-Education元数据规范,IEEE-LTCS建立了系统架构与参考模型、学习者模型、学习对象元数据标准IEEE LOM等。目前应用较多且相对较为成熟的标准有DC, IEEE LOM,内容包装规范和SCORM规范等。 (2 )体系结
27、构方面的研究 IEEE-LTCS建立了学习技术系统架构(IEEELTSA) 标准,付德宇在参考IEEELTSA (Learning Technology System Architechture)标准的基础上研究了有利于提高学习质量的E-leanring系统的结构模型[15],论述了影响学习质量的关键环节,并针对E-leanring系统的复杂性,介绍了一种分层设计的方法,为设计高质量标准的E-Learning系统提供了参考。另外 ,李孙新、崔光佐和Stojanovic也根据具体的系统需求提出了相应的体系结构[16、17、18]。 (3)理论、模型方面的研究 我国在E-Learning方面
28、的研究有相当一部分还处于理论研究阶段,如秦磊的《我国高校网络教育的现状与对策研究》[19]、金芳的《炙网络信息资源分类组织研究》[20]、金琴的《提高网络教育资源利用效率研究》四[21]、邢冰的《知识管理在网络教育资源管理中的应用研究》[22]、罗昊的《元数据在网络教育中的应用研究》[23]等,这些文章从不同的侧面对E-Learning进行了研究。另外王真星提出了基于本体的计算机支持的协同学习模型[24],以及使用本体解决跨学科的知识描述问题,为资源提供语义标注以及使用户对资源进行语义查询的思想,但这些研究还处于理论研究阶段。国外进行理论、模型方面的研究主要是上面介绍的标准研究,其他方面的研究
29、不是很多,有研究学习者本体的、研究测试本体的、以及研究学习目标和设计基本原理等。 (4 )实现技术方面的研究 我国在E-Learning系统实现技术方面的研究主要集中在XML和元数据的应用上,大都研究的是XML或元数据在教学系统中的应用,近年来也出现了一些研究语义网技术的文章。其中,XML和元数据的应用相对成熟,而语义网技术的应用还处于探索、研究阶段。国外在该方面的研究主要集中在语义网技术的应用上,应用最多的就是其中的本体技术。由此可见,E-Learning系统的实现技术己由XML和元数据过渡到语义网中的本体。 1.3.2 E-learning研究中存在的问题 E-Learning系
30、统在现代远程教育及CBT (Computer-based Training)的平台具有强劲的发展前景。尽管市场中己经有很多E-Learning或者与E-Learning相近的产品,但这些产品普遍不成熟,存在很多问题,这些问题主要包括以下几个方面: (1 )学习资源标准不统一,这导致不同的系统之间不能进行学习资源交换,不能有效实现学习资源的重用和网上搜索。 (2) 大部分现有的E-Learning系统缺乏统一的明确的概念化知识表示,隐含的知识表示使教学资源难以共享和重用,导致教学资源的重复开发,造成大量财力、人力的浪费。 (3) 学习效果不理想,从学习资源的设计到学习模式的设计都不能满足学
31、习者的要求,不能实现学习者按需学习、个性化学习、协作学习、快乐学习的需要。 (4) 静态网页 ,缺乏交互。很多网站的教学内容是简单的将教科书的内容电子化后存放在网站上,学习者浏览网页就像翻书一样,由于缺乏交互性无法激发学习者主动的学习兴趣。 (5) 检索效果差。纵观国内外的E-Learning系统,尤其是国内的E-Learning系统,只提供对某个课程的检索,而不提供对某个知识点的检索;另外,目前的检索方法主要是基于关键词的机械式匹配来检索,此方法有两个缺陷:查不全、查不准,系统往往不能给用户提交满意的结果。 1.4本文的主要工作 针对上述问题,我采取以下办法进行改进: (1 )
32、使用本体表示课程知识与资源结构。本体是共享概念的明确的形式化规范说明, 是为了解决语义问题、实现某种程度的重用和共享而提出的一种技术。本文采用学科类别本体(Subject ontology)、知识体系本体(Lore ontology)、课程本体(course ontology)和资源本体(Resource ontology)来表示课程知识与资源结构,并根据这四种本体对教学资源进行上下从属关系的描述。 (2)提供个性化学习环境。通过考虑学习者的个性特征,提供用户友好界面,并通过学习策略推荐机制、资源浏览记录机制、资源质量评价机制、测试机制和历史学习记录机制等来激发学习者主动的学习兴趣,最大程
33、度的提高学习效果。 (3) 提供多种检索方式,并对检索结果进行适当的处理,如对课程的查询既可以通过关键字模糊查询也可以通过“学科类别-知识体系-所属课程” 这样从属关系依次查询。另外,对其检索结果进行分类排序处理,由此可以给用户返回更好的检索结果。 1.5本文的组织结构 本文共分五大章节: 第一章介绍了主要介绍了E-Learning的研究背景、定义、特征及研究现状,分析了目前E-Learning系统中存在的问题,并给出了相应的解决方法,最后指出了本文所做的工作及论文的组织结构。 第二章介绍了个性化学习和本体理论。在个性化学习部分,重点研究了个性化学习的必要性,并通过江海导师的一份调
34、查问卷说明系统的一些需求特征;在本体理论部分,主要介绍了本体的分层和应用本体。 第三章描述了基于应用本体的个性化学习系统框架。对该框架进行了介绍,并且通过系统功能的描述进一步细化框架中的内容。 第四章叙述了基于应用本体的个性化学习系统的设计和开发过程。首先对开发环境进行了简单介绍,然后进行了数据库设计的介绍、功能模块的划分,并叙述了详细设计过程,最后是对系统测试的一些简要描述。 第五章是总结与展望。本章对本文的工作进行了总结,并对将来的工作进行了展望。 2.个性化学习与本体理论 2.1个性化学习 2.1.1 个性化学习的必要性 由于接受教育的对象存在个性差异,个人的学习目标、能力
35、兴趣、习惯、基础、风格、性格等等都存在差异。而目前不少E-learning系统,虽然自身资源量巨大,但是所采用的学习流程固定,学习方法与模式上显得比较单一。这造成了两者之间越来越大的矛盾。很多E-learning系统忽略了学习本身是一种个性化的过程,没有做到因人而异、因材施教、兼顾个体的差异。因此,E-learning系统迫切需要个性化的功能。 那么,个性化学习的定义是什么呢? 所谓个性化学习是指以承认学习者在社会背景、智能背景、态度价值、情感和生 理等方面存在的个别差异为前提,努力使学习者的个性特征与学习环境之间达到一种平衡,使学习者的素质得到全面提升,培养具有完善个性的人的一种教育
36、理念。个性化学习是指根据学习者的个性特征实施教育活动,充分发挥学习者的主动性,在促进学生全面、自由、协调发展的基础上,促进学生个性的发展、潜能(特别是优势潜能)的开发。学习个性化是针对传统的教育观提出来的、从人的个性出发、以人为本的一种教育思想。个性化学习的提出既有心理学的基础同时也是个体和社会发展的需要。 1. 心理学基础 心理学一般把个性的定义解释为一个人比较稳固的心理特征的总和,主要表现为一个人的气质、性格、能力等方面。它既包括个性心理特征,也包括个性的倾向性。由于每个学习者的遗传因素不同,成长的家庭和社会文化背景各不相同,从而形成的个性也不尽相同。学习者的个性差异是客观存在,不容忽
37、视的。美国著名心理学家卡特尔通过对各种生活情景、行为事件进行观察、测验,并对所得数据采用数理统计的因素分析法,将人的个性抽取16种基本特征或称16个性因素。这16种个性因素在一个人身上的不同组合,就构成了一个人不同于其他人的独特人格。这些个性因素不仅影响人们在生活中待人接物的方式,而且还影响人们在学习中的行为。所以教育者应该依据学习者的个性特点为其提供相应的服务。 2. 个体学习的需要 美国心理学家马斯洛把需要分为生理的需要、安全的需要、归属的需要、爱的需要、认知的需要、自我实现的需要。每一种需要都凸现着个体的独特之处。场独立型的个体希望在学习中能有更多的自主性,场依存型的学习者希望能够得
38、到教师明确的指导。教育应该依据学习者的个性特征为其提供相适应的学习环境,使每个学习者的潜能得到充分的发挥,让学习者的潜能得到充分发展。 3. 社会发展的需要 个性化学习强调以人为本,尊重学生,面向全体学生,是教育公平发展的起点;个性化学习强调针对性,因材施教,公平地对待每一位学生的体现;个性化学习强调主体性的培养和弘扬,从个体发展的内部动力机制方面引导每一位学生自主地充分地发展,是更为积极意义上的教育公平;每一个体的全面发展和良好个性的充分展现是最高意义上的公平,是教育公平终极追求目标。 2.1.2 个性化学习问卷调查结果分析 我的导师曾对本项目进行了一次小型的个性化学习的问卷调查
39、目的在于收集学习者对个性化学习的认识、看法以及需求。参与调查的对象是本科三年级的学生,共发出问卷116份,回收83份,有效问卷78份,获取了一些有价值的数据。下面是对几个主要的结果的分析: 在学习者对个性化学习系统的看法方面(图2.1):23%的被调查者认为不需要什么个性化系统,完全自由的学习就是个性化了; 35%的被调查者认为系统提供好资源环境,学习策略应该学习者自己做主;19%的人觉得应该由系统来为自己安排学习资源和学习策略;另外23%的学习者认为系统只提供参考的学习策略。 图2.1 个性化学习系统的认识 由此可见更多的学习者希望能够由自己来决定学习策略(占23%+23%
40、35%=81%),但是仍有不少的学习者希望系统能够提供学习策略(占23%+19%=42%)。所以设计的个性化系统中学习策略功能不可以缺少。 那么学习者是怎么看待个性化学习系统所提供学习策略的方式,是否能接受个性化学习系统通过一些测试来断定用户的学习风格并为选择固定的学习过程和内容安排,下面的调查结果可以看出(图2.2):23%的被调查者认为不可以接受;77%的用户表示可以偶尔试试系统提供的学习策略;0%的被调查者认为可以接受系统为自己决定一切。 图2.2 个性化学习调查(系统确定学习策略) 由该结果可以明确系统为用户提供的学习策略应该是一种参考策略,而不是要求用户强制执行
41、 在个性化的学习过程中学习者选择参考学习策略的偏好是什么?32%的被调查者选择参考优秀者的学习策略;48%的人选择性格、风格相近学习者的学习策略;另外20%选择教师、教学指导者或者系统所提供的学习策略(图2.3)。 图2.3 个性化学习调查(学习策略选择偏好) 由这个调查结果可以为系统设计带来两个主要信息:1、系统和教学设计者所提供的学习策略只有20%左右的用户具有选择趋向,更多的用户比较喜欢从其他学习者所采用的学习策略中寻找适合自己的;2、系统需要提供功能来获取用户在学习中所产生的学习策略。 2.2本体理论 2.2.1 本体的概念 本体的概念最初起源于哲学领域,可
42、以追溯到公元前古希腊哲学家亚里士多德。它在哲学中的定义为“对世界上客观存在物的系统地描述,即存在论”,是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。 在人工智能界,最早给出本体定义的是Neches等人,他们将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义” 。 后来在信息系统、知识系统等领域,越来越多的人研究本体,并给出了许多不同的定义。其中最著名并被引用得最为广泛的定义是由Gruber提出的,“本体是概念化的明确的规范说明”。 W. N. Borst对该定义也进行了引申“本体是共享的概念模型的形式化的规范说明”
43、 。 Studer等对上述两个定义进行了深入的研究,认为本体是共享概念模型的明确的形式化规范说明。这包含4 层含义:概念模型(conceptualization) 、明确(explicit) 、形式化(formal) 和共享(share) 。“概念模型”指通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型。概念模型所表现的含义独立于具体的环境状态。“明确”指所使用的概念及使用这些概念的约束都有明确的定义。“形式化”指本体是计算机可读的(即能被计算机处理)。“共享”指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即本体针对的是团体而非个体的共识。 尽管
44、定义有很多不同的方式,但是从内涵上来看,不同研究者对于本体的认识是统一的,都把本体当作是领域(可以是特定领域的,也可以是更广的范围)内部不同主体(人、机器、软件系统等)之间进行交流(对话、互操作、共享等)的一种语义基础,即由本体提供一种明确定义的共识。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语) 和词汇间相互关系的明确定义。 2.2.2 本体的分类 Guarino对本体(Ontology)进行过比较有效的分类,提出以详细程度和领域依赖度两个维度作为对Ontology 层次划分的基础。详细程度是相对的
45、较模糊的一个概念,指描述或刻画建模对象的程度。详细程度高的称作参考(reference) Ontologies ,详细程度低的称为共享( share)Ontologies。依照领域依赖程度,则可以细分为顶级(top level) 、领域(domain) 、任务(task) 和应用(application) Ontologies 四类。其中: 顶级本体:描述的是最普通的概念及概念之间的关系,如空间、时间、事件、行为等等,与具体的应用无关,其它种类的Ontologies 都是该类Ontologies 的特例。 领域本体:描述的是特定领域(医药、计算机等) 中的概念及概念之间的关系。 任务本
46、体:描述的是特定任务或行为中的概念及概念之间的关系。 应用本体:描述的是依赖于特定领域和任务的概念及概念之间的关系。 本文所使用的本体层次结构参考了上述分类方法,将任务本体和应用本体进行了合并,统称为应用本体,用于描述实际应用中的概念以及关系。新形成的本体层次结构见图2.4。 图2.4 本体层次结构 顶级本体抽象层次最高,实际应用中较少使用,不在本文研究范围之内。下文将对领域本体和应用本体所构建的应用框架进行阐述。 2.2.3 领域本体 领域本体用于描述指定的领域知识,它是领域内实体概念、相互关系、领域活动以及该领域所具有的特性和规律的一种形式化描述。领域本体应该具有以
47、下几个重要的特征: 领域特性:这一点是领域本体的关键特点,它必须是构建指定领域的知识。 权威性:构建过程需要领域专家参与,结果需要得到领域内的认可。 标准性:在构建领域本体时所使用的术语、概念、词汇等应该符合领域内公认的标准,例如建立“电子邮件”本体时,不适合使用“伊妹儿”这类俗成词汇。 完整性:构建的领域本体应该包含该领域所有的概念、关系、公理以及相关内容,与其它领域有交叉的概念,该领域本体也应包含。 一致性:每个术语及含义均在领域内有意义。 具有完善的版本控制:由于知识不断地发展和变化、认识的进步及不同的本体构建者存在的不同认识,使同一个实体或者概念会存在不同版本的本体。领域本
48、体系统需要版本管理,本体元数据设计中应该包含版本信息。 本文中应用本体是为满足某种具体应用的需求,在领域本体基础上通过虚拟的方式建立的。它与领域本体的主要区别在于:前者重点在于建立领域公认的概念体系结构,为无偏差地传递信息提供基础;而后者的重点则在于为具体的使用本体方法提供途径。使用应用本体的概念,领域本体的优点和功能(例如基于语义的知识检索)就可以在具体应用中得到充分利用,又使本体在外在表现和结构上具有更丰富和灵活的形式。 2.2.4 应用本体 本文中应用本体是为满足某种具体应用的需求,在领域本体基础上通过虚拟的方式建立的。它与领域本体的主要区别在于:前者重点在于建立领域公认的概念体
49、系结构,为无偏差地传递信息提供基础;而后者的重点则在于为具体的使用本体方法提供途径。使用应用本体的概念,领域本体的优点和功能(例如基于语义的知识检索)就可以在具体应用中得到充分利用,又使本体在外在表现和结构上具有更丰富和灵活的形式。 建立应用本体的方法归纳有5种,分别是克隆、遗传、杂交、合并和新建。 1、 克隆:直接使用领域本体中的组成对象(包括本体元、关系等)作为应用本体中的对象。克隆也可以认为是一种无变异的遗传。 2、 遗传:类似于面向对象方法中的继承,继承后形成的新对象保留了对原领域本体中的对象的引用,但是各种属性(例如名称、描叙等)均可以进行变异。例如在领域本体库中有“RJ45头
50、这样一个本体,而在应用本体中为了更加生动,可虚拟一个本体对象,引用原领域本体,并使用“水晶头”这样的名称。 3、 杂交:类似于面向对象方法中的多重继承,新对象是对原领域本体中多个对象的引用,例如局域网和无线网两个本体元对象可以杂交出无线局域网的新本体元对象。 4、 合并:方向和杂交相反,是多个对象合并形成一个新的对象。但其实现方法和表现形式和杂交是一样的。例如有线局域网和无线局域网两个本体元对象可以合并为局域网本体元对象。实现方法和杂交方式一4样是对多个对象的引用。 5、 新建:在应用中需要一个本体对象但又无法通过以上四种方法生成可用对象时,可以新建一个本体对象。 应用本体的建立规
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818