收藏 分销(赏)

信息资源组织方法.pptx

上传人:w****g 文档编号:6247267 上传时间:2024-12-03 格式:PPTX 页数:99 大小:4.43MB
下载 相关 举报
信息资源组织方法.pptx_第1页
第1页 / 共99页
信息资源组织方法.pptx_第2页
第2页 / 共99页
信息资源组织方法.pptx_第3页
第3页 / 共99页
信息资源组织方法.pptx_第4页
第4页 / 共99页
信息资源组织方法.pptx_第5页
第5页 / 共99页
点击查看更多>>
资源描述

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,北京大学研究生课程进修班,2005,上海,#,第二讲 信息资源组织方法第六章 元数据方法,刘炜,wliu,北京大学研究生课程进修班,2005,上海,北京大学研究生课程进修班,2005,上海,目录,元数据一般概念,国外元数据研究与应用的历史与现状,国内元数据研究与应用的历史与现状,趋势与问题,DC,元数据方法,北京大学研究生课程进修班,2005,上海,元数据一般概念,定义,来源,作用,分类,模型,思考:,元数据概念早已有之,为什么现在会非常热门?,固然,MARC,是一种元数据格式,但是它与“现代”元数据究竟又什么

2、大的区别?,北京大学研究生课程进修班,2005,上海,元数据定义,“,meta”,来自古希腊语,意思是更高层次或更基本的概念,关于数据的数据(,data about data,),关于数据的结构化数据(,structured data about data,),用于描述数据的内容(,what,)、覆盖范围(,where,when,)、质量、管理方式、数据的所有者(,who,)、数据的提供方式(,how,)等信息的数据,是数据与数据用户之间的桥梁,资源的信息,(Information about a resource),编目信息,(Cataloguing information),管理、控制信息

3、(,Administrative information),是一组独立的关于资源的说明(,metadata is a set of independent assertions about a resource,),定义和描述其它数据的数据(,data that defines and describes other data,(,ISO/IEC 11179-3:2003(E),),Metadata,在台湾被译作“元资料”、“诠释资料”、“后设资料”、“文后资料”、“超资料”等多种名称。,北京大学研究生课程进修班,2005,上海,来源,计算机,/,数据库领域,网络信息标注,/,检索,进一步发展

4、:机器对于语义的理解和处理(语义万维网),北京大学研究生课程进修班,2005,上海,元数据的作用,元数据的主要功能是定位(,location,)、寻找或发掘(,discovery,)、存档(,documentation,)、评价(,evaluation,)与选择(,selection,)等五大功能*;,其他作用:链接与交互关系的体现(,linkage and interactive relationship management,)、整合,XML,、,RDF,与,Z39.50,不同协议的应用等;,描述、检索、选择、定位、管理、评估与交互等功能*。,*来自于欧洲,DESIRE,(,Develop

5、ment of a European Service for Information on Research and Education,)计划的元数据分析报告,*北大数字图书馆研究所的研究报告,北京大学研究生课程进修班,2005,上海,Metadata supports operations on resources.,and relieves the user of having to have advance knowledge of the characteristics or existence of the resource.,Know what resources are ava

6、ilable,Know how to play a resource,Know provenance of a resource,Know what use policy governs a resource,Know how to ingest a resource,Know how to interact with a resource,Know how to compose/decompose resources,北京大学研究生课程进修班,2005,上海,A portal turned inside out,Common services,Content services,Applica

7、tion services,Presentation services,I need a few references,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Presentation services,authentication,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application se

8、rvices,Presentation services,Directory:user profile,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Presentation services,Query broker,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Pre

9、sentation services,Directory:service/collection description,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Presentation services,Content:results list,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Id like to get this book.,Common services

10、,Content services,Application services,Presentation services,Request broker,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Presentation services,Directory:ILL policy,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content s

11、ervices,Application services,Presentation services,Directory:service/collection description,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Presentation services,Content:circ/ILL system,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,I need

12、 this article too.,Common services,Content services,Application services,Presentation services,Request broker,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Presentation services,openURL resolver,From slides by Lorcan Dempsey,北京大学研究生课程进修班,200

13、5,上海,Common services,Content services,Application services,Presentation services,Directory:local knowledge base,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Nearly there,Common services,Content services,Application services,Presentation services,Directory:service/collection description,From sl

14、ides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Common services,Content services,Application services,Presentation services,Content:article,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,Directory:ILL policy,Common services,Content services,Application services,Presentation services,Authentication,D

15、irectory:user profile,Query broker,Directory:service/collection description,Reference db,Request broker,Circ/ILL system,OpenURL resolver,Directory:local knowledge base,Article db,Metadata for multiple entities required to support operations.,This picture could be extended in multiple ways.,From slid

16、es by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,元数据大家庭,EAD,MARC AMC,.,MARC,MODS,DC,RSLP,.,Onix,XML,RDF,OWL,CSDGM,DDI,NBII,IVOA,EGMS,AGLS,GILS,GEM,DC-ED,IEEE-LOM,SCORM,MPEG,JPEG,TIAA-CREF,*,*,*,*,From slides by Lorcan Dempsey,北京大学研究生课程进修班,2005,上海,元数据的分类,Asset metadata,Who,Where&When:,Title,Creator,Publishe

17、r,Contributor,Date,Type,Format,Identifier,Source,Language,Subject metadata,What&Why:,Subject,Description,Coverage,Relational metadata,Links between and to:,Relation,Use metadata,How can it be used:,Rights&Permissions,Enabled Functionality,Complexity,dublincore.org/documents/dces/,More efficient edit

18、orial process,Better navigation&discovery,北京大学研究生课程进修班,2005,上海,元数据的分类,元数据类型,定义,描述型,元数据,内容描述,描述资源对象内容或外观信息。,结构描述,描述资源对象各组件的结构信息。,管理型,元数据,技术,描述资源对象的技术要求的元数据信息。,权限,描述资源对象的权限管理与合法取用的元数据信息。,来源,描述资源对象的产生、发展与环境等方面的元数据信息。,一般管理,用来管理信息资源的元数据信息。,根据元数据中的元素所描述、揭示的语义来划分的:,北京大学研究生课程进修班,2005,上海,元数据分类,北京大学研究生课程进修班,2

19、005,上海,描述性元数据的分类,描述能力,低,高,北京大学研究生课程进修班,2005,上海,国外情况,概况,项目情况,标准化情况,研究与应用特点,值得借鉴之处,北京大学研究生课程进修班,2005,上海,元数据标准举例,按元数据应用的学科领域,则可以进行如下划分:,传统图书期刊,如:,MARC,等。,网络资源,如,Dublin Core,、,IAFA/WHOIS+Templates,、,LDIF,(,LDAP Data Interchange Format,)、,SOIF,(,Summary Object Interchange Format,)、,URCs,(,Uniform Resourc

20、e Characteristics/Citations,)等。,政府信息,如:,GILS,(,Government Information Locator Service,,政府信息定位服务)、,DC-Gov,(,DC-Government Application Profile,,,DC,政府应用纲要)等。,科技文献,如:,ibTEX,、,EELS,(,The Engineering Electronic Library,,工程电子图书馆元数据)、,EEVL,(,The Edinburgh Engineering Virtual Library,,爱丁堡虚拟电子图书馆元数据)、,RFC180

21、7,等,28,。,人文及社会科学资源,如:,TEI Header,、,ICPSR SGML Codebook Initiative,等,29,。,教育资源:,IEEE LOM,(,Learn Object Medle,,学习对象模型)、,GEM,(,GEM Element List,,,GEM,元数据)、,DC-Ed,(,DC-Education,元数据)等。,博物馆藏品或特藏,如:,CDWA,(,Categories for the Description of Works of Art,,艺术作品描述目录)、,CIMI,(,Computer Interchange of Museum In

22、formation,),CIMI,、,VRA Core,(,Visual Resources Association Core,可视资源核心类目)、,REACH,元素集等。,保存型元数据方案:,CEDARS,、,NLA,、,NEDLIB,地理空间资源,如:,FGDC/CSDGM,等,手稿档案保存类,如:,EAD,等,网络多媒体及版权管理:,INDECS,北京大学研究生课程进修班,2005,上海,简介,1.CDWA(,艺术作品描述目录,),2.CDF(,频道定义格式,),3.BibTex(,科技文献书目资源格式,),4.CIMI(,博物馆信息计算机交换标准框架,),5.DC(,都柏林核心元数据,

23、),6.EAD(,编码文档描述,),7.EELS(,工程电子化图书馆,),8.EEVL(,爱丁堡工程虚拟图书馆,),9.FGDC(,联邦地理数据委员会,),10.GILS(,政府信息定位服务,),11.IAFA/WHIOS+Templates(,因特网匿名,FTP,文件库版式,),12.ICPSR SGML Codebook(,政治和社会研究方面的校际联盟,),13.LDAP DIF(,轻便型目录获取协议,),14.MARC(,机读目录格式,),15.MCF(,元内容框架,),16.PICA+(,荷兰图书馆自动化中心,),17.PICS(,网络内容选择平台,),18.RDF(,资源描述框架,)

24、,19.RFC(,书目记录格式,),20.SGML(,通用标准标记语言,),21.SOIF(,概略对象交换格式,),22.TEL Header(,文本编码计划,),23.URCs(,统一资源特征,),24.Warwick Framework(Warwick,框架,),25.Web Collections(,网站集合,),北京大学研究生课程进修班,2005,上海,IFLA,推荐方案,应包含的核心元素,主题,Subject,日期,Date,使用条件,Conditions of use,出版者,Publisher,资源名,Name assigned to the resource,语种,/,表达方式

25、,Language/mode of expression,资源标识符,Resource identifier,资源类型,Resource type(i.e.,what the resource,is,rather than what it is,about,),作者,/,创建者,Author/creator,版本,Version,见:,Guidance on the Structure,Content,and Application of Metadata Records for Digital Resources and Collections:,Report of the IFLA Cat

26、aloguing Section,Working Group on the Use of Metadata Schemas,(2003 Oct 27),北京大学研究生课程进修班,2005,上海,国内情况,概况,历史,项目与研究应用情况,趋势与展望,值得关注的课题,图书馆员的角色,北京大学研究生课程进修班,2005,上海,国内元数据研究与应用概况,国内的研究与应用:,数字化项目的需要,例如国家图书馆、中山图书馆等;,数字图书馆开发与建设的需要,如有关数字图书馆项目、国家,863,项目等;,国外元数据跟踪研究和应用的成果,近来新呈现的特点,注重体系化的研究,通过对系统架构的研究,建立信息系统模型(

27、生命周期模型、数据流模型、应用相关模型等)。,注重具体应用环境和实现的研究。,注重标准体系的建立(一整套标准规范和可操作的文档)。,北京大学研究生课程进修班,2005,上海,历史,1997,年“试验型数字图书馆”项目,OCLC,的引介、推动,国图及中山图书馆元数据方案,北大元数据方法论,上海图书馆“第一届国际元数据研讨会”,上图的元数据跟踪及应用,北京大学研究生课程进修班,2005,上海,国内元数据项目与应用研究情况,国家图书馆,中文元数据方案,北京大学图书馆(拓片和敦煌古卷),清华大学(建筑),中科院文献情报中心,我国数字图书馆标准与规范建设,项目,(CDLS),中山图书馆“数字式中文全文文

28、献通用格式”,中国可持续发展信息共享示范系统*,教育信息源数据标准*,上海图书馆应用研究情况,*参见:,。,另有:甲骨影像及拓片资源库;西夏文献数字资源库;中文拓片资源库;国际敦煌项目,(,敦煌及其他遗址出的十万余件写卷,可以在互联网上免费获得高清晰度的数码图像,与之相联的有书目,地图,照片,遗址图等其他有关历史,现状等信息,使学者,学生,平常老百姓能由此深入了解公元一千年丝绸之路上的社会生活状况,),。,2002,年,12,月,,“,国家图书馆二期工程暨国家数字图书馆工程,”,项目立项申请书通过国务院批准,程总投资,123,500,万元;,基于,OAIS,参考模型的保存性元数据方案“中文元数

29、据方案”,北京大学研究生课程进修班,2005,上海,中文元数据方案,1,名称,Title,2,主题,Subject,3,版本,Edition,4,内容摘要,Abstract,5,内容类型,Content Type,6,语种,Language,7,内容覆盖范围,Coverage,8,内容创建者,Creator,9,其它责任者,Contributor,10,内容创建日期,Date of Creation,11,出版,Publisher,12,版权所有者,Copyright Holder,13,资源标识符,Identifier,14,关联资源,Related Objects,15,数字资源制作者,D

30、igital Publisher Name,16,数字资源制日期,Digital Publisher Date,17,数字资源制作地,Digital Publisher Place,18,权限声明,Rights Warning,19,公开对象,Actors,20,操作许可,Actions,21,原始技术环境,Original Technical Environments,22,加工处理历史,Ingest Process History,23,维护历史,Administration History,24,认证指示符,Authentication Indicator,25,基本抽象格式描述,UAF

31、-Description,北京大学研究生课程进修班,2005,上海,中国高校系统:以北京大学为代表,基于专门数字对象的元数据标准,古籍元数据标准(第,4,版),拓片元数据标准(第,6,版),舆图元数据标准(第,1,版),学位论文元数据标准(第,2,版),人物元数据标准(第,1,版),电子图书元数据标准(教学参考书)(第,1,版),网络资源元数据标准(第,1,版),其它,参见示例,北京大学研究生课程进修班,2005,上海,北京大学研究生课程进修班,2005,上海,中国科学院文献情报中心,国家科学数字图书馆预研项目,后续项目:“,科技基础性工作专项资金重点项目,我国数字图书馆标准规范建设,”,北京

32、大学研究生课程进修班,2005,上海,完整的框架体系,Works/,Objects,Collections of,Works/Objects,Databases of discriptions,Digital,Objects,Collections of,Digital Objects,Identification/Naming,Metadata Descriptions,Retrieval Mechanisms,Location Resolution,Storage and Archiving,Formatting,Organizing Mechanisms,格式化,识别与命名,元数据描述,

33、组织机制,检索机制,地址解析,长期保存,注:本页内容来自张晓林教授有关元数据的演示稿,北京大学研究生课程进修班,2005,上海,基于生命周期的元数据开发应用框架,互操作机制,检索机制,长期保存,应用领域,应用目标,内容结构,句法结构,语义结构,编码语言,制作机制,组织与存储,北京大学研究生课程进修班,2005,上海,回目录,中国可持续发展信息共享示范系统,北京大学研究生课程进修班,2005,上海,基础教育教学资源元数据规范,编入,教育信息化技术标准,CELTS-42,;,与,IEEE LOM,和,IMS,相一致;,与,DC,联系密切(以,DC,为核心),体系完整,元数据方面已包括三个规范:,C

34、ELTS-3.1,(,CD1.6),学习对象元数据,2002-09-05,CELTS-3.3,(,CD1.6),学习对象元数据实践指南,2003-01-07,CELTS-3.4,(,WD1.0),学习对象元数据测试规范,2003-01-07,建立了运作机制和认证体系,参见示例,北京大学研究生课程进修班,2005,上海,上海图书馆,上海图书馆于,1997,年启动了古籍数字化项目,(,数字化数量共计,3223,种一、二级藏品,130,万页,),。,,1998,年开始进行历史文献和特色馆藏的抢救性整理和数字化工作。,1999,年是上海图书馆进行大规模数字化的一年,这一年一共进行了,7,个数字化项目。

35、,上海数字图书馆是一个综合了七个资源库的网上图书馆,拥有数据近,200GB,,主要是扫描的影像数据。系统采用,IBM Digital Library version 2.4,作为主要开发工具应用平台。,元数据方案采用以,DCMES,作为核心集、多种元数据方案并存的“元数据应用纲要”形式,以基于,XML,的,RDF,为基础的编码方式封装在一起,保证了原始素材内容管理中元数据的完整性与互操作能力。,目前正在修改完善一整套元数据规范、方案和方法。,上图德元数据规范和方法正在应用于上海图书馆正在建设的古籍数字图书馆、拓片资源的数字化、家谱数字图书馆、名人手稿数字图书馆等。,北京大学研究生课程进修班,2

36、005,上海,元数据实践,北京大学研究生课程进修班,2005,上海,值得关注的课题,流程与方法,模型,几个重点和趋势:,元数据注册体系,应用方案(,AP,)的概念和形式化,保存性元数据,权限管理元数据,北京大学研究生课程进修班,2005,上海,上图元数据方案设计流程,建立模型,详细列出相关实体,标明其相互之间的关系。,资源分析,分析应用领域资源特点和文献利用方式,属性提取,内容专家从资源利用的角度提出属性要求,文献调研,元数据专家从现有标准和相关项目中获得参考,元素精炼,分析应用领域资源特点和文献利用方式,限定规则,规定属性限定原则(子字段,修饰词和编码),规范控制,考察需要进行规范控制的属性

37、,制定办法,著录规则,制定详细的著录规则,指导数据加工,置标方案,通常选择,XML/RDF,或单纯,XML,置标,检索要求,提出元素对应属性字段的具体检索要求,系统需求,元数据需求作为应用系统需求的一个部分,验收要求,元数据部分在系统中所要达到的功能,未来扩展,预留未来发展的可能性,即可扩展性,元数据方案设计流程图示,北京大学研究生课程进修班,2005,上海,图书馆员的角色,领域内容专家,/,信息组织专家,/,计算机专家三位一体;,技术与应用的桥梁;,完善知识体系结构,构建元数据方案和知识本体,北京大学研究生课程进修班,2005,上海,元数据模型,RDF,数据模型(及,Warwick,框架),

38、OAIS,参考模型,FRBR,功能,/,生命周期模型,DCMI,抽象模型(,DCMI,元数据方案抽象模型),数字图书馆体系结构模型,北京大学研究生课程进修班,2005,上海,元数据模型:三位一体,在语义、结构和句法三方面分别达成一致,语义,通过属性元素(部分通过编码,/,置标方式)表达,结构,语义的抽象载体,通过框架,/,容器来表达,要求做到人类与机器均可读,句法,/,语法,具体的置标,/,编码方案(如,XML/METS/MODS/RDF/XMLS/RDFS/OWL,等),传达语义和结构,北京大学研究生课程进修班,2005,上海,FRBR,模型,Functional Requirements

39、for Bibliographic Records,北京大学研究生课程进修班,2005,上海,元数据生命周期,北京大学研究生课程进修班,2005,上海,数字图书馆体系结构模型,资源创建者,数字对象,数据,句柄,仓储,RAP(,仓储存取协议,),句柄服务器,创建,包含,由句柄系统创建,包含在,被存取,句柄注册于,北京大学研究生课程进修班,2005,上海,元数据与数字图书馆,元数据决定了数字图书馆的体系结构,主要解决两个问题:,定义数字图书馆中数字对象的信息结构,定义由数字对象构成的资源库的组织结构,数字对象是数字图书馆中存储信息的基本逻辑单位,它进一步决定着的信息组织处理和利用方式、资源库的组织

40、结构,提供了统一的互操作。,元数据方案是数字图书馆建设的重要组成部分,体现在数字图书馆开发的各个环节中,存储,检索,发布,管理,北京大学研究生课程进修班,2005,上海,DC,元数据,北京大学研究生课程进修班,2005,上海,DCMI(Dublin Core Metadata Initiative,Dublin Core Metadata Initiative(DCMI),An organization dedicated to fostering the widespread adoption of interoperable metadata standards and promoting

41、 the development of specialized metadata vocabularies for describing resources to enable more intelligent resource discovery systems,Mission,Make it easier to find resources using the Internet through the following activities:,Developing metadata standards for discovery across domains,Defining frame

42、works for the interoperation of metadata sets,Facilitating the development of community-or disciplinary-specific metadata sets that are consistent with items 1 and 2,北京大学研究生课程进修班,2005,上海,Dublin Core Metadata Element Set,Dublin Core Metadata Element Set(DCMES),A set of 15 descriptive semantic definit

43、ions,A core set of elements that could be shared across disciplines or within any type of organization needing to organize and classify information,Three formally endorsed versions the Dublin Core Metadata Element Set,version 1.1:,ISO Standard 15836-2003(February 2003),NISO Standard Z39.85-2001(Sept

44、ember 2001),CEN Workshop Agreement CWA 13874(March 2000),Internet RFC 2413(September 1998):first published version of the Dublin Core;superseded by the above three standards,北京大学研究生课程进修班,2005,上海,Design goals for DCMES,Simplicity of creation and maintenance,Define a small and simple metadata element

45、set to allow a non-specialist to create simple descriptive records for information resources easily and inexpensively while providing for effective retrieval of those resources in the networked environment.,Commonly understood semantics,Provide a common set of elements,the semantics of which are uni

46、versally understood and supported.,International scope,Involve representatives from virtually every continent to ensure the development of the standard considers the multilingual and multicultural nature of the electronic information universe.,Extensibility,Provide mechanisms for extending the DC el

47、ement set for additional resource discovery needs.,北京大学研究生课程进修班,2005,上海,The 15 elements,Type(Resource Type),Format(Format),Identifier(Resource Identifier),Source(Source),Language(Language),Relation(Relation),Coverage(Coverage),Rights(Rights Management),Title(Title),:,Creator(Creator),Subject(Subject

48、 and Keywords),Description(Description):,Publisher(Publisher),Contributor(Contributor),Date(Date),All elements are optional and repeatable,北京大学研究生课程进修班,2005,上海,Three components for metadata,Elements&Semantics,Definitions for the content of the elements,e.g.,what is a title,creator,etc.,Focus of DCME

49、S,Content Rules,Guidelines and direction for inputting the content,e.g.,what to capitalize,order of elements,etc.,DCMES guidelines available,Syntax,Rules for structuring and expressing the elements for machine processing,DCMES is syntax independent,北京大学研究生课程进修班,2005,上海,Element name and semantics,Ele

50、ment Name:Title,Label:Title,Semantics:A name given to the resource.,Comment:Typically,Title will be a name by which the resource is formally known.,Element Name:Creator,Label:Creator,Semantics:An entity primarily responsible for making the content of the resource.,Comment:Examples of Creator include

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服