信息组织绪论ppt.ppt_咨信网zixin.com.cn

资源描述

*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,信息组织,信息组织,内容简介,信息组织,是信息管理专业的核心课程之一。它系统地阐述了信息资源,描述,与,组织,的理论和方法。,本课程主要内容有：,第一部分：引论（,1,章）,第二部分：信息组织分类语言与主题描述语言（,2,章）,第三部分：置标语言工具（,4,章）,第四部分：信息资源描述与组织的元数据方法（,5,章）,第五部分：信息,资源,组织的数据库方法（,6,章）,第六部分：网络信息资源组织（,7,章）,第七部分：索引数据库与搜索引擎（,8,章）,第八部分：信息组织在各行业应用（,9,章）,第九部分：发展趋势,1,信息组织,马张华编著清华大学出版社，,2007,2,信息组织,戴维民主编高等教育出版社，,2004,3,信息组织概论,冷伏海主编，科学版社，,2003,4,信息组织的分类法与主题法,曹树金，罗春荣著,北京图书馆出版社，,2000,年,5,情报语言学基础,张琪玉著武汉大学出版社，,1998,年,6,汉语叙词标引规则,中华人民共和国国家标准,（,GB1319091,）,推荐书目,主要内容,：,本章对信息组织以及与信息组织有关的一些基本问题做一分析，并简要评析信息组织中几种重要的组织方式与方法,。,第一章信息组织概论,失去控制和无组织的信息不再是一种资源我们淹没在信息中，但是却渴求知识,（美国）奈斯比特,大趋势,一是知识和信息的海量性与人的精力、时间的有限性形成了尖锐的对立；,二是知识和信息的无序性和污染性与人类使用的选择性也形成尖锐的矛盾。,一、信息与信息组织,、信息与信息社会,信息的含义：泛指通过指令、数据、符号发出的对接受者来说在此之前还没有获知的信息。,信息社会：是高度信息化、知识化的社会。它的主要特点是在社会生活中广泛应用信息技术、信息获取与传递十分方便、信息生产发达、信息消费旺盛，促进了社会快速发展、人民生活质量迅速提高。,信息社会的发展历程,一、信息与信息组织,、信息与信息社会,信息的含义：泛指通过指令、数据、符号发出的对接受者来说在此之前还没有获知的信息。,信息社会：是高度信息化、知识化的社会。它的主要特点是在社会生活中广泛应用信息技术、信息获取与传递十分方便、信息生产发达、信息消费旺盛，促进了社会快速发展、人民生活质量迅速提高。,信息社会的发展历程,、信息组织的诞生与发展,信息组织：是对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。信息组织的目的是为了检索信息、利用信息。传统的信息组织的场所如图书馆、情报所、档案馆等。数据库和互联网是新兴的信息组织空间。,信息组织的目的,:,实现无序信息向有序信息的转换,(1),减少社会信息流的混乱程度；,(2),提高信息产品的质量和价值；,(3),建立信息产品与用户的联系；,(4),节省社会信息活动的总成本。,信息组织的,一般定义：,信息组织是以,文本,及,其它类型,的信息资源为对象，通过对其,内容特征,及,形式特征,的分析、选择、标引和处理，使之成为有序化的信息集合的过程。这个定义有以下几点：,信息组织的,对象,（资源）：用文字符号写作的文本或文件（纸质的、电子的等）、图象、图形、声频、视频等。,信息组织的,依据,：内容特征与形式特征,1,）,内容特征：文件（资源）论述的主题、论题或研究的问题。,2,）,形式特征：文件的外部特征，如文件的著者、写作形式、地区、时间等。,信息组织的,方法,：,分析、选择、标引和处理,分析：分析文件（资源）的主题范围题、内容特征、学科性质及形式等；,选择：在许多符号中选取并确定一个或一组能表达资源主要特征的符号代表该资源。,标引：用选取的符号代表该资源，有时学要确定一个主要符号和次要的符号。,把符号按一定原则（规则）组成一个次序。,信息组织的,目标,：资源有序化：建立存取（,access,）秩序，以便检索（,retrieval,，,search,查找）和利用（,usage and reuse,）。,有序化的方法：,排序（内容或主题排序、形式排序、应用排序等）；,优化：资源精选、内容联系、逻辑关联、应用关联、混搭（,mashup,）、个性化或个人化组织等等。,、信息组织的诞生与发展,）、信息组织的三个发展阶段（按职能划分）（,1,）,.,清册时期主要工作是记录和登载信息书目型的有序化成果，手工方式（,2,）,.,查检职能时期主要职能是查检信息，文摘型和索引型有序化成果，开始导入如穿孔卡片系统和缩微胶片系统等机械化和半机械化手段（,3,）,.,组织职能时期融信息收集、信息分析、信息描述、信息揭示、信息存储于一体，信息组织产品商品化，使用以计算机技术、通讯技术、网络技术为代表的现代信息技术,、信息组织的诞生与发展,）、信息组织的三个发展阶段（按组织对象划分）（,1,）,.,文献组织时期是伴随着文献量的激增而诞生的主要工作以图书情报领域的信息组织工作为主流。（,2,）,.,信息组织时期转向网络信息资源和电子介质，特别是转向自动化功能全速度快的信息资源组织方法。,（,3,）,.,知识组织时期知识组织最早由英国著名的图书馆学家布里斯提出来。是指为促进或实现主观知识客观化和客观知识主观化而对知识客体所进行的诸如加工、整理、引导、揭示、控制等一系列组织化过程及其方法。,3.,信息组织的特性,1,）信息组织的渗透性。,信息组织的渗透性指信息组织存在于各种信息揭示、存贮和检索活动之中。,2,）信息组织的依附性。,信息组织的依附性指信息组织无法独立存在，它要以信息的识别、揭示等活动为前提。,3,）信息组织的增效性。,信息组织的增效性是指信息组织可以增加信息传播、检索、利用的效率。,二信息组织的理论方法,1,、信息组织的理论基础,1),系统科学理论,：系统是指为达到某种共同的目的，若干构,成要素相互有机地结合的复合体。信息组织使系统的信息有,序化，使有组织的信息整体功能大于各个信息单元的功能之,和。,2),耗散结构理论,：一种远高平衡态的非平衡系统在其外参数变,化到某一值时，通过系统与外界连续不断地交换能量和物,质，系统可以从原来无序状态转变为空间、时间和功能上都,有序的结构。,1.,信息组织的理论基础,3),协同学理论,：研究协同系统在外参量的驱动下和在子系统之,间的相互作用下，以自组织的方式在宏观尺度上形成空间、时间或功能有序结构的条件、特点及其演化规律。,4),突变理论,：突变理论主要以拓扑学为工具，以结构稳定性理,论为基础，提出了一条新的判别突变、飞跃的原则：在严格控制条件下，如果质变中经历的中间过渡态是稳定的，那么它就是一个渐变过程。,5),知识组织理论,：知识组织是指对知识客体进行整理、加工、揭示、控制等一系列组织化过程。,(6),信息自组织理论,：信息自组织是指作为信息系统组成要素的信息，由于人与人之间、人与系统其它要素之间存在的相关性、协同性或默契性而形成特定结构、功能的过程，也就是信息系统无须外界指令而能自行组织信息、自我走向有序化和优化的过程。,2.,信息组织发展的方法学基础,语言学：,语言是人类最重要的交流符号系统，是信息的载体，包括语词、词汇和语法。,逻辑学：,逻辑学是关于思维规律的科学。进行信息组织工作必然用到形式逻辑的一些方法。,知识分类学：,知识分类是一门研究知识体系结构的学问。信息组织活动必须建立在人们对知识体系认识的基础之上。,3.,信息组织的基本方法方法,1,）、基于传统印刷型载体信息的组织方法,长期以来，以纸张为记录载体的文献组织方法是以分类组织法和主题组织法为主要形式。,（,1,）,所谓,“,类,”,，是指具有某种共同属性的一组事物的集合。,分类步骤,查重,即利用题名目录或机读目录，查明待标的文献与已入藏文献的关系,并根据不同情况进行相应的处理。,分析,首先,从信息论述的问题及其所涉及的各个方面进行分析入手,概括信息的主题。,其次,对构成主题的基本要素，要素对主题的作用以及要素之间的关系进行分析，明确主题结构。,最后,对主题类型进行分析。,（,2,）,主题法的含义,主题,是指信息所论述的主要对象，包括事物、问题、对象等。,用来表述信息主题的词语，称,为,主题词,。,主题法,是直接以表达主题内容的词语作检索标识、以字顺为主要检索途径，并通过详尽的参照系统等方法揭示词间关系的标引和检索方法。,标题法。,单元词法。,关键词法。,叙词法。,2),网络环境下信息资源的组织方法,（,1,）网络对传统信息组织方式的冲击体现在几个方面,信息量剧增及传递速度的加快,信息种类增多，数据库成分复杂化,用户成分发生很大变化，要求信息组织方式的透明化、易用化,网络信息资源共享要求信息组织标准化、兼容化,网络信息资源的组织方法,网络一次信息资源的组织方法（,1,）超文本方法利用超文本技术，将信息组织为网状结构，非顺序性浏览方式，信息表达方式多样，除文字外，还可以是图形、声音、动画等多媒体形式（,2,）自由文本方法根据文献全文的自然状况直接设置检索点，通过计算机自动进行文献信息处理和组织，主要用于全文数据库的组织（,3,）主页方式类似于档案卷宗的组织方式,网络二次信息的组织方法（,1,）搜索引擎方法按关键词查询的,Web,页索引数据库（,2,）主题树方法将信息资源按照某种事先确定的概念体系分门别类地逐层加以组织，用户先通过浏览的方式层层遍历，直至找到所需要的信息线索，再通过信息线索连接到相应的网络信息资源,文档标题,(,网页标题,),文档主体，正文内容（网页内容），很多标,记都作用于此,三、信息组织的技术基础,信息组织的四大基本技术,计算机技术,通信技术,控制技术,传感技术,三、信息组织的技术基础,信息组织中的高新技术,自动分类标引技术：由计算机代替人工对文献信息进行分类，赋予其分类标识，以描述文献主题内容的活动,自动主题标引技术：由计算机自动确定语词标识来表达信息资源主题的过程,汉语自动分词技术：把汉语句子用计算机自动切分成词的技术,字符识别技术,语音识别与语音合成技术,三、信息组织研究的主要内容,、信息资源描述,）文献著录标准化,著录,是指在编制文献目录时，对文献内容和形式特征进行分析、选择和记录的过程,著录的结果是,款目,，它是反映文献内容和形式特征的著录项目的组合,著录的标准化,文献著录标准化,是指在国家或国际范围内，对文献著录的原则、内容、格式等作出具有一定约束力的规范。,1971,年，国际图书馆协会联合会,(IFLA),编目委员会,单行著作国际标准书目著录,(,ISBD(M),。,1976,年,国际标准书目著录总则,(,ISBD-(G),),1978,年，,AACR2,。,我国的著录标准化,文献著录总则,(GB37921-83)(1983,7,月,),普通图书著录规则,连续出版物著录规则,非书资料著录规则,地图资料著录规则,档案著录规则,古籍著录规则,检索期刊条目著录规则,文后参考文献著录规则,）网络信息资源描述的相关标准,文本编码倡议,(Text Encoded Initiative,简称,TEI),都柏林核心集,(Dublin Core,，,简称,DC),政府信息定位服务,(Government Information Locator Service,简称,GILS),联合地理数据委员会的数字地球空间元数据,(Content Standard Digital Geospatial Metadata,简称,CSDGM),可视资源核心范畴,(Core Categories for Visual Resources,简称,CCVR),编码档案描述,(Encoded Archival Description,简称,EDA),博物馆信息的计算机交换,(Computer Interchange of Museum Information,简称,CIMI),其他标准,MARC,（,美国的,USMARC,、,国际标准,UNIMARC,、,中国的,CNMARC,、,日本的,JMARC,、,英国的,UKMARC,、,加拿大的,CANMARC,、,东南亚的,SEAMARC),都柏林核心数据,(Dublin Core),VRA,核心类目,(VRA Core Category),艺术作品著录类目,(Categories for the Description of Works of Arts)CDWA,REACH,著录单元集合,(REACH element set),PICS,、,Web Collections,、,CDF,、,MCF,、,RDF,等。,（）,MARC,标准,MARC(MAchine,Readable Catalogue),机器可读目录起源于美国国会图书馆于,1965,年,1,月提出的“标准机器可读目录记录款式的建议”,(,即,MARC,),。,1967,年,MARC,格式问世,。,MARC,格式的主要特点：,共包括,001,999,个字段，其中,999,字段为用户自定义的字段；,字段内容著录详尽，字段下又设子字段以及重复字段；,字段作用强化，可检索的字段多；,每条,MARC,记录可分为头标区、目次区、数据区。,USMARC(,美国国会图书馆机读目录通信格式,),USMARC,的前身为,MARC,格式，它完全与,ISO-2709,规定一致，只在其字段标识和内容项目上不同。,每条,USNARC,记录由头标区、目录区、数据区三部分组成。,USMARC,格式的主要字段有：目录控制区、主要款目,(,如个人作者、团体机关、会议或者集会、通用书名标目,),、书名出版项、稽核项、丛书项、附注项、主题附加款目、其他附加款目,(,如个人姓名附加款目,),、丛书附加等。,USMARC,的改进,“电子资源地址与存取”字段,(856,字段,),主要记录被著录的数字对象或与之相关的其他电子资源的存储地址和存取方式，为可重复字段,，,包含,27,个子字段。,增加部分“本馆用”字段以弥补不足。,题名字段,(245,字段,),、电子资源地址与存取字段,(856,字段,),为必备字段。,尽可能使用责任者字段,(1),、主题字段,(6),、注释字段,(5),。,UNIMARC(,国际机读目录通信格式,),该标准是,IFLA,于,1976,年在,USMARC,基础上主持制订的。,UNIMARC,主要特点：,UNIMARC,将内容标识符标准化，克服以往各国使用本国,MARC,系统中标识符的专指性。,编排字段不是按卡片目录的著录顺序，而是按字段的内在联系组织数据，并把相同性质的字段编排在一起，组成字段的功能块。,重视书目文献库中相关文献之间的关系,如平行关系、层次关系、从属关系。,CNMARC(,中国机读目录格式,),CNMARC,是我国国家书目机构依据,UNIMARC,制订的,中国机读目录格式,(China MARC Format),，,作为中华人民共和国文化行业标准,WH,T050396,推出，它与,ISO2709,的规定相一致，以,UNIMARC,为依据，并补充了中国出版物特有的字段定义。,它增加了以下字段和子字段：,091,统一书刊号；,092,订购号；,093,专利号；,094,标准号；,690,中国图书馆分类法；,692,中国科学院图书分类法；,905,馆藏信息。,一条,CNMARC,记录的记录头标由,24,个字符构成,地址目次区由三位数字表示的字段号、四位数字表示的字段长度和五位数字表示的字段起始字符位置构成。,数据字段的长度可变，每个字段之间由字段分隔符隔开。数据字段的结构根据字段号的不同,有不同的结构。,记录结构和地址目次区的结构,（,2,）,.Dublin Core(,都柏林核心集,),都柏林核心集,(,Dublin Core Element Set,简称为,Dublin Core,),是描述网络信息资源的一种简单元数据，是文献链接的客体,，,它包括,15,个数据单元。,Dublin Core,的主要优点有,：,简单易懂：,15,个标记元素通俗易懂。,运用灵活：它既可以用于规范的资源描述领域，也可以用于非专业领域。,国际通用：已有德语、日语、葡语、西语等,10,余种不同语种的版本。,可扩展性：不仅,15,个标记元素和子元素可扩展，,Dublin Core,还可以与其他元数据元素连接使用。,都柏林核心元数据探索项目,及设置的限定词,（,Dublin Core Metadata Initiative,简称,DCMI),序号,（,No.,）,描述项目,（,Element,）,限定,（,Element,efinements,）,编码规则,（,Encoding Schemes),1,题名,选择题目,2,描述,目次、文摘,3,主题和关键词,LCSH,、,MeSH,DCC,、,LCC,、,UDC,4,资源类型,DCMI Type、Vocabulary,5,来源,URI,序号,（,No.,）,描述项目,（,Element,）,限定,（,Element,efinements,）,编码规则,（,Encoding Schemes),6,与其他资源的关系,版本、代替关系、需求关系、参考与被参考、格式,7,范围,空间,DCMI Point、ISO3166|、DCMI Box、TGN、DCMI Period、W3C-DTF,时间,创作者,9,其他责任者,10,出版者,序号,（,No.,）,描述项目,（,Element,）,限定,（,Element,efinements,）,编码规则,（,Encoding Schemes),11,权限管理,12,日期,创建、有效、可获取、发表、修改,DCMI Period、W3C-DTF,13,格式,扩展格式,媒介,IMT,14,语言,ISO639-2、RFC1766,15,资源标识,URNs,、,PURL,、,URI,、,ISBN,（,3,）,.VRA,核心类目格式,VRA(VRA Core Categories for Visual Resources)”,格式的著录类目可以分为两类：,视觉文献所记载的原始作品,著录的类目,为三维作品,19,个数据单元；,记载某一种,作品实体的视觉文献特征,的视觉文献著录类目,9,个数据单元：,视觉文献类型、视觉文献格式、视觉文献尺寸、视觉文献出版日期、视觉文献收藏者、视觉文献收藏号码、视觉文献视点描述、视觉文献主题、视觉文献来源。,（,4,）,.,元数据规范,PICS,PICS(The Platform for Internet“Content Selection”),，,W3C(WWW Consortium),于,1995,年组织开发的一种元数据标准。引入内容分类定级机制,.,对,Internet,上的资源进行分类定级。,Web Collections,Web Collections,是较早利用,XML,应用环境建立起来的一个元数据框架。它采用了与,HTML,语言相似的样式风格，其数据可以紧紧地嵌入到,HTML,文档中，便于用户使用，它还引入了一种表示元数据的层次结构的方法，可用于,Web,页面、,Web Map,、,E,mail,、,内容标引、分布式创作,等多种应用场合。,CDF,CDF,频道定义格式,(Channel Definition Format),，是,Microsoft,提出的一种元数据规范。,CDF,借助于,HTML,语法来对其频道内容进行描述，当浏览者接入到该频道后，这些元数据就会展现出来。,MCF,MCF,元数据框架,(Meta Content Framework),，,是,1997,年,Netscape,公司向,W3C,提交的一种元数据方案。,MCF,力求实现一种,“,单一的数据模式和相应的互换格式,”,的元数据框架。其兼容性和包容性好，并允许动态地扩展新的数据类型。,RDF,RDF,资源描述框架,(Resource Description Framework),是为解决现存的各种元数据之间的互操作性,，由,W3C,主导、结合多个元数据团体,(,如,Dublin Core,等,),发展而成的一个框架体系。,RDF,是一个能对结构化的元数据进行编码、交换、再利用的体系框架，它为元数据提供了一个可操作的载体，提供了在各种不同的元数据体系之间的互操作性。,2.,标引,）标引的基本概念,信息标引（文献标引）：,分析文献的内容属性,(,特征,),及相关外表属性，并用特定语言表达分析出的属性或特征，从而赋予文献检索标识的过程。,标引语言,是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统，是根据标引和检索需要而编制的人工语言。,文献标引过程一般包括两个环节：,主题分析,转换标识,）标引语言的基本概念：表达信息主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统。,）标引语言的类型,依据构成原理可将标引语言分为分类语言、主题语言、代码语言。,分类语言可细分为体系分类语言、组配分类语言、体系,组配分类语言。,主题语言可进一步划分为标题语言、单元词语言、叙词语言、关键词语言。,依标识组合时间的分类,先组式语言,先组式语言,是指标识在编表时,(,标引前,),就已组合好，标引和检索时不必或较少进行组配的标引语言。,后组式语言,后组式语言,是指标识主要供组配使用，而且标引时不将标识组配在一起，到检索时才将标识组配起来的标引语言。,散组式语言,散组式语言,是指标识主要供组配使用，而且标引时就要将表达主题概念的若干个标识组配在一起的标引语言。,）、标引的种类,标引的种类最主要的是分类标引和主题标引。,分类标引,是指对文献进行主题分析，用分类语言表达分析出的主题，赋予文献分类检索标识,(,分类号,),的过程。,文献分类,是指根据文献内容及其他相关属性，以分类语言,(,分类法,),为工具，分门别类地系统揭示和组织文献的过程和方法。,主题标引,是指对文献进行主题分析，用主题语言,(,主题法,),表达分析出的主题，赋予文献主题检索标识,(,标题词、叙词等,),的过程。,、信息资源的整序与存储,1)CNKI,CNKI,有光盘、镜像和网络三种服务方式。,主要数据库,中国期刊全文数据库,中国期刊全文数据库（,CJFD,）,报道,1979,年以来国内公开出版的,7000,多种核心期刊与专业特色期刊的全文内容，分理工,A,、,B,、,C,，,农业、医药卫生，文史哲，政治经济法律，教育与社会信息综合，电子技术与信息科学九大专辑，,126,个专题文献数据库。,中国优秀博硕论文全文数据库,报道国内,300,家博士培养单位的优秀博硕论文全文，收录数据从,2000,开始，中心站日更新数据。,中国重要报纸全文数据库,收录,2000,年以来近千种重要报纸刊载的学术性、资料性文献，年报道,80,万篇。数据日更新。,检索途径与方法,（,1,）选择检索用数据库与专辑,（,2,）检索途径：,A,检索式途径,a,初级检索,b,高级检索,c,专业检索,B,导航检索：专辑导航、中图分类法、期刊导航,、信息资源的整序与存储,1)CNKI,）百度,（,1,）搜索器,其主要功能是在互联网中漫游，发现和搜集信息。它通常是一个遵循一定协议的计算机程序，即蜘蛛程序,(,Spider,),。它日夜不停地运转，要尽可能多、尽可能快地抓取网页，搜集各类信息。在,Internet,中信息是用,HTML,语言描述的，不同的,HTML,页面通过其中所包含的超级链接互相联接，这些超级链接以,URL,(,Uniform,Resource Locator,，信息资源的标准通用地址,),的方式被表示出来。,Spider,程序从一个起始的,URL,集开始，顺着,URL,中的超链接,(,Hyper,Link,),以宽度优先、深度优先或启发式方式循环地在互联网中搜集信息。,索引器,索引器将生成从关键词到,URL,的关系索引表。索引表一般使用某种形式的倒排表,(,Inversion,List,),，即由索引项查找相应的,URL,。索引表也可能要记录索引项在文档中出现的位置，以便检索器计算索引项之间的相邻关系或位置关系,(,Proximity,),，并以特定的数据结构存在硬盘上。索引器可以使用集中式标引算法或分布式标引算法。当数据量很大时，必须实现即时索引（,Instant,Indexing,），否则不能够跟上信息量急剧增加的速度。标引算法对索引器的性能（如大规模峰值查询时的响应速度）有很大的影响。一个搜索引擎的有效性在很大程度上取决于索引的质量。,从广义上讲，信息检索包括两个过程，,一是,信息存储,(information storage),，,即信息的标引、加工和存储过程：,二是,信息检索,(information retrieval),，,即信息用户的查找过程。,从狭义上讲，信息检索仅指后一部分。,信息检索的本质是一个,匹配的过程,即用户的信息需求和信息存储的信息集合进行比较和选择的过程,、信息资源的检索与利用,）、检索语言,在信息检索系统中，信息的表示和组织需借助一定的标记系统或语言。信息检索语言就是最重要的标记系统或语言。所谓信息检索语言（简称检索语言），根据国际标准化组织（,ISO,）颁布的有关标准的解释，是指用于信息内容表示、存储和检索等过程的语言，或者是上述语言与给定检索软件中所特有的命令的组合。在西欧国家又称为文献工作语言。,信息检索语言的主要功能,信息表示功能：可用来表示（描述）某一信息（知识）单元的特征和用户的信息需求。,信息,/,知识组织功能：可以利用它来组织信息库或知识仓库中的信息和知识，使之成为一种有序的、便于管理和查询的信息集合或知识集合。,词汇控制和协调功能：能对检索系统中采用的信息表示方式（如标引词、检索词集合）加以规范和控制，使其意义和用法更加明确、专一和统一，同时能与其它检索语言协调一致（一部分检索语言具有此项功能）。,信息检索语言的类型,自然语言（,natural,languages,）在这里是指索引词汇直接来自系统所处理的文献或提问本身，使用前未经优选和规范化处理的一类检索语言。其表现形式为题名或文中的关键词集合、自然语言文本、自然语言提问以及早期的单元词。它往往是标引时手工或机器自动抽词的产物。,受控语言（,control,languages,）指索引词汇在使用前经过优选和规范化处理，并且整个语言经常处于某种权威机构或检索系统的管理和控制之下的各种检索语言的总称，又称规范化语言。,信息检索语言的类型,除了从规范化程度和组配特征来区分以外，还可以依据其他特征对检索语言或知识组织系统作进一步的区分。如：以科学分类为基础建立起来的各种分类系统，如图书分类法、文献分类法以及面向其他对象的分类体系，统称为分类语言。以各专业领域的术语为基础，以概念逻辑为规范手段的各种主题语言，如标题词语言、单元词语言、叙词语言、关键词语言等。,检索语言的类型,64,淘花/百度专用,

展开阅读全文