资源描述
,单击此处编辑母版标题样式,2019/11/22,#,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2025/7/29 周二,1,3.1,信息生命周期,(,information life cycle,),1,定义,信息生命信息对其主体所具有的各种价值的存续期。,信息生命周期信息从生成到其价值绝大部分甚至全部丧失的时间间隔,或者指信息从产生到最终老化过时被处理掉的整个过程,是信息从,“,生,”,到,“,死,”,的轮回,。,2025/7/29 周二,2,2,信息生命周期的五个阶段,确定信息需求:用户所需要信息的内容、格式、类别、媒体、来源、质量和数量,信息生成或采(收)集:渠道、对象、方法和手段,信息处理:重新组合、提炼、压缩、扩充、运算、排序,转换语言、格式、媒体、载体,编制目录、索引,制作文摘、撰写综述、述评、报告,信息利用:终端用户或决策者运用信息进行决策或解决各种问题,信息处置:将老化过时无效的信息从信息集合(信息库)中及时清除掉,2025/7/29 周二,3,3.2,信息用户与信息需求分析,1,信息用户,用户指信息的用户,通常指那些接受信息服务的人类个体或群体。,信息用户的三个特征,拥有信息需求,具备利用信息的能力,具有接受信息服务的行为,潜在信息用户,拥有信息需求,具备利用信息的能力,2,信息需求,信息需求是指向某个图书馆或其他信息系统提出的书面的或口头的要求或请求。,2025/7/29 周二,4,用户信息需求的决定因素用户的特征,个人特征:与生带来的特征和后天发展的特征,组织特征:职业组织、业余组织和社区组织,社会特征:时代背景和社会环境,用户的类型与特点,(见下表),确定用户信息需求的方法,:,总体方式有:用户自己进行识别、信息工作者亲自识别和信息工作者会同用户进行识别,具体方法:采访法、问卷调查法、实地调查法、抽样调查法、观察法、案例历史法、日记法等等,2025/7/29 周二,5,信息用户,需求信息的目的,信息需求的特点,战略层次的信息用户,制定战略决策和长期计划,方案性信息,需求量少、使用频率低、常来源于外部、非重复出现、主要通过非正式渠道获取、多属非文献形态、时间跨越未来、及时程度较低、集成度较高、处理过程复杂、常随问题而变,战术层次的信息用户,控制,对执行结果与计划作比较,并据此对计划进行调整,概要性信息,来源于作业层,通过综合处理生成管理信息,将其与计划参量作对比,可以据此调整原定计划,作业层次的信息用户,具体的操作、实施,确定性信息,需求量大、来源于内部、主要通过正式渠道、多记录于文献之中、常重复出现、使用频率较高、时间回溯过去、及时程度高、处理过程简单、有固定处理程序,表 组织内部不同层次的信息用户的信息需求,2025/7/29 周二,6,3.3,信息源与信息采集,3.3.1,信息源概述,1,信息源的定义,信息源,是指,信息的来源,,即产生信息的地方。,联合国教科文组织出版的,文献术语,将其定义为:个人为满足其信息需要而获得信息的来源。,人、报纸、广播、电视、,Internet,信息源的三个层次(,P121,),2025/7/29 周二,7,信息最原始的来源物质和现象的存在及人类的实践活动。,这种信息源的特点:它提供的是初始信息,内容翔实可靠,但复杂、无序;它传递信息的方式最直接、最迅速;它对信息人员来说具有一定的局限性。,信息开发机构:这是第二层次的信息源,其职能和任务就是专门从事信息的采集、处理、存储和传递,主要包括:专门从事信息生产和服务的机构;各单位的信息部门。,信息系统:它是在信息技术的支持下由信息机构对实践活动中所产生的信息进行过滤加工的成果,它存储了大量的信息,可以通过现代信息网络进行传递,为各类信息部门和信息系统对外服务提供更高层次的信息源基础。,2025/7/29 周二,8,2,信息源的性质,相对性,信息源不是一成不变的,在错综复杂的社会信息流通过程中,任何一个信息源都可能既是信息的发出端又是信息的接收端。,多样性,提供同样信息内容的信息源可能有多种,不确定性,信息源发出的信息的内容、种类、形式、媒体等不固定,生物和社会信息源大多数具有生命周期,2025/7/29 周二,9,替代性,大多数情况下,可用间接源替代直接源。,补充性,不同信息源提供的信息能够相互验证、互为补充,自组织性:对外部环境的冲击具有一定的适应能力,能够自动调节自身以适应外部环境的变化,2025/7/29 周二,10,3,信息源的分类,按照信息生成方式或产生过程,信息源可以划分为初始源和再生源,(原始源和加工源),初始源又称原始源、一次信息源:没有经过信息机构的加工处理,是实践活动中直接产生的。,再生源又称加工源:信息机构对原始信息进行加工、处理、改编和重组而形成的各种信息源。,2025/7/29 周二,11,再生源按加工的深度又分为二次信息源和三次信息源。,前者指各种中介性检索工具,如目录、索引、文摘性检索刊物和书目数据库等;,后者是在原始信息源和二次信息源的基础上,通过分析、综合、浓缩和提炼而形成的高层次的信息源,是对原始信息的深层揭示和报道,如年鉴、手册、述评、进展报告、百科全书等。,2025/7/29 周二,12,按发送信息与组织之间的关系,信息源可以划分为内部源和外部源,内部源的信息完全在组织内部生成的,外部源是指组织的环境,按提供信息的实体形态:机构源和物体源,机构源,:,信息机构、非信息机构,物体源,:,文献源、非文献源,文献信息源可以按其载体形态划分:,手写型文献:甲骨文、简册、帛书、笔记、书稿等,印刷型文献:铅印、胶印、油印等,缩微型文献:缩微胶卷、缩微平片等,计算机阅读型:电子图书、电子期刊,视听型(声像型)文献:唱片、录音(像)带、,CD,、,VCD,、,DVD,等,2025/7/29 周二,13,非文献源:一般强调的是通过人的感官获取的实时信息,或者说第一手知识信息。主要分为:,实物信息源:实物、样品或展览会的展品。如服装、仪器仪表、建筑物、生物品种、化学物质、药品和医疗器械等,实情信息源:自然现象如气候、水文、生物等的演进和反应的状态和过程;社会信息如政治法律事务、军事行动、企、商、事业机构运行状态、演出现场等,口头信息源:存在于人脑记忆中,通过交谈、讨论、报告等方式交流传播的信息。如:会议发言、电话和网络交谈、直接口头交谈等,2025/7/29 周二,14,按生成领域,可把信息源划分自然信息源、生物信息源和社会信息源,自然信息源,是指自然界中的各种无机物,它们是自然科学家研究的对象,生物信息源,是指地球上的各种生物,包括动物、植物和微生物,它们是生物科学家的研究对象,社会信息源,是指由人及其所组成的各类、各级团体、群体、组织乃至他们(它们)的社会活动的成果。,通常人们所说的信息源一般是指社会信息源,包括人、机构和物体。,2025/7/29 周二,15,3.3.2,信息采集,1,信息搜集、信息收集和信息采集的定义,信息搜集,具有积极主动的含义,是指信息获取人员主动出击,想方设法去获取所需要的信息。,信息收集,是指运用各种方法、借助于各种手段,通过各种渠道(正式交流或非正式交流)从不同的信息源获取信息的过程或活动。,信息采集,是信息的选择过程,是根据不断变化的用户信息需求从已确定的信息源体系中连续地选择、提取和收求信息的过程。(,P123,),2025/7/29 周二,16,2,信息采集的方式,第一种是按采集信息的组织方式将信息采集划分为,报告制度,和,专门组织的采集。,第二种是按采集的信息宽度,将信息采集划分为,全面采集,和,非全面采集。,第三种是按采集信息的时间可划分为,定期采集,和,不定期采集,。,2025/7/29 周二,17,3,信息采集的原则,针对性原则:要针对用户的信息需求,完整性原则:全面完整地采集方方面面的信息,及时性原则:信息的时效性和竞争的要求,预见性原则:在用户现时需求的基础上预见需求的未来变化趋势,计划性原则:制定合理的采集计划,有步骤、有条理地进行,连贯性原则:用户的信息需求具有连贯性;信息服务机构和信息系统也需要连续地采集信息以形成系统的信息体系,灵活性原则:灵活采用多种方式和方法采集信息,2025/7/29 周二,18,4,信息采集的步骤,明确任务,确定目标,制定计划,设计信息结构,确定采集的对象和方式,宣传与培训,开展采集试点,实施修订过的采集计划,2025/7/29 周二,19,5,信息采集的质量控制,要严格审查采集计划,要确保采集步骤严密完善,采集人员要有很强的责任心,要掌握采集的基本技术,提供信息的个人、组织要对自己提供的信息质量负责,采集单位要对采集到的信息进行审核,主要审核填报的信息内容的正确性、完整性、及时性,2025/7/29 周二,20,6,信息采集的渠道和方法,渠道主要有:大众传媒渠道、出版发行渠道、人际关系渠道、文献情报机构渠道、专业性学会渠道、行业协会渠道社会中介机构渠道、信息发布机构渠道、互联网渠道、各类会议渠道、邮政部门渠道等等,具体方法:,调查法就是深入被采集的信息对象处,通过实地观察信息对象采集有关的信息:全面调查、典型调查、重点调查、详细调查和抽样调查,2025/7/29 周二,21,统计法就是按照统计法规和统计工作的有关规定自下而上地收集信息,一般说来统计工作的信息收集主要采用的是填表法,上一级统计部门对下一级统计部门提交的统计数据进行汇总、分析,并得出相应的结论。,会计法就是按照会计法规和会计工作的有关规定来收集信息。,预测法是指在收集、分析、研究历史信息的基础上推测和把握事物未来的运动变化规律。,2025/7/29 周二,22,新闻收集法就是通过收听、收看和阅读新闻报道的方法来收集信息。,文献调查法就是收集与某事物有关的各种记录形态的信息,包括图书、期刊、报纸、专利说明、产品样本、技术报告、广告、简报、宣传材料,等等。,测试法就是对获得的信息对象运用各种仪器进行测量来获取相关的信息,这是反求工程所运用的主要方法。,试验法主要是针对新产品、新服务、新计划而言的,在这些项目尚未正式推广之前,可以采用局部试点或试验的方法来收集信息。,检索法就是通过各种方式进入数据库中收集相关信息。,搜索法就是利用已经上网的计算机对网上信息进行搜寻。,2025/7/29 周二,23,举例说明一种较常用的信息采集方法:调查法,访问调查法和问卷调查法,访问调查法:又叫采访法,是新闻机构常用的信息采集方法,它又包括电话采访、信函采访、会议采访、观察采访、座谈采访、单独采访等。,注意事项:做好充分准备(把问题吃透并具体化、纲要化,认真选择并了解调查对象和相关背景);访问中要机智灵活,善于交流互动。,问卷调查法:是一种统计调查和定量分析的信息采集方法,此法主要考虑的问题是:所采集的信息的内容范围、数量,所选定的调查对象的代表性、数量,问卷的精心设计、数量,问卷的回收率的控制,回收后问卷的统计分析,对分析结果的评价等。,2025/7/29 周二,24,问卷调查法的主要特点:费用较低,调查面广,但调查对象无法控制,问卷回收率不高,问卷回答的质量也不高。,问卷的设计形式:结构式、非结构式和混合式,调查表:(,微软出版社作者俱乐部调查表),前言,调查项目,问答形式:结构式、开放式,结束语,2025/7/29 周二,25,7,网络信息采集,这里主要是指搜索引擎的信息采集机制和方法,即对,WWW,站点和其他网络信息资源进行采集、标引和检索的一类检索系统机制。主要涉及它的信息采集机制。,基本机制,:,搜索引擎的信息采集机制是按照一定规律和方式对网络上,WWW,站点进行搜索,并将搜索到的,WWW,页面信息存入搜索引擎的临时数据库。,自动采集器,:,是采用自动采集方式的搜索引擎的核心,是一种在网络上搜索文件、自动跟踪该文件超文本结构并循环检索被参照文件的软件。,2025/7/29 周二,26,3.4,信息处理与信息组织,3.4.1,信息处理和信息组织的定义,1,信息处理,狭义的信息处理,仅指信息加工,也就是对收集到或生产出的信息进行转换、增删、重组,它既可以是载体的转换,也可以是描述方式的转换,甚至可以是内容方面的提炼、延伸。,广义的信息处理,是指科学计算、实时控制和事务处理。,2025/7/29 周二,27,2,信息组织,运用科学的方法来提高信息的有序程度,它包括信息选择、加工、分析、提炼、转述等活动。,根据信息的内容特征和外部特征,采用一定的原则和方法,对信息进行加工处理,使之有序可用的过程。(,P128,),2025/7/29 周二,28,3.4.2,信息组织方法的分类,按信息本身的层次划分可分为,(P128),:,语法层次的信息组织方法,语义层次的信息组织方法,语用层次的信息组织方法,2025/7/29 周二,29,语法层次的信息组织方法,语法层次的信息组织方法又称为语法信息组织:是以信息的形式特征为根据序化信息的方法。,重要特征是标准化:因为语法信息不涉及含义和用途,必须用标准化来约束;标准的形成和应用的过程就是语法信息优化的过程。,常见的有:,字顺组织法,代码组织法:代码一般是指代表事物的名称、属性、状态的符号和记号,地序组织法,时序组织法,其他组织法,2025/7/29 周二,30,语义层次的信息组织方法,语义层次的信息组织法又称为语义信息组织,是指以信息的内容或本质特征为依据序化信息的方法。,语义信息组织要遵循客观性、逻辑性和发展性原则,常见的有:,分类组织法就是根据分类对象的内容性质、形式体裁、读者用途等分门别类地系统地组织事物的方法。,主题组织法指直接用语词作为表达主题概念的标识,并用字顺排列标识和用参照系统等方法来间接表达各概念之间的相互关系的信息组织方法。,2025/7/29 周二,31,语用层次的信息组织方法,语用层次的信息组织方法又称为语用信息组织,是以信息的效用特征为依据序化信息的方法。,语用信息组织遵循目的性、实用性和个性化原则。,常见的有:,重要性大小组织法:递增法和递减法。如:大众传媒的栏目设计,推荐书目的款目安排等。,权值组织法:即赋予不同的信息以不同的权重值,然后通过复杂的计算,以权重大小组织信息的方法。如:决策方案的选择和教学质量评估等。,概率组织法:即根据事件发生的概率大小序化信息的方法。如期货交易等过程。,2025/7/29 周二,32,3.4.3,信息组织的基本原理,1 信息组织的语言学基础,2,信息组织的逻辑学基础,3,检索语言的构成原理,2025/7/29 周二,33,信息的非物质性决定了其内容要借助于一定的符号系统来表达,常见的符号有文字、数字、字母、代码、图形、图像、分子式等。,符号系统中的符号均代表一定的含义,不同符号之间可根据它们所代表的意义相互转换,语言是最常见的符号系统,它具有很强的独立性,是信息组织的重要工具,1,信息组织的语言学基础,2025/7/29 周二,34,语言的分类,语言的,分类,自然语言(,natural languages),利用自然语言来组织信息,过去是、现在是、将来也还是人们努力的方向。,自然语言本身存在缺陷,语词与概念不一一对应,存在着一词多义、多词一义和词义含糊等现象,现在它还不是最主要的信息组织工具。,人工语言(,artificial or synthetic languages),为了克服自然语言的这些缺陷,人们发明了人工语言。,2025/7/29 周二,35,人工语言,机器语言,机器语言是某种机器可以接受的记录信息、记录解题方法的形式符号系统,模拟语言描述的是与原信息成比例的信号,比如用连续变化的电流、电压来表示原信息。,数字语言中主要采用不连续的数字来表示原信息,其中最常见的是电子计算机里使用的二进制语言,混合语言是前两者的有机结合,检索语言,描述信息的内容特征与外部特征,语词与概念之间一一对应,而且能显示概念之间的相互关系,信息语言、信息检索语言、信息存储与检索语言,、,索引语言、标引语言、标引符号、标识系统,2025/7/29 周二,36,检索语言的构成,有一套专用字符用以构词,有一定数量的能够表达基本概念的基本词汇,词汇是登录在类表、词表中的全部标识。词汇由语词组成,语词是词表中的一个标识,如分类号、检索词、代码。,有一套能够表达复杂概念的语法规则,有一种能把自然语言转换成检索语言的工具,即词典,也称为类表、词表(分类表,、,主题词表),,,它们都是检索语言中语词的词典。,2025/7/29 周二,37,检索语言的实例,目前全世界有近千种检索语言,最主要的有:,国际十进分类法(,UDC,universal decimal classification),杜威十进分类法(,Dewey Decimal Classification),NASA(National Aeronautics Space Administration),叙词表,中国图书馆分类法,中国图书资料分类法,中国科学院图书馆分类法,汉语主题词表,军用主题词表,2025/7/29 周二,38,检索语言的分类,按照结构原理划分,分类语言,用分类号表达各种概念,采用概念划分与概括的方法,将各种概念按照科学的原则进行分类和系统排列,建立起等级体系。如国际十进分类法,描述语言,用语词来表达各种概念,并将各种概念不管其相互关系而完全按照字顺进行排列。如,NASA,叙词表,代码语言,用某种代码来表示事物的某一方面特征,并加以标引和排列。如化合物的分子式语言,有时也可将这几种语言结合使用,比如我国的国民经济行业分类与代码,2025/7/29 周二,39,按照组配的方式,先组式语言,其标识在编表时就已经组配好,如各种分类语言,后组式语言,其标识只有在检索时才组配起来,如各种叙词语言,2025/7/29 周二,40,对检索语言的基本要求,有较高的查全率和查准率,输出的相关信息数,查全率=,100%,集合(信息系统)中的相关信息总数,A,=,100%,A+C,输出的相关信息数,查准率=,100%,输出的信息总数,A,=,100%,A+B,A,检准的相关信息数,B,误检的信息数(无关信息),C,遗漏的相关信息数,D,无关的信息数,2025/7/29 周二,41,满足多途径检索的要求,多途径检索,从多个侧面进行检索,如书名、著者、分类、主题等途径等,族性检索,从学科、专业出发的检索,是一,种范围较广的检索,特性检索,从事物出发的检索,是一种范围,较窄的检索,扩检和缩检,扩大和缩小检索的范围,2025/7/29 周二,42,易于标引、易于检索,具有对先进检索方式和检索设备的适应性,标引,主题分析,(概念标引),对信息的内容进行调查研究以形成概念的过程,符号标引,(简称标引),将概念转换成为检索语言的标识,2025/7/29 周二,43,2 信息组织的逻辑学基础,逻辑(,logic),是思维的规律性或客观事物的规律性,检索语言是表达一系列信息内容的概念及其相互关系的概念标识系统,是建立在概念逻辑的基础上,概念是事物本质属性的概括,概念逻辑是揭示事物本质属性及其之间的区别与联系的科学思维方法。,检索语言要能准确表达不同的概念,还要显示它们之间的关系。,2025/7/29 周二,44,概念的内涵与外延,概念的内涵即其含义,是它所指事物的本质属性的总和,概念的内涵有深浅,即它所概括的事物的 本质属性有多少,概念的外延是其适用范围,即它所包含的所有事物,概念的外延有广窄,即它的适用范围有大小,概念的内涵与外延之间成反比关系,概念的内涵越浅,则它的外延越广,2025/7/29 周二,45,概念之间的关系,全同关系,全同关系又称为同一关系、重合关系,是指有同一外延、不同内涵的两个概念之间的关系。,在全同关系中的两个概念实际上是指同一事物,故在检索语言中要加以合并,即只选择其中一个作为标识,以提高专指性。,电子计算机与电脑、小苏打与碳酸氢钠、父亲与爸爸、庐州与合肥、,DNA,与脱氧核糖核酸等。,2025/7/29 周二,46,属种关系,属种关系是指两个概念中一个概念完全被包含在另一个概念的外延里,是该概念外延的一部分,在属种关系中,外延较大概念是属概念或上位概念,外延较小的概念是种概念或下位概念,生物与动物、学生与小学生、学校与大学、行星与地球,飞机、直升飞机、喷气式直升飞机。,2025/7/29 周二,47,整体与部分关系,整体与部分关系是指在两个概念中,其中一个概念概括某一事物,而另外一概念仅仅表示这一概念的某一部分,中国与安徽、安徽农业大学与(安徽农业大学)管理科学学院、人体与(人的)心脏、汽车与(汽车的)方向盘、树与树干等,属种指同族事物的属与种、类称与别称之间的关系,整体与部分关系关系指两个不同族的事物一个成为另一个的构成部分之间的关系,2025/7/29 周二,48,交叉关系,交叉关系也称为部分重合关系,是指两个概念之间的外延有一部分重合所形成的关系,两个概念的外延重合部分(即相同部分)常常 能形成一个新概念,其内涵等于两个交叉概念的内涵之和,该新概念对原来两个概念中的任何一个都属下位概念,古代史+中国史=中国古代史,核动力舰+驱逐舰=核动力驱逐舰,彩色打印机+手提打印机=彩色手提打印机(或手提彩色打印机),2025/7/29 周二,49,并列关系,并列关系又成为同位关系,是指同一个概念之下的几个种概念之间的关系,具有并列关系的各个概念互称为并列概念或者同位概念,综合性大学、师范大学、工业大学、农业大学、医科大学、铁道大学、交通大学、测绘大学都是大学这一属概念之下的种概念,故它们之间的关系就是并列关系,2025/7/29 周二,50,矛盾关系,矛盾关系是指外延总和等于其上位概念全部外延的两个并列概念之间的关系,是并列关系的一种特殊形式,金属材料与非金属材料的外延总和等于材料这一概念的全部外延,男学生和女学生这两个概念的外延总和也等于学生这一概念的全部外延,正极与负极这两个概念的外延总和也等于极性这一概念的全部外延,2025/7/29 周二,51,对立关系,对立关系是指外延总和小于其上位概念全部外延的两个概念之间的关系,也是并列关系的一种特殊形式,导电体和绝缘体之间即为此关系,因为它们的上位概念是导电性,而导电性这一概念的外延中除了包括导电体和绝缘体之外,还包括半导体,酸性与碱性也是这种关系,因为在物质的酸碱性中还包括了中性,2025/7/29 周二,52,检索语言在表达概念及其相互关系时,利用了概念逻辑原理,用概念的划分与概括和概念的分析与综合这两种逻辑方法建立起自己的体系结构,3 检索语言的构成原理,2025/7/29 周二,53,3 检索语言的构成原理,检索语言在表达概念及其相互关系时,利用了概念逻辑原理,用概念的划分与概括和概念的分析与综合这两种逻辑方法建立起自己的体系结构,利用概念的划分(缩小)与概括(扩大)原理分类,概念的缩小(概念限制)即增加属性,如管理、经济管理、信息经济管理、中国信息经济管理;,概念扩大(概念概括)即减少属性,如中国信息经济管理、信息经济管理、经济管理、管理。,2025/7/29 周二,54,利用概念的分析(分解)与综合(合成)组配,,可建立起另外一种形式的检索语言体系结构概念组配体系,如叙词法,两个概念的外延重合部分可以构成一个新词,其内涵等于原来的两个概念内涵之和,它和原来的两个概念之间具有隶属关系,故可将一个内涵较深的概念分解成为两个或两个以上的内涵较浅的概念,也可反向进行。,2025/7/29 周二,55,3.4.4,信息组织的内容(,P130,),信息组织的内容包括信息源外表特征描述、信息源内容特征描述、信息重组和信息存储,4,个方面,其中信息源外部特征的描述是信息的初级组织,信息源内容特征的揭示是信息的中级组织,信息重组是信息的高级组织,信息存储是对信息及其他信息组织的成果的空间组织。四者相互独立又相互联系,共同构成信息组织的完整内容。,2025/7/29 周二,56,1,信息源外表特征的描述,即信息形式特征的描述,是根据一定的原则和方法,对信息的外表特征和部分内容特征进行全面描述并予以记录的过程。,目前比较成熟的是对文献信息描述的,ISBD,模式。它主要采用统一描述格式、统一描述内容和统一描述符号的方式,核心是统一描述内容,在此基础上运用统一描述符号按统一描述格式记录。,2025/7/29 周二,57,ISBD,描述内容包括如下,8,大项目:题名与责任者项、版本项、信息特殊细节项、出版发行项、载体形态项、丛编项、附注项、国际标准编号和获得方式项。我国的,文献著录总则,、,普通图书著录规则,等等都是以,ISBD,为基础的。,另一种重要的信息描述模式是,MARC,(,Machine Readable Catalogue,)模式,这是一种在,ISBD,模式上利用计算机技术的新型处理格式,是一种国际性的书目数据交换格式。,2025/7/29 周二,58,2,信息内容特征的揭示,信息内容特征的揭示是指对信息内容特征进行深层揭示并转换成规范化的标识(包括分类号和主题词),形成科学的概念标识系统。它需要利用一定的工具(信息组织语言)或规范(标引规范)将信息内容特征进行转换。,2025/7/29 周二,59,3,信息重组,这是在信息内容特征分析的基础上的具有创造性的活动。它根据特定的目的和任务,对有关的大量信息进行系统性、综合性的加工处理,形成新的信息的过程。,其基本方法是:以一批相关信息为基础,利用分析、鉴别、浓缩、提炼、综合归纳和评价等手段,对信息中的相关方面知识点进行重组,形成更加系统的信息产品或知识产品。,信息重组的过程中融入了信息分析人员的智能,形成了新的信息组合,因此是高级的信息组织活动。信息重组的结果常常表现为,综述、述评、进展报告、研究报告,等。,2025/7/29 周二,60,4,信息存储,指在对信息的外部、内容特征进行描述,且在确定标识之后按一定的规则和方法,把所有的信息记录组织成为一个有序的体系,以方便人们检索利用。因此,信息存储是信息在空间中的科学排列和组织,也是形成信息系统的一项必不可少的组织环节。,一般地讲,信息存储都是以信息的外部特征或内容特征作为主要存取依据的,因而信息存储与信息的描述、揭示和重组并不是截然分开的两个方面,信息存储在很大程度上还要依赖于信息的描述、揭示和重组并且同时还要对信息的描述、揭示和重组成果进行存储。,2025/7/29 周二,61,信息存储主要有两种方式:,第一是手工存储,主要是存储空间如何划分的问题。比如按照文献载体类型区分为普通书库、报刊库、线装库、缩微资料库和声像资料库等;按照文献的利用率可分为一线书库、二线书库、三线书库等;按照文献的学科属性划分为社会科学、自然科学书库。,第二是计算机存储,这主要是利用计算机技术及其现代化存储技术如光盘技术和数据库技术等多种信息技术实现信息的自动化存储和管理。一方面可以节省存储空间,另一方面是信息管理现代化的必然要求。其结果就是形成一个由各种信息组成的动态性集合,并由计算机技术及相关技术支持的信息数据库。,2025/7/29 周二,62,信息存储不仅是信息的归档和排列,而且还有一个维护和更新问题。,手工存储中的维护问题主要表现为存储空间的保护和信息资料的保管问题,当然主要是信息资料的保管问题(考虑温度、湿度、灰尘、大气污染、有害生物、阳光、灾害等)。,计算机存储中,除存储介质的维护外,计算机系统维护也非常重要,包括计算机硬件、软件、数据库、机房、人员等多方面的维护。,2025/7/29 周二,63,3.4.5,信息组织方法,凡是能将信息按一定的规律进行有序排列的方法,都称为信息的组织方法。,明确信息的外部特征和内容特征(属性)。,外部特征是物质载体所直接反映的特征,,指文献的书名(刊名)、著者、出版者、出版地、语种、版次、刊期、以及各种编号等等。按外部特征组织信息的有引用法、索引法。,内容特征指信息所包含和承载的具体内容,。按内容特征组织信息的有分类法、主题法、文摘法。,另外还有代码组织法,网上信息组织法。,2025/7/29 周二,64,1,分类组织法,“,类,”,是指在性质上相同或相似的事物,属性相同的或相似的事物就属同类事物。,分类是人类认识事物的一种思维方式,分类就是把相同的或不同的事物区别开来,把不同的事物根据彼此相互关系,联成一个系统。,类的形成以相同性或相似性为条件,相同的东西加上一点不同的因素,就形成同类中的另一小类。,2025/7/29 周二,65,分类组织法就是根据分类对象的内容性质、形式体裁、读者用途等分门别类地系统地组织事物的方法。,分类法主要有分面分类法(面分类法)和体系分类法(线分类法),分面分类法(组配分类法),即按一定标准将各个事物概念的属性划分为一个个的面。面就是一些具有某一共同特征属性的一组事物。在一个面里都含有许多具有同一范畴性质的类目。把这些面以及面下面的细目的标识符号,按照一定的组配顺序编排成为一个个的分类表。,2025/7/29 周二,66,体系分类法(学科体系分类法、层累制分类法、等级制分类法),是把所有类目主要按照学科知识的体系和内在的逻辑性,采取尽量列举类目的方式,组成一个有等级层次的分类系统。,(文献的)体系分类法是以科学分类为基础,运用概念划分的方法,按知识门类的逻辑关系,从总到分,从一般到具体,层层划分逐级展开的层累制号码检索系统。根据这种方法编制的目录称之为分类目录。,(文献)分类包括分类和归类两个方面,前者是指建立分类体系,后者是指运用该体系来分类文献。,分类要按分类表(类分文献的工具)来组织。,2025/7/29 周二,67,分,类,表,类目,是每一个,“,类,”,的名称,又称类名,号码,类目的代号(类号),既表示类目在分类体系中的位置,也表示它的排列顺序,正表,分类体系的具体体现,一般可分为基本部类表、基本大类表(大纲)、重要类目表(简表)和详细类目表(详表)等,附表,辅表或复分表,其功能是辅助正表之不足,便于正表类目的扩展,说明,包括绪论说明、大类说明和类目注释等,是对分类表的编制目的、结构原理和使用方法等的提示,索引,按字顺方式利用分类表的一种工具,常以检索表的形式附在分类表的最后,以帮助分类人员和读者正确使用分类表,2025/7/29 周二,68,分类法的特点,从事物的某一方面出发,按表达事物的层累制号码排列,同一学科内容的资料集中在一起,可以体现学科的系统性,反映事物的从属派生关系,便于按学科体系进行族性检索,以人工语言(数字、字母代号)作为标记符号,不直观,较难记,体系固定,增补新类目不及时,但按分类号组织分类目录较容易,组配方式较机械,较难满足多元检索要求,2025/7/29 周二,69,分类组织法的实施保障分类基本标引规则,(,P134,),信息分类要以信息的学科内容或专业属性为主要标准。必要时再参照其他特征进行标引,信息分类要体现逻辑性、系统性。信息所归入的类目与其上位类之间的关系体现出分类法的逻辑性、等级性、次第性。,信息归入其最大用途的类,。,以专指性为原则。把信息归入最切合实际的专指的类目层次,能入下位类,就不要归入其上位类。,不可单凭信息的题名的含义归类,。,信息分类要坚持一致性原则。同一信息归入一类,使同一种信息集中在一起,也就是说同种信息必须同类、同号。,2025/7/29 周二,70,主题组织法又称词汇控制法。指直接用语词作为表达主题概念的标识,并用字顺排列标识和用参照系统等方法来间接表达各概念之间的相互关系的一种组织方法。,主题组织法可分为标题法、单元词法、叙词法和关键词法等。,2,主题组织法,2025/7/29 周二,71,标题法,标题词是指用来表达主题内容(即主题标识)的、经过规范化处理的自然语言中的词或词组。,标题法是指用经过规范化处理的自然语言中的名称术语作为标识来直接表达文献所涉及或论及的事物主题,并将全部标识按照字顺方式进行排序,用参照系统来间接显示标识所表达的事物主题之间的相互关系的组织方法。,简单地说,标题就是表达文献主题的一种语言形式,按照这种标题的字顺来组织文献信息检索工具的方法就是标题法。,2025/7/29 周二,72,例一篇关于羊饲养的文章和一篇关于羊病防治的文章,在标题系统中,它们都可直接用,“,羊,”,(或,“,羊,饲养,”,、,“,羊,疾病,”,)来做标题而不是用,“,畜牧学,羊,”,、,“,兽医学,羊,”,来做标题,并都按,“,羊,”,字排列被集中到一起。,检索时,不管是,“,羊饲养,”,还是,“,羊治病,”,的信息,也不论其学科性质,都按照字顺查,“,羊,”,即可,如将有关,“,羊,”,的信息全部找到,在,“,羊,”,的标题下可看到一条参照,“,参见羊、山羊、黄羊,”,,据此可将相关信息全部查出。,2025/7/29 周二,73,例一篇关于羊的饲养的文章和一篇关于山羊的饲养的文章,它们的标题分别为,“,羊,”,(或,“,羊,饲养,”,)和,“,山羊,”,(或,“,山羊,饲养,”,),它们在标题系统中都是按照,“,羊,”,和,“,山羊,”,的字顺来排列的,因而被分散在两处。,这是标题法的,缺点,。,如何解决这一,“,分散,”,问题呢?,2025/7/29 周二,74,标题词关系的显示,标题的语义参照(标题参照系统)是标题法揭示标题(概念)之间的语义关系的一种重要手段。主要有单纯参照、相关参照和一般参照。,单纯参照是反映同义关系的参照,一般用,“,见,”,、,“,见自,”,来显示等同关系。,相关参照是指两个具有等级或者相关关系而又是正式使用的标题词之间的参照,用,“,参见,”,、,“,参见自,”,来显示。,一般参照是一种概括性的举例性参照。,2025/7/29 周二,75,等同关系的显示,等级关系的显示,非标题词,见,标题词,标题词,见自,非标题词,电脑,见,计算机,孙中山,见自,孙逸仙,上级标题词,参见,下级标题词,下级标题词,参见自,上级标题词,电机,参见,电动机,发电机,标题词,A,参见,标题词,B,电动机,参见,发电机,标题词,B,参见,标题词,A,发电机,参见,电动机,相关关系的显示,2025/7/29 周二,76,标题法的特点,标题之间的顺序关系是预先组配好的,属先组式,标引和检索时直接使用,不易混乱,使用不灵活,不能满足多途径检索要求,标题法以事物为中心来集中与该事物有关的文献,适于从主题出发进行检索,易查找某一主题的文献,且使用方便、检索速度快、修改容易,2025/7/29 周二,77,单元词法,单元词(,uniterm),是指一个个在概念上不能再分的、最小的、最基本的词汇单位,是能够独立地描述文献所论及或涉及的事物,主题的那些单词。它们可以是:,单纯词,“,山,”,、,“,水,”,、,“,氧,”,、,“,玻璃,”,、,“,逻辑,”,、,“,火车,”,、,“,资料,”,、,“,马克思,”,、,“,乌鲁木齐,”,合成词,“,文字,”,、,“,图书馆,”,、,“,车床,”,、,“,隔音,”,、,“,公路,”,这些词的特点是在概念上不能再进一步分解,如进一步分解将不能表达原来的概念,从而失去检索意义。,2025/7/29 周二,78,单元词法就是用规范化了的单元词来表示文献的主题,单元词是构成标题的部件,它们本身绝大部分是不符合,“,直接精确地表达文献主题,”,这一基本要求的,“,标题词,”,,只有用单元词的相互组合(即组配)才能构成一个个专指的,“,标题,”,,以精确地表达文献主题或进行检索。,单元词法的构成原理是组配,即任何完整的、复杂的概念都可以分解成为一般的单元词,反过来说,任何复杂的概念都可由单元词的组合(组配)而成。,2025/7/29 周二,79,组配就是从主题词表(但组配也适用于分类组织法)中选取两个或两个以上的主题词,按照一定的概念组合关系和符号,把它们有机地结合起来,以表达更为专指的主题。,单元词,复杂概念,隔音+纸,隔音纸,隔音+板,隔音板,隔音+塑料+板,隔音塑料板,2025/7/29 周二,80,单元词法的主要特点,可以同时使用多个单元词,对同一份文献从不同的侧面分别,进行标引,;,单元词之间不存在次序问题,,可能产生误检,。如查找,“,学校图书馆,”,时,由于使用,“,图书馆,”,和,“,学校,”,这两个单元词进行组配,结果可能
展开阅读全文