1、9 9输出一次信息信息特征检索语言信息特征标识检索结果信息需求检索提问检索提问标识分析标引提取输入检索数据库信息检索系统存储过程检索过程分析9 92 文献的组织方法与检索语言2.1文献组织的基本方法文献组织的基本方法语法信息组织法语法信息组织法字顺组织法字顺组织法代码法代码法地序组织法地序组织法时序组织法时序组织法语义信息组织法语义信息组织法分类组织法分类组织法主题组织法主题组织法9 92.2 分类组织法分类组织方法分类组织方法又称又称分类语言分类语言,是将文献主题概念按知识学科性质进行,是将文献主题概念按知识学科性质进行分类和系统排列,并用号码(分类号)表达各种概念的检分类和系统排列,并用号
2、码(分类号)表达各种概念的检索语言,包括索语言,包括体系分类法体系分类法和组配分类法。和组配分类法。中国图书馆分类法中国图书馆分类法中图法中图法将所有图书分为将所有图书分为5大基本部类大基本部类(马列毛思想、哲(马列毛思想、哲学、社会科学、自然科学、综合性图书学、社会科学、自然科学、综合性图书),22个个大类。大类。杜威十进分类法杜威十进分类法(DDC)杜威十进分类法杜威十进分类法:1873年美国图书馆学家杜威所创,年美国图书馆学家杜威所创,目前已被翻译成目前已被翻译成30多种语言,在全球超过多种语言,在全球超过135个国家的个国家的20多万个图书馆使用。国外多万个图书馆使用。国外许多分类法均
3、是借鉴于杜威分类许多分类法均是借鉴于杜威分类法产生的,如分类法、国际十进分类法法产生的,如分类法、国际十进分类法。9 9中图法简表A马、列、毛、马、列、毛、邓理论邓理论B哲学、宗教哲学、宗教C社会科学总论社会科学总论D政治、法律政治、法律E军事军事F经济经济G文化、科学、教育、体育文化、科学、教育、体育H语言、文字语言、文字I文学文学J艺术艺术K历史、地理历史、地理 N自然科学总论自然科学总论O数理科学和化学数理科学和化学P天文学、地球科学天文学、地球科学Q生物科学生物科学R医药、卫生医药、卫生S农业科学农业科学T工业技术工业技术U交通运输交通运输V航空、航天航空、航天X环境科学、安全科学环境
4、科学、安全科学Z综合性图书综合性图书9 9T工业技术工业技术TP自动化技术、计算机技术自动化技术、计算机技术TP1自动化基础理论自动化基础理论TP2自动化技术及设备自动化技术及设备TP3计算技术、计算机技术计算技术、计算机技术TP30一般性问题一般性问题TP31计算机软件计算机软件TP311程序设计、软件工程程序设计、软件工程TP311.1程序设计程序设计TP311.11程序设计方法程序设计方法TP311.12数据结构数据结构TP311.13数据库理论与系统数据库理论与系统TP311.131数据库理论数据库理论TP311.132数据库系统:按类型分数据库系统:按类型分TP311.132.1层次
5、数据库层次数据库TP311.132.2网络数据库网络数据库TP311.132.3关系数据库关系数据库TP311.132.4面向对象的数据库面向对象的数据库.TP6射流技术射流技术TP7遥感技术遥感技术TP8远动技术远动技术9 9杜威十进分类法(DDC)310普通统计学普通统计学000总类总类320政治学政治学371学校管理、学校管理、100哲学类哲学类330经济学经济学特殊教育特殊教育200宗教类宗教类340法律法律372初等教育初等教育300社会科学类社会科学类350公共行政管理公共行政管理373中等教育中等教育400语言类语言类360社会机构社会团体社会机构社会团体374成人教育成人教育5
6、00纯科学类纯科学类370教育教育375课程课程600应用科学类应用科学类380商务、通讯、运输商务、通讯、运输376妇女教育妇女教育700艺术类艺术类390习俗、礼仪、民俗习俗、礼仪、民俗377学校与宗教学校与宗教800文学类文学类378高等教育高等教育900地理历史类地理历史类379政府法规政府法规管理与资助管理与资助9 92.3 主题组织法也称也称主题语言主题语言,是一种用语词标识处理原始信息、,是一种用语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元词语言、语言又分为标题词语言、单元词语言、关键词语关键
7、词语言言和和叙词语言叙词语言。9 92.3.1 关键词语言关键词语言关键词语言是直接选用文献信息中的自是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检索语语词作为关键词进行标引的一种检索语言。言。9 92.3.2 叙词语言 叙词语言叙词语言是以自然语言词汇为基础,以概念组配为基本是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信息检索语特征,适应现代信息需求而发展起来的一种信息检索语言类型。言类型。叙词叙词又称描述词、叙述词
8、,是以概念为基础,经过优选又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系显示功能,和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。用以表达文献主题和检索需要的语词。叙词语言的特点:直观,专指性强,组配性高,结构严叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。谨,标引能力强。叙词语言示例:叙词语言示例:汉语主题词表汉语主题词表、英国、英国科学文摘科学文摘使用的使用的INSPECThesaurus、美国、美国工程索引工程索引93年后使用的年后使用的EiThesaurus等。等。9 9 INSPECThesa
9、urus按叙词的英文字顺排列,每个叙词下都列出按叙词的英文字顺排列,每个叙词下都列出该词的使用范围说明、使用时间、上位词、下位该词的使用范围说明、使用时间、上位词、下位词等相关信息,检索者根据从叙词表中获得的主词等相关信息,检索者根据从叙词表中获得的主题词信息,可以相应题词信息,可以相应扩大或缩小检索用词范围扩大或缩小检索用词范围,达到最佳检索效果达到最佳检索效果。9 9nINSPECThesaurus叙词主表叙词主表nLaserbeammachining激光发热切割器激光发热切割器nUFLaserdrilling激光钻孔器激光钻孔器nLasermachining激光切割器激光切割器nLase
10、rtrimming激光整修激光整修nBTLaserbeamapplications激光发热应用激光发热应用nMachining制造制造nTTLasterbeanapplications激光发热应用激光发热应用nManufacturingprocesses加工过程加工过程nRTLaserbeametching激光发热雕刻激光发热雕刻nLasermaterialsprocessing激光材料制作激光材料制作nMicromachining微切削加工微切削加工nCCB0170G;B2575F;B4360B;B8620;C3355C分类号分类号nDTJuly1973使用年使用年nPTLaserbeama
11、pplications激光的发热应用激光的发热应用nMachining制造制造9 9INSPECThesaurus词族表:词族表:此表反映所有叙词之间的从属关系,此表反映所有叙词之间的从属关系,以主表中的族首词字顺排列,以主表中的族首词字顺排列,前面小圆点越多,前面小圆点越多,代表该词级别越低代表该词级别越低,任何一级带圆点的叙词是离,任何一级带圆点的叙词是离它最近的、少一个圆点的上一级叙词的下位词。它最近的、少一个圆点的上一级叙词的下位词。9 9INSPEC Thesaurus词族表laserbeamapplications激光发热应用激光发热应用 Laser applications in
12、 medicine Laser beam machining Laser beam welding Laser materials processing Laser ablation(激光烧蚀)pulsed laser deposition(脉冲激光沉积)Laser beam annealing Plasma heating by laser Plasma production by laser Laser fusion Remote sensing by laser beam9 93 常用的计算机文献检索方法布尔检索方法布尔检索方法1字段限定检索方法字段限定检索方法3截词检索方法截词检索方法
13、9 93.1布尔检索布尔检索布尔检索布尔检索(BooleanRetrieval)是)是用用布尔逻辑算符布尔逻辑算符将检索词、短语或代将检索词、短语或代码进行码进行逻辑组配逻辑组配的一种技术,也是目的一种技术,也是目前最常用的一种数据库检索技术。前最常用的一种数据库检索技术。9 9逻辑“与”具有概念交叉或概念限定关系的组配,用具有概念交叉或概念限定关系的组配,用“*”,或,或者者“AND”,或者,或者“与与”算符表示。算符表示。检索式检索式为:为:AANDB,或者,或者A*B,或者,或者A与与B(仅中文)(仅中文)它表示检出它表示检出同时含有同时含有A、B两个检索词两个检索词的记录。的记录。9
14、9逻辑“或”逻辑逻辑“或或”是一种具有概念并列关系的组配,用是一种具有概念并列关系的组配,用“+”,或者,或者“OR”,或者,或者“或或”算符表示。算符表示。检索式检索式为:为:AORB,或者,或者AB,或者,或者A或或B(仅中文)(仅中文)它表示检出它表示检出所有含有所有含有A词或者词或者B词词的记录。的记录。9 9逻辑“非”逻辑逻辑“非非”是一种具有概念排除关系的组配,用是一种具有概念排除关系的组配,用“”,或者,或者“NOT”,或者,或者“非非”算符表示。算符表示。检索式检索式为:为:ANotB,或者,或者A-B(Google为为A-B),或者),或者A非非B(仅中文)(仅中文)它表示检
15、出它表示检出含有含有A词,但同时不含词,但同时不含B词词的记录。的记录。9 93.2截词检索截词检索 截词检索截词检索(TruncationRetrieval)是指在检)是指在检索词的索词的适当位置截断适当位置截断,用,用截断的词的一个局部截断的词的一个局部进进行的检索。检索时,计算机会将所有含有相同部行的检索。检索时,计算机会将所有含有相同部分标识的记录全部检索出来。在西文检索系统中,分标识的记录全部检索出来。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非使用截词符处理自由词,对提高查全率的效果非常显著。常显著。由于西文的构词特性:单复数形式不一致、英美由于西文的构词特性:单复
16、数形式不一致、英美拼写不一致拼写不一致、词干前缀、词干后缀。、词干前缀、词干后缀。截词符多采用通配符截词符多采用通配符“?”、“$”、“*”等,等,因此,截词检索有时也称为通配符因此,截词检索有时也称为通配符(Wildcard)检索。)检索。按截断的位置来分按截断的位置来分;按截断的字符数量来分按截断的字符数量来分。9 9n后截断n中截断n前截断无限截断如:economic?有限截断截词检索与截词检索算符economiceconomicseconomicsteconomicalismeconomiceconomicseconomicst如:economic*如:wom?nwomanwomen如
17、:?lish sul*ur sulfur sulphur 无限截断有限截断n前后截断如:?computer?可检出:computer、computers、computerize、computerized、minicomputer、minicomputers、microcomputer、microcomputers 9 93.3字段限定检索字段限定检索 字段限定检索字段限定检索(FieldLimitingRetrieval)是用于限定提问关键词在数据库记录中出现是用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,是提高检的区域,控制检索结果的相关性,是提高检索效果的一种有效检索方
18、法。索效果的一种有效检索方法。9 9例如例如:(microcomputer/DE,TIORpersonalcomputer/ID,TI)ANDPY=2008ANDLA=English这个检索式所表达的检索要求是:查找这个检索式所表达的检索要求是:查找2008年年出版出版的关于微电脑或者个人电脑的的关于微电脑或者个人电脑的英文英文文献,并要求文献,并要求“微电脑微电脑”一词在命中文献的一词在命中文献的叙词字段叙词字段、标题字段标题字段出出现,现,“个人电脑个人电脑”一词在命中文献的一词在命中文献的自由词字段自由词字段出出现。现。中文实例:中文实例:(Remark_C=天然气天然气)*(Keywo
19、rd_C=(水合物水合物)+Title_C=(水合物水合物)*(Years=2007+Years=2008+Years=2009)在在Google等搜索引擎中,限定字段也是常用的语法。等搜索引擎中,限定字段也是常用的语法。例如,例如,“filetype:”表示在某种文件类型(如表示在某种文件类型(如doc、pdf)中查找资料。详细的介绍请参见搜索引)中查找资料。详细的介绍请参见搜索引擎部分。擎部分。9 94信息检索的基本步骤信息检索的基本步骤分析检索课题分析检索课题1.主题概念主题概念2.信息类型信息类型3.时间范围时间范围4.检索目的检索目的 构造检索式构造检索式(试验性检索)(试验性检索)
20、1.简单提问式简单提问式2.上下文提问式上下文提问式3.复合提问式复合提问式4.结构性提问式结构性提问式调调 整整 检检 索索 策策 略略(正式检索)(正式检索)1,信息量过多时信息量过多时2.信息量太少时信息量太少时 输出检索结果输出检索结果1.文摘文摘2.全文全文 选择检索系统选择检索系统1.学科范围学科范围2.系统类型系统类型3.系统功能系统功能 确定检索词确定检索词 1.切分切分2.删除删除3.替补替补4.组合组合5.增加增加用户评价 9 94.1分析检索课题分析检索课题 例如:例如:查找有关消防的文献。查找有关消防的文献。n1.主题分析和检索目的。主题分析和检索目的。所有的所有的“消
21、防消防”文献?还是只文献?还是只需有关需有关“消防事业消防事业”、“消防队伍消防队伍”、“消防设施消防设施”、“消防材料消防材料”、“消防器材消防器材”、“消防方案消防方案”等中某一等中某一方面的文献?方面的文献?需要新颖的信息?或者是与别人的研究进行先进性比较需要新颖的信息?或者是与别人的研究进行先进性比较?(时间范围)(时间范围)需要系统地掌握某学科的知识,可以选择图书;需要撰需要系统地掌握某学科的知识,可以选择图书;需要撰写研究项目的开题报告、论文,开展技术攻关,可以选写研究项目的开题报告、论文,开展技术攻关,可以选择研究报告、期刊论文、学位论文、会议文献等择研究报告、期刊论文、学位论文
22、、会议文献等(文献(文献类型)类型);需要进行发明创造、工艺改革、新产品设计、引进设备、需要进行发明创造、工艺改革、新产品设计、引进设备、签订合同,可以选择专利说明书、标准文献、产品资料签订合同,可以选择专利说明书、标准文献、产品资料等等(特种文献)(特种文献)。9 94.2选择检索系统选择检索系统 1.学科范围学科范围。对于交叉学科、新兴学科、应用研究、综。对于交叉学科、新兴学科、应用研究、综合研究,不应局限于某一学科范围,可根据情况适当扩合研究,不应局限于某一学科范围,可根据情况适当扩大检索系统的学科范围。例如,石油和矿业工程的力学大检索系统的学科范围。例如,石油和矿业工程的力学计算方面的
23、课题,也可以考虑数学、物理学、计算机信计算方面的课题,也可以考虑数学、物理学、计算机信息科学、机械工程方面的数据库。息科学、机械工程方面的数据库。扩大检索系统的学科扩大检索系统的学科范围有时会带来意外的收获范围有时会带来意外的收获。2.系统类型系统类型。首先,在不同的文献类型系统中选择。其。首先,在不同的文献类型系统中选择。其次,要在文摘、索引系统和全文数据库系统之间选择。次,要在文摘、索引系统和全文数据库系统之间选择。第三,在专业性数据库中去查找。第三,在专业性数据库中去查找。3.系统功能系统功能。一般说来,使用分类语言、主题语言的检。一般说来,使用分类语言、主题语言的检索系统,要优于使用自
24、然语言的检索系统,专业检索系索系统,要优于使用自然语言的检索系统,专业检索系统要优于搜索引擎。检索途径、检索方式(如分类浏览、统要优于搜索引擎。检索途径、检索方式(如分类浏览、简单检索、高级检索、专家检索、自然语言检索)多,简单检索、高级检索、专家检索、自然语言检索)多,收录时间跨度长,来源语种、国别多,文本(数据)质收录时间跨度长,来源语种、国别多,文本(数据)质量高,附加个性化服务,检索系统就更值得选择。量高,附加个性化服务,检索系统就更值得选择。9 94.3确定检索词确定检索词 1切分切分切分是对课题的语句以自由词为单位进行拆分,转切分是对课题的语句以自由词为单位进行拆分,转换为检索的最
25、小单元。自由词切分仅适用于自然语换为检索的最小单元。自由词切分仅适用于自然语言检索。言检索。例例1:检索:检索“妇女吸烟与肺癌的关系研究妇女吸烟与肺癌的关系研究”相关文献。相关文献。直接切分:妇女直接切分:妇女|吸烟吸烟|与与|肺癌肺癌|的的|关系关系|研究)研究)注意,当词切分后将失去原来的意思时,不应再切注意,当词切分后将失去原来的意思时,不应再切分,即必须注意保持意义的完整。如分,即必须注意保持意义的完整。如“中国科学院中国科学院”、“致密岩气致密岩气”不可再切分。不可再切分。9 9确定检索词确定检索词2删除删除删除是对自然语言中不具有实质性检索意义的删除是对自然语言中不具有实质性检索意
26、义的虚词虚词(如(如介词、连词、副词等),或者介词、连词、副词等),或者使用频率较低的词使用频率较低的词,或者,或者专指性太高、过分宽泛的词专指性太高、过分宽泛的词,或者,或者过分具体的限定词、过分具体的限定词、禁用词禁用词,或者,或者不能表达课题实质的高频词不能表达课题实质的高频词,或者存在蕴,或者存在蕴含关系含关系可以合并的词可以合并的词,一律予以删除,使自然语言转换,一律予以删除,使自然语言转换成为关键词和主题词的集合。如上例中的成为关键词和主题词的集合。如上例中的“与与”、“的的”、“关系关系”、“研究研究”。例例2:检索:检索“中国非常规天然气工业的发展前景研究中国非常规天然气工业的
27、发展前景研究”方面的相关文献。进行拆分以后,方面的相关文献。进行拆分以后,工业、发展、前景、工业、发展、前景、研究研究这四个自由词具有一定的检索意义,但是由于或者这四个自由词具有一定的检索意义,但是由于或者是意义过于宽泛、或者是不能表达课题实质、或者是存是意义过于宽泛、或者是不能表达课题实质、或者是存在蕴含关系的原因,没有必要全部作为检索词,根据需在蕴含关系的原因,没有必要全部作为检索词,根据需要可以保留要可以保留1-2个作为检索词。个作为检索词。9 9确定检索词确定检索词3替补替补替补就是在进行切分、删除后,对检索词进行替换和补充。替补就是在进行切分、删除后,对检索词进行替换和补充。“公交公
28、交”应考虑替换:公共交通;应考虑替换:公共交通;“绿色包装绿色包装”中的中的“绿色绿色”,应替换:环保、无污染、可降,应替换:环保、无污染、可降解;解;“煤气中毒煤气中毒”应考虑替换:一氧化碳中毒;应考虑替换:一氧化碳中毒;“非典非典”应考虑补充:应考虑补充:SARS、非典型肺炎、传染性非典型、非典型肺炎、传染性非典型肺炎、严重急性呼吸综合征(肺炎、严重急性呼吸综合征(severeacuterespiratorysyndrome););“非常规天然气非常规天然气”(nonconventionalnaturalgas)应考虑补应考虑补充:(天然气)水合物、页岩气、深层气、致密岩气、水溶充:(天然
29、气)水合物、页岩气、深层气、致密岩气、水溶气、煤层气、合成气(合成天然气)、沼气(生物气),同气、煤层气、合成气(合成天然气)、沼气(生物气),同时考虑将时考虑将“气气”应替换为:天然气(应替换为:天然气(naturalgas)、甲烷)、甲烷(methane)、)、CH4、CH4;含硫气田的含硫气田的“硫硫”应考虑补充:应考虑补充:sulfur、sulf*、sulfur*、sulphur、sulphur*、H2S、H2S,同时考虑将,同时考虑将“硫硫”替换:替换:硫化氢(硫化氢(sulfuredhydrogen)、含硫化合物()、含硫化合物(sulfurcompound)。)。9 9确定检索词
30、确定检索词4组合组合概念相交组合概念相交组合。这个新概念是原来用以组合的两个概。这个新概念是原来用以组合的两个概念的下位概念,如曲柄连杆机构念的下位概念,如曲柄连杆机构*发动机发动机=汽车发动机。汽车发动机。概念限定组合概念限定组合。这个新概念可用来表示这一事物的某。这个新概念可用来表示这一事物的某一属性或某一个方面。如电视机一属性或某一个方面。如电视机*数字化数字化=数字电视机。数字电视机。以上两种组配方式,所得到的新概念,都是原组和概念以上两种组配方式,所得到的新概念,都是原组和概念的下位概念,缩小了检索范围,提高了概念的专指度,达的下位概念,缩小了检索范围,提高了概念的专指度,达到提高检
31、准率的目的。到提高检准率的目的。概念并列组合概念并列组合。具有概念并列关系的自由词间的组配,。具有概念并列关系的自由词间的组配,其结果使概念检索的范围扩大,如环境污染其结果使概念检索的范围扩大,如环境污染+环境保护环境保护=环境污染和环境保护。环境污染和环境保护。概念删除组合概念删除组合。是指两个具有上下位关系的自由词间的。是指两个具有上下位关系的自由词间的组合,其结果使概念检索的范围缩小,如信息处理组合,其结果使概念检索的范围缩小,如信息处理-模拟模拟信息处理信息处理=数字信息处理。数字信息处理。9 9确定检索词确定检索词5增加增加增加增加“限义词限义词”。有两种方法:直接增加限义词、挖掘。
32、有两种方法:直接增加限义词、挖掘隐含词、提取潜在的检索词;把限义词以逻辑的方式加隐含词、提取潜在的检索词;把限义词以逻辑的方式加入,可采用逻辑入,可采用逻辑“与与”或逻辑或逻辑“非非”的方法增加限义词。的方法增加限义词。分析隐含概念。挖掘潜在的主题词还可以通过对上位词、分析隐含概念。挖掘潜在的主题词还可以通过对上位词、下位词、同类词关系的分析得到其它相关主题词。如例下位词、同类词关系的分析得到其它相关主题词。如例1:“妇女吸烟与肺癌的关系研究妇女吸烟与肺癌的关系研究”,切分、删除后得:,切分、删除后得:吸烟、肺癌两个检索词,分析、补充上位词可增加检索吸烟、肺癌两个检索词,分析、补充上位词可增加
33、检索词:词:烟、癌症、恶性肿瘤烟、癌症、恶性肿瘤。例例3:检索:检索“一种新的天线阵方向图综合方法一种新的天线阵方向图综合方法”课题。课题。切分:一种切分:一种|新新|的的|天线阵天线阵|方向图方向图|综合综合|方法;方法;删除后得:天线阵、方向图;删除后得:天线阵、方向图;根据主题词表分析,增加上位词可得主题词:根据主题词表分析,增加上位词可得主题词:互耦、偶互耦、偶极子、输入阻抗极子、输入阻抗等。等。9 9确定检索词确定检索词从上述四个实例可以看出,提取检索词首先从上述四个实例可以看出,提取检索词首先是是切分、删除切分、删除,其次是进行,其次是进行替补、组合和增替补、组合和增加加。在提取检
34、索词时,若所选的数据库具有。在提取检索词时,若所选的数据库具有规范化词表时,应规范化词表时,应优先选用该数据库词表中优先选用该数据库词表中与检索课题相关的与检索课题相关的规范化主题词规范化主题词(检索词)。(检索词)。9 94.4构造检索式(试验性检索)构造检索式(试验性检索)所谓的所谓的检索提问式检索提问式(query,searchformulation),是信息检索中用来表达用户),是信息检索中用来表达用户检索提问的逻辑表达式,主要是使用各种检索提问的逻辑表达式,主要是使用各种布布尔逻辑算符、位置算符、截词符、限制算符尔逻辑算符、位置算符、截词符、限制算符以及系统规定的其他组配连接符号将检
35、索词以及系统规定的其他组配连接符号将检索词进行进行组配组配,确定检索词之间的概念关系或位,确定检索词之间的概念关系或位置关系。置关系。9 9构造检索式(试验性检索)构造检索式(试验性检索)简单提问式简单提问式含一个检索词的提问式;含一个检索词的提问式;上下文提问式上下文提问式精确短语或近似精确短语的提问精确短语或近似精确短语的提问式,也可称为短语提问式;式,也可称为短语提问式;复合提问式复合提问式含有布尔算符和至少含有布尔算符和至少2个检索词的提个检索词的提问式;问式;结构性提问式结构性提问式含有含有2个以上布尔算符和至少个以上布尔算符和至少4个个检索词的多层结构组合的提问式。检索词的多层结构
36、组合的提问式。例例4:地震序列分析的工具和方法研究:地震序列分析的工具和方法研究要完成本项检索课题,必须使用结构性提问式:要完成本项检索课题,必须使用结构性提问式:(sequenceanalysis)WNTI)AND(method*ORtool*ORinstrument*)WNAllfields)AND(seismic)WNAllfields)。检索式。检索式“WNTI”意为意为限在限在TI(标题)字段中检索,可提高检索的准确性(标题)字段中检索,可提高检索的准确性和相关度。和相关度。9 94.5调整检索策略(正式检索)调整检索策略(正式检索)所谓所谓检索策略检索策略(searchstrate
37、gy)就是为完)就是为完成检索课题,实现检索目的,对检索的全过成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。检程进行谋划之后所制定的全盘检索方案。检索策略的制定过程就是检索提问式的不断完索策略的制定过程就是检索提问式的不断完善的过程,善的过程,使用最初的检索提问式是使用最初的检索提问式是试验性试验性检索检索,使用调整后的完善检索策略提问式是使用调整后的完善检索策略提问式是正式检索正式检索。9 9调整检索策略(正式检索)调整检索策略(正式检索)1当检索结果信息量过多时当检索结果信息量过多时原因原因:选用了多义性的检索词;截词截得过短;输入的检索:选用了多义性的检索词;
38、截词截得过短;输入的检索词太少;应该使用词太少;应该使用“与(与(AND)”的使用了的使用了“或(或(OR)”;优先运算符;优先运算符“()()”使用错误。考虑使用错误。考虑缩小检索范围缩小检索范围,方法,方法如下:如下:(1)采用专指性强的主题词(主题词表),减少同义词、)采用专指性强的主题词(主题词表),减少同义词、同族相关词等相关性不强的检索词;同族相关词等相关性不强的检索词;(2)增加限制概念,采用)增加限制概念,采用“AND”算符连接检索词或进行算符连接检索词或进行二次检索;二次检索;(3)使用字段限定,把检索词限定在题目、主题词等主要)使用字段限定,把检索词限定在题目、主题词等主要
39、字段;字段;(4)缩短检索年限,限制检索结果的文献类型、语种及出)缩短检索年限,限制检索结果的文献类型、语种及出版国;版国;(5)使用)使用“NOT”算符,排除无关概念;算符,排除无关概念;(6)调整位置算符,由松变严;)调整位置算符,由松变严;(7)改模糊检索为精确检索。)改模糊检索为精确检索。9 9调整检索策略(正式检索)调整检索策略(正式检索)例例5:检索建筑物的:检索建筑物的windows(窗口、窗户)部分设计(窗口、窗户)部分设计方面的文献。方面的文献。检索策略调整为以下检索式:检索策略调整为以下检索式:(constructionORbuildingORarchitectur*)WN
40、Allfields)AND(window*)WNTI)NOT(microsoft)WNAllfields)。例例4的检索式在检索英文时是没有问题的,但如果检索的检索式在检索英文时是没有问题的,但如果检索中文时仍使用以下检索式:中文时仍使用以下检索式:(序列分析序列分析)WNTI)AND(方法方法*OR工具工具*OR仪器仪器)WNAllfields)AND(地震地震)WNAllfields),就会将许多不相关的内容检索出来。,就会将许多不相关的内容检索出来。因为中文检索词因为中文检索词“地震地震”有两种完全不同的含义:一是有两种完全不同的含义:一是与灾害有关的与灾害有关的(英文用(英文用“ear
41、thquake”),二是),二是与地质与地质、地球科学有关的、地球科学有关的(英文用(英文用“seismic”)。因此,正)。因此,正式检索中文资料时,应该调整检索策略,像式检索中文资料时,应该调整检索策略,像例例5那样使那样使用用“NOT”算符算符,如输入:灾害、损失、伤亡等进行限,如输入:灾害、损失、伤亡等进行限制。制。9 92当检索结果信息量太少时当检索结果信息量太少时原因原因:检索词拼写错误;遗漏重要的同义词或隐含概念;:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于冷僻具体;没有使用截词算符;位置算符和字检索词过于冷僻具体;没有使用截词算符;位置算符和字段算符使用的过多;使用
42、过多的段算符使用的过多;使用过多的“AND”算符。考虑算符。考虑扩大检扩大检索范围索范围,方法如下:,方法如下:(1)根据词表的分类结构体系扩展关键的检索词,用)根据词表的分类结构体系扩展关键的检索词,用“扩扩展展”按钮增加同义词和相关词并用按钮增加同义词和相关词并用“OR”算符连接这些词;算符连接这些词;(2)降低检索词的专指度,可从词表或检出文献中选择上)降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充到检索式中;位词或泛指词补充到检索式中;(3)减少检索年限、文献类型、语种及出版国的限制,如)减少检索年限、文献类型、语种及出版国的限制,如增加回溯检索年限;增加回溯检索年限;
43、(4)取消某些限制过严的字段限制、位置算符限制(或者)取消某些限制过严的字段限制、位置算符限制(或者改用限制程度较小的位置算符)改用限制程度较小的位置算符)(5)在词干相同的单词后使用截词符(?或)在词干相同的单词后使用截词符(?或*););(6)改精确检索为模糊检索;)改精确检索为模糊检索;(7)同时使用拼写正确的词,以及拼写错误的词或存在多)同时使用拼写正确的词,以及拼写错误的词或存在多种普遍错别字的词作为检索词。种普遍错别字的词作为检索词。9 9调整检索策略(正式检索)调整检索策略(正式检索)例例6:在数据库中检索同时含有草莓、香草和巧克力三在数据库中检索同时含有草莓、香草和巧克力三种口
44、味的冰淇淋。种口味的冰淇淋。英文检索式:英文检索式:(icecream)ANDstrawberryANDvanillaANDchocolate)WNAllfields)。中文检索式:中文检索式:(冰淇淋冰淇淋)AND草莓草莓AND香草香草AND巧克巧克力力)WNAllfields)进行试验性检索后发现,由于中文进行试验性检索后发现,由于中文“冰淇淋冰淇淋”存在多种存在多种普遍的错别字,如:普遍的错别字,如:“冰激凌冰激凌”、“冰激淋冰激淋”、“冰淇冰淇凌凌”等,检索结果极不完整,需要将几种普遍错别字的等,检索结果极不完整,需要将几种普遍错别字的词作为检索词,并用词作为检索词,并用“OR”算符连接这些词,进一步调算符连接这些词,进一步调整检索策略。整检索策略。此外,此外,例例3(检索检索“一种新的天线阵方向图综合方法一种新的天线阵方向图综合方法”课题课题)也是扩大检索范围提高检索结果查全率的一个典也是扩大检索范围提高检索结果查全率的一个典型实例。型实例。