收藏 分销(赏)

第三章-文献检索技巧.ppt

上传人:天**** 文档编号:5433451 上传时间:2024-10-31 格式:PPT 页数:46 大小:4.37MB
下载 相关 举报
第三章-文献检索技巧.ppt_第1页
第1页 / 共46页
第三章-文献检索技巧.ppt_第2页
第2页 / 共46页
第三章-文献检索技巧.ppt_第3页
第3页 / 共46页
第三章-文献检索技巧.ppt_第4页
第4页 / 共46页
第三章-文献检索技巧.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、第三章第三章 文献检索技巧文献检索技巧覃覃雪雪第一节第一节 文献检索的基本概念文献检索的基本概念第二节第二节 检索技术检索技术第三节第三节 文献检索流程文献检索流程 第一节第一节文献检索的基本概念文献检索的基本概念1.定义定义 文献检索是指从众多的文献中通过检索工具或检索系统,迅速、文献检索是指从众多的文献中通过检索工具或检索系统,迅速、准确地查找出与用户提问有关的文献信息线索的行为、方法和过程。准确地查找出与用户提问有关的文献信息线索的行为、方法和过程。文献检索文献检索组织与存储组织与存储检索检索组织与存储:是对数据进行标引的过程。组织与存储:是对数据进行标引的过程。对信息进行著录、标引、整

2、序,编制检对信息进行著录、标引、整序,编制检索工具和建立检索系统的过程。索工具和建立检索系统的过程。检索:是指面向信息需求而进行高检索:是指面向信息需求而进行高度选择性的查找过程。度选择性的查找过程。2.基本原理基本原理检索过程实际上是比较、检索过程实际上是比较、匹配(匹配(match)的过程,检)的过程,检索提问只要与数据库中的索提问只要与数据库中的信息信息特征标识特征标识及其及其逻辑组配关系逻辑组配关系相相一致,则一致,则“命中命中”,即找到了,即找到了符合要求的信息。符合要求的信息。第二节第二节检索技术检索技术(一)布尔逻辑算符(一)布尔逻辑算符1.逻辑逻辑“与与”(and或或*):是指

3、两个概念的交集。):是指两个概念的交集。AandB或或A*B表示检出同时含有表示检出同时含有A、B两个检索词的记录。两个检索词的记录。逻辑逻辑“与与”检索增强检索的专指性,缩小检索范围。检索增强检索的专指性,缩小检索范围。I.FindAandBandC2.逻辑逻辑“或或”(or或或+):是指两个概念的并集。):是指两个概念的并集。AorB或或A+B表示检出所有含有表示检出所有含有A词或者词或者B词的记录。词的记录。逻辑逻辑“或或”检索扩大了检索范围,提高查全率。检索扩大了检索范围,提高查全率。此运算符适于连接有此运算符适于连接有同义关系同义关系或或相关关系相关关系的词。的词。II.FindAo

4、rBorC3.逻辑逻辑“非非”(not或或):表示从两个概念中除去交叉的部分。):表示从两个概念中除去交叉的部分。AnotB或或A-B表示检出含有表示检出含有A词,但同时不含有词,但同时不含有B词的记录。词的记录。逻辑逻辑“非非”可以缩小检索范围,增强检索的准确性。可以缩小检索范围,增强检索的准确性。此运算符用于排除那些含有某个特定检索词的记录,但如果使用不此运算符用于排除那些含有某个特定检索词的记录,但如果使用不当将会排除有用文献,从而导致漏检,应慎用。当将会排除有用文献,从而导致漏检,应慎用。III.FindAorBnotC使用逻辑算符时应注意的事项:使用逻辑算符时应注意的事项:1.1.三

5、种算符可同时在一个检索式中使用,也可单独使用。三种算符可同时在一个检索式中使用,也可单独使用。2.2.逻辑算符的优先级为:逻辑算符的优先级为:NOTANDORNOTANDOR3.3.在逻辑组配时,算符的两侧必须各留有一个空格。在逻辑组配时,算符的两侧必须各留有一个空格。优先算符优先算符优先算符用()表示,在含有多个运算的检索式中,可以用优先算符用()表示,在含有多个运算的检索式中,可以用()将需要优先运算的部分括上,系统会优先运算()中的()将需要优先运算的部分括上,系统会优先运算()中的部分,然后在按照部分,然后在按照not,and,ornot,and,or的顺序进行运算。的顺序进行运算。如

6、:如:(behaviour or behavior)and human(behaviour or behavior)and human逻辑算符的优先级为逻辑算符的优先级为()()NOTANDORNOTANDOR(二)截词算符(二)截词算符截词,是指在检索词的适当位置截断。截词检索就是用截截词,是指在检索词的适当位置截断。截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。所有字符(串)的文献,都为命中的文献。截词检索是一种提高查全率,防止漏检的检索技术,尤其截词检索是一种提高查全率,防

7、止漏检的检索技术,尤其在英文检索中被广泛使用。在英文检索中被广泛使用。常用的截词符号(即截词符,也称通配符)有:常用的截词符号(即截词符,也称通配符)有:“*”表示截断无限个字符,即表示截断无限个字符,即无限截断无限截断;“?”表示截断一个字符,即表示截断一个字符,即有限截断有限截断。英美拼法:英美拼法:behavi*r检出检出behaviour、behavior单复数形式:单复数形式:wom?n检出检出woman、women词根相同:词根相同:comput*检出检出compute、computed、computing、computer、computers、computerize按截词的位置分

8、:按截词的位置分:(1)后截断。截去某个词的后部,前方一致。最常用。)后截断。截去某个词的后部,前方一致。最常用。如:如:child*能检出能检出child,children,childrens(2)前截断。截去某个词的前部,后方一致。)前截断。截去某个词的前部,后方一致。如:如:*computer能检出能检出minicomputer,microcomputer(3)中间截断。截取某个词的中间部分,两边一致。)中间截断。截取某个词的中间部分,两边一致。如:如:organi?tion能检出能检出organization,organisation注意:注意:截词符要紧接在词干后面,截词符和词干之间

9、不能有空格截词符要紧接在词干后面,截词符和词干之间不能有空格!apple:ap*leap?le正确正确ap_*_leap_?_le错误错误(三)位置算符(三)位置算符为了提高检索的广度和准确度,常常需要对检索词之间的为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。位置算符可限定算符两边的检索词出现在位置关系加以限定。位置算符可限定算符两边的检索词出现在记录中的位置,用以检索出含有检索词且检索词之间的位置也记录中的位置,用以检索出含有检索词且检索词之间的位置也符合特定要求的记录。符合特定要求的记录。control system 可检出control systemsystem

10、controlcontrol communication systemcontrol(W)system 只可检出 control system1.with:A(W)B表示其两侧的检索词必须按表示其两侧的检索词必须按前后顺序前后顺序出现在记录中,出现在记录中,不能颠倒不能颠倒,且两词之间且两词之间不允许插入其他词不允许插入其他词,只可能有一个空格、标点或连接号。,只可能有一个空格、标点或连接号。其扩展为(其扩展为(nW),),n=19,表示其两侧的检索词之间,表示其两侧的检索词之间最多最多可插可插入入n个词,但位置不能颠倒。个词,但位置不能颠倒。例如:“light(4W)rail”表示light

11、与rail之间最多可插入4个词,但位置不能颠倒。2.near:A(N)B表示其两侧的检索词前后位置表示其两侧的检索词前后位置可以颠倒可以颠倒,在两词之间,在两词之间不允许插入不允许插入其他词其他词,只可能有一个空格、标点或连接号。,只可能有一个空格、标点或连接号。其扩展为(其扩展为(nN),表示其两侧的检索词之间),表示其两侧的检索词之间最多最多可插入可插入n个词,个词,位置可颠倒。位置可颠倒。例如:“computer(N)network”,其检中记录可包含 “computer network”或“network computer”。3.字段级位置算符字段级位置算符表示两侧的检索词必须出现在同

12、一字段中,词序不限。表示两侧的检索词必须出现在同一字段中,词序不限。不同系统使用的符号各不相同。不同系统使用的符号各不相同。Field:“air(F)pollution”表示air与pollution必须在同一个段落中出现Same:“Ad=(CAS same Shenzhen)”表示CAS 与 Shenzhen 必须同时 出现在地址字段中(四)其他检索技术:(四)其他检索技术:字段限定:指将检索词限定在某个或某些字段中。可通过下拉菜字段限定:指将检索词限定在某个或某些字段中。可通过下拉菜单选择检索字段,也可输入检索字段符来限定检索字段。单选择检索字段,也可输入检索字段符来限定检索字段。例如:A

13、U=Smith,表示要查找著者Smith发表的文献。词组检索:使用词组检索:使用“”双引号将检索词组锁定,进行精确查找。双引号将检索词组锁定,进行精确查找。匹配度选择:匹配度选择:“精确匹配精确匹配”与与“模糊匹配模糊匹配”第三节第三节文献检索流程文献检索流程文献检索文献检索分析检索课题分析检索课题选择检索工具选择检索工具上机检索并上机检索并调整检索策略调整检索策略构建检索提问式构建检索提问式确定检索确定检索词词输出检索结果输出检索结果1.分析检索课题分析检索课题,明确信息需求。分析检索课题,明确信息需求。可以从以下几个方面进行:可以从以下几个方面进行:(1)检索内容的确定:分析课题的主题内容

14、、所属学科性质)检索内容的确定:分析课题的主题内容、所属学科性质(2)检索范围的确定:包括文献类型、时间范围、语种等。)检索范围的确定:包括文献类型、时间范围、语种等。(3)充分利用已有文献:可以利用相关文献后面所附的参考文)充分利用已有文献:可以利用相关文献后面所附的参考文献进行献进行“滚雪球式滚雪球式”的检索。的检索。2.选择检索工具应该从以下几个方面考虑:应该从以下几个方面考虑:(1)数据库收录的信息内容所涉及的学科范围:)数据库收录的信息内容所涉及的学科范围:综合内容数据库,专业内容数据库综合内容数据库,专业内容数据库(2)数据库收录的文献类型、语种:中、外文期刊数据库、)数据库收录的

15、文献类型、语种:中、外文期刊数据库、专利文献专利文献/标准文献标准文献/会议文献会议文献/学位论文数据库学位论文数据库(3)数据库所提供的检索途径、检索功能和服务方法)数据库所提供的检索途径、检索功能和服务方法3.确定检索词(1)提取有关课题实质内容的关键词。通常从课题的主要概念,即课题名称、采用的具体技术或方法、新颖性中提取。(2)选用意义明确的词语,少用概念泛而检索意义不大的词。策略、性能、研究、技术、高效、先进()(3)尽量使用规范化的表述。选各学科的专用术语、规范用语。(4)避免使用过长的词组和短语。(5)同义词、近义词、缩略词。(6)英文检索词中的禁用词:包括介词、冠词、代词、连接词

16、、某些形容词或副词等。AN、AND、BY、FOR、FROM、OF、TO、THE、WITH3.确定检索词检索词选择技巧:排除重复概念例:项目“河豚毒素的液相色谱分析”从该项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和 “分析”,但由于液相色谱本身就是一种 分析方法,它隐含了“分析”这一概念。主要概念:河豚毒素、液相色谱 检索词的选择技巧:找出隐含概念例:项目“唐山综合防灾研究”唐山:由于唐山是一个城市,该项目实际为“城市综合防灾的研究”灾害:地震、洪水、火灾 研究:决策支持系统、专家系统 所采用的研究手段是决策支持系统和专家系统。主要概念:城市、地震、洪水、火灾、决策支持系统、专家系统英

17、文检索词的获取英文检索词的获取收集中文文献中的英文关键词写法;收集中文文献中的英文关键词写法;CNKICNKI翻译助手翻译助手 http:/ TiO2 nanometer nanoparticle nanofilm nanometer nanoparticle nanofilm c composite compositesomposite compositesp prepare preparation synthesize synthesisrepare preparation synthesize synthesis syntheses syntheses 4.构建检索提问式检索式检索式检索

18、词检索词连接组配符号连接组配符号=+逻辑运算符(逻辑运算符(logical operatorlogical operator)通配符(通配符(wildcard characterwildcard character)、截词算符)、截词算符 优先算符(优先算符(priority operatorpriority operator)位置算符(位置算符(proximity operatorproximity operator)英文检索式英文检索式英文检索式英文检索式位置算符位置算符:限定检索词之间的位置关系,以提高检索的广度和准确度。每个数据:限定检索词之间的位置关系,以提高检索的广度和准确度。每个

19、数据库对应不同的位置算符,以库对应不同的位置算符,以SCISCI、EIEI为例为例,其位置算符是其位置算符是NEAR/xNEAR/x。NEAR/xNEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。用数字取代用数字取代x x可指定将检索词分开的最大单词数。可指定将检索词分开的最大单词数。只使用只使用NEARNEAR而不使用而不使用/x/x,系统将查找检索词彼此相隔不到,系统将查找检索词彼此相隔不到1515个单词的记录。个单词的记录。NEARNEAR连接的检索词可以颠倒顺序。连接的检索词可以颠倒顺序。例如:例如:inte

20、lligent(near/0)robot intelligent robot/robot intelligenteconomic(near/2)recovery economic recovery/recovery of the economic/recovery from economic troubles 4.构建检索提问式(1)使用逻辑“或”运算符将主题词与同义词进行组配,以提高查全率。如,检索与“激光”有关的文献:激光 OR 镭射 OR 莱塞(2)使用逻辑“与”运算符将不同概念进行组配,以提高检索结果的专指性,继而提高查准率。如,检索“激光在生物学领域的应用”相关文献:(激光 OR 镭

21、射 OR 莱塞)AND 生物学(3)合理选择检索字段:一般情况下首先选择主题字段进行检索;需查非常密切的相关文献时,部分检索词可选择在标题字段检索;(4)构建英文检索式时,正确使用截词符与位置算符,以达到最佳检索效果。5.调整检索策略u检索结果输出的篇数过多。考虑缩小检索范围,提高查准率。调整方法如下:进一步限定主题概念,用AND连接一些相关检索项。提高检索词的专指度,更多地采用下位词或下位类。(复合材料-纳米复合材料)使用字段限定,将检索词限定在某个或某些字段范围内。(全文文摘/关键词)用NOT运算符,排除一些无关的检索项。(慎用)u检索结果输出的篇数过少,甚至为零。考虑扩大检索范围,提高查

22、全率。调整方法如下:选全同义词并用OR与原词连接后加入检索式。降低检索词的专指度,从词表或检出文献中选一些上位词或相关词。减少AND运算,删去一些次要的概念组面。进行截词检索。取消某些过严的限制符,如字段限制符等。5.调整检索策略示例课题:示例课题:数字化图书馆数字化图书馆的的文献检索文献检索服务服务1.分析课题:分析课题:数字化图书馆数字化图书馆+文献检索文献检索digitallibrarydigitallibrary anddocumentretrievalanddocumentretrievaldigitallibrary扩展:同义词virtuallibraryelectroniclib

23、rarydocumentretrieval并列概念 informationretrievalbibliographicretrieval2.2.数据库的选择数据库的选择数据库的选择数据库的选择(1 1)合适的主题范围)合适的主题范围)合适的主题范围)合适的主题范围(2 2)合适的数据库类型、年度范围)合适的数据库类型、年度范围)合适的数据库类型、年度范围)合适的数据库类型、年度范围学科:图书情报学学科:图书情报学学科:图书情报学学科:图书情报学20002000年后年后年后年后EI,SCI等检索数据库原检索式:digitallibraryanddocumentretrieval并列概念docum

24、entretrieval/informationretrieval/bibliographicretrieval同义词digitallibrary/virtuallibrary/electroniclibrary修改检索式修改检索式(documentretrievalorinformationretrievalorbibliographicretrieval)and(digitallibrar*orelectroniclibrar*orvirtuallibrar*)示例科研课题示例科研课题示例科研课题示例科研课题基于基于多重环境时间相似多重环境时间相似理论与贝叶斯方法的耐久性评估及预警系统理论

25、与贝叶斯方法的耐久性评估及预警系统分析课题分析课题:针对针对*大桥建立基于大桥建立基于多重环境时间相似理论多重环境时间相似理论与与贝叶斯贝叶斯方法方法的耐久性评估及预警系统。的耐久性评估及预警系统。研究对象:桥研究对象:桥核心技术核心技术1 1:多重环境时间相似理论:多重环境时间相似理论核心技术核心技术2 2:贝叶斯方法贝叶斯方法研究内容:研究内容:耐久性评估及预警系统耐久性评估及预警系统如何确定检索词?如何确定检索词?如何确定检索词?如何确定检索词?基于基于多重环境时间相似多重环境时间相似理论与贝叶斯方法的耐久性评估及预警系统理论与贝叶斯方法的耐久性评估及预警系统中文检索词初提:环境时间相似

26、贝叶斯耐久性预警X方法X系统 X理论桥评估X多重检索词扩充检索词扩充中文检索词扩充的几点思路:中文检索词扩充的几点思路:阅读现有文献,从题名、关键词和摘要中选择同义词、近义阅读现有文献,从题名、关键词和摘要中选择同义词、近义词词利用利用初提检索词在数据库中试检,利用数据库的关键词、相似词、初提检索词在数据库中试检,利用数据库的关键词、相似词、相关词相关词、同义词同义词扩展功能(扩展功能(CNKICNKI远程新版入口、维普、万方远程)远程新版入口、维普、万方远程)利用搜素引擎选择检索词利用搜素引擎选择检索词如何确定检索词?如何确定检索词?如何确定检索词?如何确定检索词?研究课题:中文检索词扩充:

27、基于基于多重环境时间相似多重环境时间相似理论与贝叶斯方法的耐久性评估及预警系统理论与贝叶斯方法的耐久性评估及预警系统环境时间相似环境时间相似贝叶斯贝叶斯预警预警桥桥评估评估Bayes/BayesianBayes/BayesianMETSMETS预测预测评价评价混凝土混凝土/砼砼 中文检索式编制中文检索式编制中文检索式编制中文检索式编制编制检索式如下:编制检索式如下:(环境时间相似环境时间相似 or mets)or mets)andand(贝叶斯贝叶斯 or Bayes or Bayesian)or Bayes or Bayesian)andand(桥桥 or or 混混凝土凝土 or or 砼

28、砼)andand 耐久性耐久性 andand(评估评估 or or 评价评价 or or 预警预警 or or 预测预测)砼砼 tngtng 试检:建议使用专业检索(万方)试检:建议使用专业检索(万方)“*”表示表示“并且并且”的含义的含义“+”表示表示“或者或者”的含义的含义“-”表示表示“不包含不包含”的含义的含义检索式检索式1 1:(环境时间相似环境时间相似 or mets)and(or mets)and(贝叶斯贝叶斯 or Bayes or Bayes or Bayesian)and(or Bayesian)and(桥桥 or or 混凝土混凝土 or or 砼砼)and)and 耐久

29、性耐久性 and and(评估评估 or or 评价评价 or or 预警预警 or or 预测预测)检索策略的检索策略的调整调整检索检索结果较少,可以结果较少,可以扩扩检检-增加检索词,或将检索词的上位类词、近义词等补充进去增加检索词,或将检索词的上位类词、近义词等补充进去-调整组配算符,如改调整组配算符,如改“andand”为为“oror”-增加或修改检索入口,如增加文摘、全文检索等增加或修改检索入口,如增加文摘、全文检索等调整本例题检索式调整本例题检索式检索检索式式1 1:(环境时间相似环境时间相似 or mets)or mets)and and(贝叶斯贝叶斯 or Bayes or B

30、ayesian)and(or Bayes or Bayesian)and(桥桥 or or 混凝土混凝土 or or 砼砼)and)and 耐久性耐久性 and(and(评估评估 or or 评价评价 or or 预警预警 or or 预测预测)检索式检索式2 2:(环境时间环境时间相似相似 or or mets mets oror 贝叶斯贝叶斯 or Bayes or Bayesian)or Bayes or Bayesian)and and(桥桥 or or 混凝土混凝土 or or 砼砼)and)and 耐久性耐久性 and(and(评估评估 or or 评价评价 or or 预警预警

31、or or 预测预测)检索式检索式2 2:(环境时间相似环境时间相似 or mets or or mets or 贝叶斯贝叶斯 or Bayes or or Bayes or Bayesian)and(Bayesian)and(桥桥 or or 混凝土混凝土 or or 砼砼)and)and 耐久性耐久性 and and(评估评估 or or 评价评价 or or 预警预警 or or 预测预测)检索式检索式3 3:(相似相似 or mets or or mets or 贝叶斯贝叶斯 or Bayes or or Bayes or Bayesian)and(Bayesian)and(桥桥 or

32、 or 混凝土混凝土 or or 砼砼)and)and 耐久性耐久性 and and(评估评估 or or 评价评价 or or 预警预警 or or 预测预测)作业:查找作业:查找“计算机动画电影计算机动画电影”方面的资料方面的资料(要求使用逻辑算符、截词符、位置算符构建SCI英文检索式)计算机计算机=computer*=computer*动画动画=cartoon*=cartoon*或或 animat*animat*电影电影=movie*=movie*或或 film*film*或或 motion picturmotion pictur*分析检索词之间的逻辑关系分析检索词之间的逻辑关系动画:动画:animat*or cartoon*animat*or cartoon*电影:电影:movie*or film*or motion near picture*movie*or film*or motion near picture*检索式共有三个主题概念:计算机,动画,电影。检索式共有三个主题概念:计算机,动画,电影。用逻辑用逻辑“与与”联接联接计算机动画电影检索表达式computer*and(animat*or cartoon*)and(movie*or film*or motion near picture*)

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服