1、绪论一、信息的含义二、科研的基本步骤三、信息检索的含义四、信息源及信息的组织一、信息的含义一、信息的含义n n为什么检索信息:消除事物的不确定性n n与信息有关的词汇:文献、情报、资料、资讯等二、科研的基本步骤二、科研的基本步骤n n选题n n查阅资料n n研究设计和制定研究计划n n收集和整理资料n n开展研究n n撰写研究报告三、信息检索的定义三、信息检索的定义n n信息存贮、组织,信息查找n n进行信息检索的前提:检索提问、检索课题n n信息检索类型(检索什么检索什么)n n确定性检索确定性检索n n相关性检索相关性检索n n信息检索工具、信息检索系统(使用什么检索使用什么检索)信息检索
2、系统的物理结构1.硬件部分:主机、存贮器、输入输出设备、数据处理或数据输出有关的其他设备。2.软件部分:系统软件:操作系统、语言处理程序、数据库管理程序、诊断程序等应用软件:数据采集程序、自动标引程序、建库与索引程序、词汇管理程序、检索匹配程序、用户接口程序等3.信息资源集合:信息检索系统的基本逻辑结构信息检索系统的基本逻辑结构四、信息源及信息的组织四、信息源及信息的组织个人为满足其信息需要而获得信息的来源,称为“信息源”.文献信息源非文献信息源电子信息源电子信息源纸本信息源纸本信息源其他信息源其他信息源一次信息源二次信息源三次信息源1.文献的类型及识别2.什么是信息组织3.信息组织的基本内容
3、4.图书馆的信息组织5.信息组织的两大思想1.文献的类型及识别文献的类型及识别按照其性质、特点和出版方式可分为:图书、期刊、特种文献(包括科技报告、会议文献、专利文献、学位论文、标准文献等)按文献的载体形式可分为:印刷型文献(纸本文献)、缩微型文献、声像型文献、机读型文献(电子型文献)按文献加工程度(文献等级结构):一次文献、二次文献、三次文献图书ISBN 978-7-5083-6266-3 ISBN 978-7-5083-6266-3 期刊ISSN:1001-019X ISSN:1001-019X 核心期刊:核心期刊:中文核心期刊要目总览中文核心期刊要目总览 2011 2011版版 七篇七篇
4、文献标识码是按照中国学术期刊(光盘版)检索与评价数据规范规定的分类码,其作用在于对文章按其内容进行归类、以便于文献的统计、期刊评价、确定文献的检索范围。具体如下:A-理论与应用研究学术论文(包括综述报告)B-实用性技术成果报告(科技)、理论学习与社会实践总结(社科)C-业务指导与技术管理性文章(包括领导讲话、特约评论等)D-一般动态性信息(通讯、报道、会议活动、专访等)E-文件、资料(包括历史资料、统计资料、机构、人物、书刊、知识介绍等)参考文献著录中的文献类别代码:专著:M会议录:C 汇编:G 报纸:N 期刊:J学位论文:D 报告:R标准:S 专利:P数据库:DB 计算机程序:CP电子公告:
5、EB专著、论文集中的析出文献用单字“A”标识;其他未说明的文献类型,用单字“Z”标识。文后参考文献著录规则:GB/T 7714-2005 学位论文(dissertation、thesis)会议文献(conference、Proceedings)标准文献专利文献其他2.什么是信息组织 信息组织,也叫信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。外部特征:信息的物理载体直接反映的信息对象,外部特征:信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征构成信息的外在的、形式的特征 内部特征
6、:信息包含的内容,由主题词、关键词内部特征:信息包含的内容,由主题词、关键词或其它知识单元表达或其它知识单元表达pp 信息描述和揭示 根据信息组织和检索的需要,对信息的主题内容、根据信息组织和检索的需要,对信息的主题内容、形式特征、物质形态等进行分析和记录形式特征、物质形态等进行分析和记录pp 信息存储 将经过加工整理序化后的信息按一定格式与顺序将经过加工整理序化后的信息按一定格式与顺序存储在特定的载体中存储在特定的载体中3.信息组织的基本内容4.图书馆的信息组织物理陈列:分类号、索书号、上架、更新4.图书馆的信息组织馆藏书目检索库 题名、作者、出版时间、分类号、国际标准书号、索书号、主题词5
7、.信息组织的两大思想分类方法分类方法 根据信息的学科体系特征来序列信息的一种方法根据信息的学科体系特征来序列信息的一种方法体系。如体系。如中国图书馆分类法中国图书馆分类法、UDCUDC等等主题方法主题方法 根据文献主题特征来组织排列信息的一种方法,根据文献主题特征来组织排列信息的一种方法,由受控的自然语言语词直接表达主题概念。由受控的自然语言语词直接表达主题概念。应用 分类法:Yahoo分类目录 门户网站分类频道 分类搜索浏览 主题法:百度,Google 搜索引擎信息组织的两大思想第二章第二章 网络学术信息检索的基本知识网络学术信息检索的基本知识第一节 网络学术信息资源概述第二节 网络学术资源
8、检索原理和方法第三节 信息检索的基本步骤第一节第一节 网络学术信息资源概述网络学术信息资源概述1 1网络学术信息资源的特点2 2网络学术资源的类型3 3网络学术信息资源检索中几个基本术语4 4网络学术资源的基本服务模式5 5网络学术资源的合理使用1网络学术信息资源的特点网络学术信息资源的特点总体来说,正在形成由商业出版机构和非赢利学术出版机构开发生产的电子化文献为主,基于开放存取(OA)的理念出版的学术成果为辅的网络学术资源生产、交流与传播体系。具体来说:1.内容丰富、增长迅速、形式多样服务的主体:传统学术文献出版机构开放存取:从内容和学科来看:不同领域、地域、语言从媒体形式来看:文本、图片、
9、音频、视频、三维虚拟影像2.结构复杂、格式多样3.分布式保存、集成化服务4.多种服务模式面向最终用户2网络学术资源的类型网络学术资源的类型1.1.书目型数据库文摘/索引数据库馆藏书目数据库(OPAC)2.2.全文数据库3.3.参考工具数据库4.4.其他资源3几个基本术语几个基本术语网络信息资源检索中的几个基本术语1.1.DOI:DOIDOI是是“Digital Object IdentifierDigital Object Identifier”的简写,用的简写,用来标识在数字环境中的内容对象。随着时间推移,来标识在数字环境中的内容对象。随着时间推移,数字对象的某些有关信息可能会有变化数字对象
10、的某些有关信息可能会有变化(包括从哪里包括从哪里可以找到它可以找到它),但是,但是DOIDOI不会改变。不会改变。DOIDOI是一个永久是一个永久性的标识号,由性的标识号,由International DOI FoundationInternational DOI Foundation管理。管理。例如:doi:10.1016/j.actao.2007.05.006 SDOL、SpringerLink等数据库中采用。http:/dx.doi.org/2.2.PMID:PMID为 PubMed Identifier 或 PubMed Unique Identifier的缩写,形式为一组号码,用于指
11、定 PubMed 生命科学(life science)、生物医学(biomedical scientific)每一篇期刊文章。例如:PMID:15258113 PUBMED数据库中采用。3.3.参考文献链接系统:CrossRefCrossRef是一个基于DOI实现文献引文跨出版社服务平台链接的参考链接服务系统。提供的链接服务可以从文献的参考文献链接到全文。一篇文献的引文(或参考文献)原文如果有网络版并注册了DOI,用户就可以利用引文中设置的CrossRef链接按钮直接链接到引文所在的出版社网页,获得引文文摘信息,如果图书馆从出版社订购了该网络版期刊,读者将可以由此打开引文全文.http:/ww
12、w.crossref.org/4.4.RSSRSS是基于XML技术的互联网内容发布和集成技术,是一种描述新闻或其他Web内容的方式,通过“Feed”将最新的信息即时主动推送到用户桌面,使用户不必直接访问网站就能得到更新的内容。4网络学术资源的基本服务模式网络学术资源的基本服务模式1.1.商业学术资源的销售与访问控制模式个人用户:团体用户:主要采取图书馆共建共享方式订购网络学术资源。中国高等教育文献保障系统(CALIS)China Academic Library&Information SystemChina Academic Library&Information Syste
13、m 2.2.国外学术资源的四种服务方式建立国内镜像服务器租用国际网络专线购买电子资源裸数据直接通过因特网登录国外主站点进行访问5网络学术资源的合理使用网络学术资源的合理使用1.1.电子资源的许可协议2.2.合理使用的基本操作规则一般来说:一般来说:不得使用任何软件、工具下载图书馆购买的电子资源;不得使用任何软件、工具下载图书馆购买的电子资源;不得批量下载文献,也不得将所获得的文献提供给校外不得批量下载文献,也不得将所获得的文献提供给校外人员,更不允许利用获得的文献资料进行非法牟利。人员,更不允许利用获得的文献资料进行非法牟利。校内任何单位和个人,如设置相应的代理服务器,一定校内任何单位和个人,
14、如设置相应的代理服务器,一定要事先得到图书馆允许,并且保证该服务器不得允许校要事先得到图书馆允许,并且保证该服务器不得允许校园外园外IPIP通过它访问图书馆购买的电子资源。通过它访问图书馆购买的电子资源。3.3.远程访问图书馆电子资源技术代理服务器代理服务器EZproxyEZproxyVPNVPN(Virtual Private NetworkVirtual Private Network)AthensAthens移动图书馆移动图书馆代理服务器 代理服务器受支持协议的限制,一些客户端服务器模式的电子资源如CA网络版SciFinder,无法通过代理服务器访问。EZproxy与普通代理服务器软件的
15、主要区别,它采用“URL重写”技术,用户无需修改浏览器的设置就能实现代理访问资源的功能VPN(Virtual Private Network)依靠ISP(Intemet服务提供商)和其他NSP(网络服务提供商)在公用网络中建立专用的数据通信网络的技术。电信用户:https:/61.150.47.13/网通用户:https:/221.11.67.242/教育网用户:https:/210.27.80.90/Athens Athens是英国高等教育部于1996年开始实施的一个用于网络数据库登录管理的项目,随后成为英国教育部门和卫生部门利用网络资源的事实标准。移动图书馆可以使用手机、平板等移动设备,通
16、过3G、GPRS、WiFi等多种接入方式,访问移动图书馆,进行数字图书阅读、馆藏信息查询、个人借阅情况查询等操作http:/ 网络资源检索原理和方法网络资源检索原理和方法1 1网络资源检索基本概念2 2基本检索技术3 3检索结果的分析与管理1网络资源检索基本概念网络资源检索基本概念1.1.检索字段与检索途径2.2.检索语言与主题词表3.3.检索方式4.4.在线帮助机制1.1.检索字段与检索途径数据库中最小的数据单元为字段(fileld),包括文献题名、著者、文摘、来源出版物、关键词、主题词、全文等。检索字段或检索途径是用户检索时所选择的入口,这是两个相互呼应的概念,选择什么样的检索字段,即遵循
17、了什么样的检索途径。基本检索字段、辅助检索字段基本检索字段、辅助检索字段基本检索字段:反映文献内容特征的字段。基本检索字段:反映文献内容特征的字段。辅助检索字段:反映文献外表特征的字段。辅助检索字段:反映文献外表特征的字段。题名字段题名字段泛指文献名称,包括图书题名、期刊题名、论文泛指文献名称,包括图书题名、期刊题名、论文篇名、会议文献篇名、学会论文篇名等。篇名、会议文献篇名、学会论文篇名等。著者字段著者字段主题词字段主题词字段文摘字段文摘字段全部字段全部字段2.2.检索语言与主题词表检索语言主题语言主题语言分类语言分类语言主题词表中图法马克思主义、列宁主义、毛泽东思想、邓小平理论马克思主义、
18、列宁主义、毛泽东思想、邓小平理论A 马克思主义、列宁主义、毛泽东思想、邓小平理论马克思主义、列宁主义、毛泽东思想、邓小平理论哲学哲学B 哲学、宗教哲学、宗教社会科学社会科学C 社会科学总论社会科学总论D 政治、法律政治、法律E 军事军事F 经济经济G 文化、科学、教育、体文化、科学、教育、体育育H 语言、文字语言、文字I 文学文学J 艺术艺术K 历史、地理历史、地理自然科学自然科学N 自然科学总论自然科学总论O 数理科学和化学数理科学和化学P 天文学、地球科学天文学、地球科学Q 生物科学生物科学R 医药、卫生医药、卫生S 农业科学农业科学T 工业技术工业技术U 交通运输交通运输V 航空、航天航
19、空、航天X 环境科学、安全科学环境科学、安全科学综合性图书综合性图书Z 综合性图书综合性图书TBTB一般工业技术一般工业技术TDTD矿业工程矿业工程TETE石油、天然气工业石油、天然气工业TFTF冶金工业冶金工业TGTG金属学与金属工艺金属学与金属工艺THTH机械、仪表工业机械、仪表工业TJTJ武器工业武器工业TKTK能源与动力工程能源与动力工程TLTL原子能技术原子能技术TMTM电工技术电工技术TNTN无线电电子学、电信技术无线电电子学、电信技术TPTP自动化技术、计算机技术自动化技术、计算机技术TQTQ化学工业化学工业TSTS轻工业、手工业轻工业、手工业TUTU建筑科学建筑科学TVTV水利
20、工程水利工程http:/ 总类、科学和知识总类、科学和知识 1 哲学、心理学哲学、心理学 2 宗教、神学宗教、神学 3 社会科学社会科学 4 (语言语言)5 数学和自然科学数学和自然科学 6 应用科学、医学、技术应用科学、医学、技术 7 艺术、娱乐、体育艺术、娱乐、体育 8 语言、语言学、文学语言、语言学、文学 9 地理、传记、历史地理、传记、历史3.3.获取信息方式基本检索高级检索专业检索二次检索与检索历史限定检索范围浏览CSAOVIDEIERICSpringerLinkCNKI中国期刊全文数据库中国期刊全文数据库SDOL4.4.在线帮助机制n n特定上下文帮助n n在线用户手册n n资源内
21、容介绍2基本检索技术基本检索技术1.1.布尔逻辑算符2.2.位置算符3.3.截词算符4.4.限定字段检索5.5.检索式的编制6.6.检索结果的浏览与输出1.1.布尔逻辑算符逻辑“或”(和)用符号“or”或“+”表示,其逻辑表达式为:A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。AB逻辑“与”用符号“and”或“*”表示,其逻辑表达式为:A*B 或 A and B其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。AB逻辑“非”用符号“not”或“-”,其逻辑表达式为:A not B 或 A-B 其意义为:检索记录中含有
22、检索词A,但不能含有检索词B的文献,才算命中文献。AB2.2.位置算符With:设定需检索的两个词或词组在同一字段中,但不限制位置的先后。Near:设定需检索的两个词或词组在同一语句中,相对于“with”更接近。此外,在使用“near”运算符时,还可以在该运算符后添加一个数字以便进一步限定两个词之间的邻近程度,如“near3”设定需检索的两个词或词组在同一句子中且相隔不超过3个单词。3.3.截词算符截词算符截词算符截词算符截词检索主要是利用检索词的词干或不完整的截词检索主要是利用检索词的词干或不完整的词形进行检索。词形进行检索。截词符一般用截词符一般用“?”、“*”、“#”表示表示后方截词:用
23、于前方一致的派生词检索。后方截词:用于前方一致的派生词检索。如:信息?如:信息?则表示在数据库中含有信息、信息技术、信息检则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。索等方面的文献记录均为命中文献。前方截词:用于后方一致的派生词检索。前方截词:用于后方一致的派生词检索。如:?经济如:?经济 则数据库中含有经济、工业经济、农业经济等方则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。面的文献均为命中文献。有限截词有限截词 在检索词后面加上一个或一个以上的在检索词后面加上一个或一个以上的“?”,空,空一格,再加一个一格,再加一个“?”。如:。如:Comp
24、ut?Comput?可检索出:可检索出:ComputerComputer,ComputersComputers,ComputingComputing截词检索在不同的计算机检索系统中规定不同,请使用时注意4.4.限定字段检索限定字段检索为了缩小检索范围,可利用字段代码来限制为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和命中率。检索词出现的字段,以提高检索速度和命中率。如:如:rice in tirice in ti(表示只在题目字段中查找文献)(表示只在题目字段中查找文献)rice in abrice in ab(只在文摘中查找)(只在文摘中查找)au=Smithau=
25、Smith,J.C(J.C(查作者为查作者为SmithSmith,J.C J.C 的的 文章文章)py=1998(py=1998(只查只查19981998年的文章年的文章)la=Chinese(la=Chinese(只查语种为中文的文献只查语种为中文的文献)5.5.检索式的编制确定合适的检索词检索词要求检索词要求“准准”而而“全全”。检索词的来源:检索词的来源:l l已有知识的积累,即熟悉要检索的课题。已有知识的积累,即熟悉要检索的课题。l l根据现有文献获得检索词根据现有文献获得检索词构造检索式检索历史的重复与检索式的调整缩窄检索条件缩窄检索条件n n使用更窄的检索词替代已经使用的检索词使用
26、更窄的检索词替代已经使用的检索词n n使用恰当的主题词代替自然语言词使用恰当的主题词代替自然语言词n n限定检索词出现在特定字段中限定检索词出现在特定字段中n nandand和和notnot的使用的使用n n其他条件的限定,如语言、出版日期、文献类型等其他条件的限定,如语言、出版日期、文献类型等放宽检索条件放宽检索条件n n减少减少andand组合的检索词的数量组合的检索词的数量n n增加同义词的数量增加同义词的数量n n更多使用截词符更多使用截词符n n去掉吗限定条件,如语言、日期等去掉吗限定条件,如语言、日期等n n使用使用“全部字段全部字段”选项选项数据库中检索历史重复与检索式调整的实现
27、数据库中检索历史重复与检索式调整的实现n n检索历史检索历史n n二次检索二次检索索引的浏览6.6.检索结果的浏览与输出检索结果的显示与排序按相关性(按相关性(RelevanceRelevance)按日期(按日期(datedate)按作者姓名(按作者姓名(Author AZ,Author ZAAuthor AZ,Author ZA)检索结果的输出下载(Download)、存盘(Save)打印(Print)、电子邮件(Email)标记(Mark/Select/Check)输出(Export)3检索结果的分析与管理检索结果的分析与管理1.1.检索效果的评价2.2.个人文献信息管理系统1.1.检索效
28、果的评价n n查全率与查准率n n收录范围n n输出格式与方式n n链接的可靠性n n资源的更新频率n n系统辅助分析功能的使用如如ISI Web of ScienceISI Web of Science数据库的分析功能(数据库的分析功能(Analyze Analyze ResultsResults)2.2.个人文献信息管理系统n nRefWorksn nEndNotesn nNoteExpressn nReference Managern n医学文献王n n选择标准:n系统能够支持多种文献类型的数据格式n系统支持访问的联机检索系统的列表,以及导入数据的格式个关键信息字段。提供用户自行建立格式
29、的功能n支持从网络学术资源中转入检索结果n支持学术期刊的引用及参考文献的著录格式n支持中文文献管理第三节信息检索的基本步骤第三节信息检索的基本步骤1 1分析检索课题 2 2选择检索系统和数据库 3 3确定检索词 4 4构建检索提问式 5 5上机检索并调整检索策略6 6输出检索结果 1 1分析检索课题1.1.弄清用户信息需求的目的和意图。2.2.分析课题涉及的学科范围、主题要求。3.3.课题所需信息的内容及其特征。3.3.课题所需信息的类型,包括文献类型、年代范围、语种、著者、机构等。4.4.课题对查新、查准、查全的指标要求。2 2选择系统和数据库1.1.数据库收录的信息内容所涉及的学科范围;2
30、.2.数据库收录的文献类型、数量、时间范围以及更新周期;3.3.数据库所提供的检索途径、检索功能和服务方式。3 3确定检索词确定检索词1.1.先选用主题词。当所选的数据库具有规范化词表先选用主题词。当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关时,应优先选用该数据库词表中与检索课题相关的规范化主题词,从而可获得最佳的检索效果。的规范化主题词,从而可获得最佳的检索效果。2.2.选用数据库规定的代码。许多数据库的文档中使选用数据库规定的代码。许多数据库的文档中使用各种代码来表示各种主题范畴用各种代码来表示各种主题范畴,有很高的匹配有很高的匹配性。性。3.3.选用常用的专业术
31、语。在数据库没有专用的词表选用常用的专业术语。在数据库没有专用的词表或词表中没有可选的词时,可以从一些已有的相或词表中没有可选的词时,可以从一些已有的相关专业文献中选择常用的专业术语作为检索词。关专业文献中选择常用的专业术语作为检索词。4.4.选用同义词与相关词。同义词、近义词、相关词、选用同义词与相关词。同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。缩写词、词形变化等应尽量选全,以提高查全率。4 4构建检索提问式构建检索提问式1.1.使用逻辑使用逻辑“与与”算符可以缩小命中范围,起到缩算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也检的作用,得到的
32、检索结果专指性强,查准率也就高。就高。2.2.使用逻辑使用逻辑“或或”算符可以扩大命中范围,得到更算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高。多的检索结果,起到扩检的作用,查全率也就高。3.3.使用使用“非非”算符可以缩小命中范围,得到更切题算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。慎重,以免把一些相关信息漏掉。4.4.在构建检索提问式时,还要注意位置算符、截词在构建检索提问式时,还要注意位置算符、截词符等的使用方法,及各个检索项的限定要求及输符等的使用方法,及各
33、个检索项的限定要求及输入次序等。入次序等。5 5上机检索并调整检索策略上机检索并调整检索策略1.1.检索结果信息量过多检索结果信息量过多原因可能有以下两点:一是主题词本身的多义性原因可能有以下两点:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。在这导致误检;二是对所选的检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查种情况下,就要考虑缩小检索范围,提高检索结果的查准率。准率。2.2.检索结果信息量过少检索结果信息量过少原因主要有:首先,选用了不规范的主题词或原因主要有:首先,选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;其二,同某些产品
34、的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其三,上位概义词、相关词、近义词没有运用全;其三,上位概念或下位概念没有完整运用。针对这种情况,就要念或下位概念没有完整运用。针对这种情况,就要考虑扩大检索范围,提高检索结果的查全率。考虑扩大检索范围,提高检索结果的查全率。6 6输出检索结果根据检索系统提供的检索结果输出格式,选择根据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段需要的记录以及相应的字段(全部字段或部分字段全部字段或部分字段),将结果显示在显示器屏幕上、存储到磁盘或直接打将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电子邮件发送、印输出,网络数据库检索系统还提供电子邮件发送、输出到个人文献管理工具里面等功能。输出到个人文献管理工具里面等功能。
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100