1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。不能作为科学依据。,网络资源与信息检索,陈斌辉,cbh,1/172,基本要求:,掌握基本术语、基本概念,重点、难点:,信息类型与特点 (十二大文件源)文件检索工具类型 (目录、题录、文摘、索引),1.1 信息检索基础知识,2/172,一、概念-信息,信息
2、信息是一个十分广泛概念,它在自然界、人类社会以及人类思维活动中普遍存在。,信息定义为:物质存在方式和运动状态反应,在发生源和吸收源之间,当发生源发出信号被吸收源所了解,信号就成为信息,了解接收,信号 信息,3/172,一、概念-信息,预先性(如天气预报,必须是提前,落后则失效),实用性,时效性,可传递性,信息特征,4/172,一、概念-资料,固化在一定实物或载体上知识。,知识+载体(实物):雕像、寿山石、化石标本。,目标:为工作、生产、学习和科研作参考,5/172,一、概念-文件,大凡人类知识用文字、图形、符号、声频、视频伎俩统计下来东西,统统可称为文件。也能够称为,固化在一定载体上知识,。
3、灵魂:知识 文件内容,载体:文件形态,如甲骨、青铜器、纸介型、胶片,磁带,磁盘,光盘等,统计伎俩:文字、图像、公式、声频、视频和代码等,物质形态:图书、期刊、专利说明书、录音带、缩微品、光盘等,6/172,信息、文件、资料三个概念包含关系,文件 资料 信息,7/172,二、信息类型及特点,按信息加工层次划分 P2,按信息载体物理类型划分,P2,按信息载体出版编辑特点划分P3,8/172,按信息加工层次划分 P2,一次信息,(原始文件):,以作者本人在生产和科研中所取得结果为依据而创作 原始文件所传递信息。,二次信息,(检索工具):,将分散、无组织一次信息,按一定标准加工、整理、简化、组织成为
4、系统、便于查找利用信息。,三次信息,(参考性文件):,在合理利用二次信息基础上,选取一次信息内容,依据一定需要、目标进行分析、综合或浓缩重组而得到信息。,二、信息类型及特点,9/172,文件结构示意图,目录,题录,索引,文摘,词典,名目,指南,手册,年鉴,评述,论文丛集,百科全书,二次文件,原始文件,(一次文件),三次文件,文件整理,重组、浓缩,10/172,二次信息与三次信息区分:,对象不一样,二次信息以“篇”或“本”为单位进行加工,三次信息则归纳了较多一次信息内容,用途不一样,二次信息为检索一次信息工具;三次信息能直接提供检索答案.,学习网检课目标:怎样经过二次信息去查找一次信息,二、信息
5、类型及特点,11/172,印刷型,缩微型,电子型,声像型文件(视听型文件),按信息载体物理类型划分 P2,二、信息类型及特点,12/172,印刷型,经过铅印、油印和胶印等伎俩,将知识固化在纸张上一类文件。,传统文件形式,缺点:存贮密度低,体积庞大,不便于管理,加上纸张化学、物理特征,难于收藏保留,二、信息类型及特点,按信息载体物理类型划分,13/172,缩微型,以印刷型文件为母本,采取光学摄影技术,把文件影象固化在感光材料上一类文件。,常见缩微型文件有缩微卡片和缩微胶卷两种。,优点:体积小、存贮密度高,便于传递、保留可节约书库面积达90以上。,缺点:不能直接阅读,必须借助阅读机,按信息载体物理
6、类型划分 P2,14/172,电子型(机读型),一个以磁性材料(磁带、磁盘)为存贮介质并经过计算机处理而产生一个文件形式。,常见是各种已录有内容磁带、磁盘、光盘。,优点:信息量大、查找快速,缺点:存贮、阅读和查找利用都须经过计算机才能进行,设备昂贵、使用费用高,二、信息类型及特点,按信息载体物理类型划分 P2,15/172,声像型(视听型、直感型),一个非文字形式文件。,常见有各种视听资料,如唱片、录音带、电影胶片、激光声视盘(CD-ROM)、幻灯片等。,优点:直观、形象,缺点:经过唱机、录音机、录象机、放影机和投影机等给予重现。,二、信息类型及特点,按信息载体物理类型划分 P2,16/172
7、1、按信息载体出版编辑特点划分P3,图书,期刊,特种文件,其它,标准,科技汇报,政府出版物,学位论文,专利文件,原始文件,会议文件,17/172,图书,:是对科研结果、生产技术和经验总结性概况叙述。,内容特点:系统性好、完整性好。出版周期较长,报道速度相对较慢。,著录特征:著者、出版项(出版地、出版社名和出版年份)、国际标准图书号(ISBN)。,二、信息类型及特点,按信息载体出版编辑特点划分,由13位数组成978-7-5335-1519-6/TP64,第一段:与条码系统统一,表示此商品为图书,第二段:组号代表国家、地域、语种,第三段:出版者号,由国家或地域ISBN中心分配;,第四段:书名号,
8、由出版者按出版次序所给,第五段:校验位,旧标准为10位,去掉开始978,18/172,期刊,期刊普通是指名称固定、定时或不定时连续出版物。,特点:内容新奇 报道速度快 系统性差,著录特征:ISSN、CN、年、卷、期(邮发代号内部准印证),二、信息类型及特点,按信息载体出版编辑特点划分,国际标准期刊号ISSN,由8位数组成,(国际标准序列号),比如,ISSN10050043,最终一位为检验码。,CN 国内统一刊号,CN:113248/TP,地域号次序号分类号,19/172,会议文件,:研究人员在各种学术会议上交流科研新结果、新进展、及发展趋势讨论统计或论文(通称会议论文),特点:传递信息及时、针
9、对性强、内容新奇。一部分科研结果就是经过学术会议首次发表,会议文件特征:有会议召开地点、届次、时间,以及会议录出版社、出版地、出版时间等。,二、信息类型及特点,按信息载体出版编辑特点划分,20/172,专利文件,一个使用方法律形式来保护文件,专利文件主要由专利说明书组成。,专利说明书是公开文件,但只能由各国专利局发行,它反应了当前最新技术结果。专利说明书对于工程技术人员,尤其是产品工艺设计人员来说,是一个主要情报源。,申请专利三个条件:新奇性、创造性和实用性,中国专利类型:创造专利、实用新型专利、外观设计专利,二、信息类型及特点,按信息载体出版编辑特点划分,21/172,专利类型,创造专利:,
10、含有较高水平创造,是在某个领域内含有独创性创造,实用新型专利:,对机器、设备、装置、用具形状、结构及其结合所提出实用新技术方案,比如:雨伞伞柄、伞骨和伞头结构设计。,外观设计专利:,指对产品形状、图案、色彩或它们结合作出富有美感而适用工业上应用新设计,比如:雨伞形状、图案、色彩,22/172,科技汇报:,是指国家政府部门或科研生产单位关于某项研究结果总结汇报,或是研究过程中阶段进展汇报。,与期刊相比:在内容方面,汇报比期刊论文专深、详尽、可靠。是一个不可多得情报源。科技汇报能代表一个国家和专业发展水平及动向。,当前国际上较著名科技汇报是美国政府四大汇报,即:,民用工程汇报,军用工程汇报,航空航
11、天汇报,能源汇报。,这四大汇报每年公开和加密部分约6万件。,二、信息类型及特点,按信息载体出版编辑特点划分,23/172,学位论文,是著者为取得某种学位而撰写科学论文,普通偏重于理论,附有大量参考文件,借此能够看出相关专题发展过程和方向。博士论文含有较高参考价值。,学位论文普通不出版发行,而是保留在授予学位单位图书馆里。,我校硕士生学位论文 )。,对了解一个国家科技和经济政策及其演变情况有一定参考价值。,二、信息类型及特点,按信息载体出版编辑特点划分,25/172,标准文件,是对工农业产品和工程建设质量、规格及其检验方法所做技术要求。标准文件含有一定法律约束力。,反应当初技术工艺水平及技术政策
12、国际标准化组织(ISO)和国际电工委员会(IEC)。,二、信息类型及特点,按信息载体出版编辑特点划分,标准文件特点是:有标准号。,标准号由三部分组成:标准颁布机构代码+次序号+颁布年份,比如:GB2683-98,标准颁布机构代码次序号 颁布年份,26/172,产品资料,指产品目录、产品样本和产品说明书一类厂商产品宣传和使用资料。产品技术资料普通向厂商直接索取。,产品资料是人员选型、设计和引进国外设备仪器有价值参考资料。,二、信息类型及特点,按信息载体出版编辑特点划分,27/172,技术档案,是指生产建设和科学技术部门在技术活动中形成。,技术档案特点:真实性、保密性、准确性,二、信息类型及特点
13、按信息载体出版编辑特点划分,28/172,报纸、新闻稿,是指那些阐述问题面广,含有群众性与通俗性,可取得一些主要消息资料。,特点:群众性、通俗性,对科技结果报道不系统,二、信息类型及特点,按信息载体出版编辑特点划分,29/172,工作文稿,准备在期刊上发表或向学术会议提出论文或研究汇报初稿。,工作文稿是一个短时效文件,是一个极难全方面搜集文件。,二、信息类型及特点,按信息载体出版编辑特点划分,30/172,依据检索课题性质选择所需要文件类型,理论探讨性质,-期刊、会议文件,了解某一个课题历史现实状况及末来,-图书,工艺革新、创造创造,-专利文件,了解尖端技术,-科技汇报,毕业设计、撰写毕业论
14、文,-学位论文,国家政策,-政府出版物,产品设计、生产造型,-标准文件、产品资料,图书、,期刊、,会议文件、,专利文件、,科技汇报、,学位论文、,政府出版物、,标准文件、,产品资料、,技术档案、,报纸新闻稿、,工作文摘,31/172,三、信息检索 P5,信息检索,,就是从大量文件中查寻与信息提问所指定课题(对象)相关文件,或者是包含用户所需事实与消息文件过程。,它主要包含三个方面:,数据检索、事实检索、文件检索,数据检索、事实检索、文件检索三者中以文件检索为主。,1.定义,32/172,其它分类,全文检索,:检索结果是全篇文章,图像检索,:检索结果是图片信息,多媒体检索,:检索结果是多媒体信息
15、33/172,检索方式分为两种:,直接检索,:利用一次文件进行检索,没有使用检索工具。,间接检索,:利用各种检索工具取得文件线索,再依据文件线索查找原始文件。,34/172,第2章 信息资源检索基础 P9,信息资源检索原理,检索效果评价指标,检索策略与步骤,35/172,信息资源检索原理,信息检索基本原理,:,经过对大量、分散无序文件信息进行搜集、加工、组织、存放,建立各种各样检索系统,并经过一定方法和伎俩使存放与检索这两个过程所采取特征标识到达一致,方便有效地取得和利用信息源。,36/172,信息资源检索原理 P9,包含两个过程:存放和检索,存放,:一次信息信息特征二次信息,检索,:二次信
16、息检索请求一次信息,(信息特征),信息检索语言,:存放和检索双方要共同遵照规则,标引,:对一次信息进行分析,从自然语言转换成规范化检索语言过程,目标是内容分析结果赋予检索标识。,37/172,信息检索原理图 P24,38/172,惯用检索效果评价指标:P10,查全率和查准率、漏检率和误检率,相关文件,非相关文件,总计,被检出文件,a,b,a+b,未检出文件,c,d,c+d,总计,a+c,b+d,a+b+c+d,用户相关性:是否和用户需求相符,系统相关性:是否和检索提问相匹配,用,户,相,关,性,判,断,系,统,相,关,性,预,报,39/172,40/172,影响查全率与查准率原因 P12,标引
17、选取不适当标引词、遗漏必须描述概念。,检索语言:,词表参考系统和等级结构关系,检索策略:,主观原因,因为查全率和查准率互逆关系,实践中只能在查全率和查准率中寻找最大可能折中,41/172,信息检索语言 P13,检索语言,-是依据信息检索系统存放和检索需要而编制人工语言。,分类语言,和,主题语言,是最主要检索语言类型。,42/172,(1)分类语言,用,分类号,作为主题概念标识,将各种概念,按学科性质进行分类,和系统排列检索语言。,有以下三种:体系分类语言、组配分类语言、混合分类语言。,常见:中图法5个基本部类21大类,43/172,常见体系分类语言,中国图书馆分类法,-中,图法,中国科学院
18、图书馆图书分类法,-科,图法,中国人民大学图书馆图书分类法,-人,大法,44/172,中图法结构示意图,A 马克思主义、列宁主义,毛泽东思想、邓小平理论,B 哲学、宗教,C 社会科学总论,D 政治、法律,E 军事,F 经济,G 文化、科学、教育、体育,H 语言、文字,I 文学,J 艺术,K 历史、地理,N 自然科学总论,O 数理科学和化学,P 天文学、地球科学,Q 生物科学,R 医药、卫生,S 农业科学,T 工业技术,U 交通运输,V 航空、航天,X 环境科学、安全科学,Z 综合性图书,U1 综合运输,U2 铁路运输,U4 公路运输,U6 水路运输,U8 航空运输,U41 道路工程,U44 桥
19、涵工程,U45 隧道工程,U46 汽车工程,U48 其它道路,运输工具,U49 交通工程与公路,运输技术管理,U441 结构原理、,结构力学,U442 勘测、设计与计算,U443 桥梁结构,U444 桥梁建筑材料,U445 桥梁施工,U446 桥梁试验观察与检定,U447 桥梁安全与事故,U448 各种桥型,U449 涵洞工程,基本大类 简表 详表,45/172,(2)主题语言,以文件信息内容特征和科学概念词语为检索标识,并按字顺排列一个检索语言。,包含以下几个:标题词语言、单元词语言、叙词语言和关键词语言。,46/172,常见两种检索语言比较,分类语言,主题语言,以学科和专业集汉字献,能将不
20、一样学科信息集中到一起,适宜族性检索,适宜特征检索,不利于新兴学科、交叉学科和边缘学科检索,不利于新兴学科检索,查全率不高,查准率不高,47/172,信息检索技术 P15,检索方法,1.直接查找法,2.间接查找法,顺查法(查全率高),倒查法(查准率高),抽查法,3.引文追溯法,4.综正当,(是2与3结合),48/172,顺查法,-,从远及近查,用于了解某一事物发展全过程。,优点:系统、全方面、查全率高。,缺点:费时费劲,工作量较大。,适合用于复杂大课题进行全方面检索,49/172,倒查法,-由近及远查,重点为近期,在基本上取得所需信息时即可终止检索。,优点:可确保情报新奇性,缺点:因漏检而影响
21、查全率,用于查找新课题,能够最先取得最新奇信息资料,及时把握学科最新发展动态。,50/172,抽查法,-针对课题发展特点,抓住学科发展、发表文件较多年代进行查找。,这是利用学科发展普通是波浪式特点查找文件一个方法。当学科处于兴旺发展时期,科技结果和发表文件普通也很多。所以,只要针对发展高峰进行抽查,就能查获较多文件资料。,优点:针对性强,节约时间。,缺点:不足大,51/172,追溯法(引文法),-以文件后面附着参考文件为线索而查找相关文件一个方法。,在没有检索工具或检索工具不完整时可借助此取得相关文件。,缺点:查全率、查准率较低,易误检漏检,52/172,怎样选择检索方法,要求查全-,顺查法,
22、要求快、新-,倒查法,;,掌握了课题发展阶段特点-,抽查法,。,为快速地取得全方面准备信息资料-,综正当,53/172,1.布尔检索,经过与(and,*)、或(or,+)、非(not,-)将检索词连接起来。,2.截词检索,惯用截词符(?、*),3.位置检索,4.字段限定检索,检索技术 P16,54/172,布尔检索布尔逻辑运算符,逻辑与:,符号为“*”或“AND”,A*B:表示数据库中既含有A概念又含有B概念文件才被命中。,表示式:A*B 或 A AND B,如:计算机在机械工业中应用,计算机应用*机械工业,55/172,布尔逻辑运算,逻辑或:,符号为“”或“OR”,AB:表示在数据库中只
23、要含有A概念或B概念文件都可命中。,表示式:AB 或 A OR B,如:机器人结构及构件研究,机器人结构+机器人构件,56/172,布尔逻辑运算,逻辑非:,符号为“”或“NOT”,AB:表示在数据库中,在命中含有A概念文件集合里,去除同时含有B概念文件。,表示式:A NOT B 或 AB,如:亚洲以外对外贸易,对外贸易-亚洲,57/172,分析实例:,例1:查找相关信息检索非英文文件,(信息,and,检索),not,英文,例2:,上海零售业现实状况与发展趋势,上海 零售业 现实状况 发展趋势,上海,and,零售业,and,(现实状况,or,发展趋势),58/172,截词检索 P17 截词符(?
24、有限截词,一个截词符代表一个字符,无限截词,1.前截断:?Comput后方匹配,2.后截断:comput?前向匹配,3.中截断:?comput?中间匹配,59/172,例1:comput?,能够检索出Comput,e,Comput,er,Comput,ing,compu,table,例2:,%国庆,将检索出全部字段为,张国庆,、,欧阳国庆,、,国庆,等统计。,分析实例:,60/172,检索工具 P25,检索工具概念,-二次文件,-基本功效:存放和检索文件,检索工具类型,目录型检索工具,题录型检索工具,文件型检索工具,索引型检索工具,61/172,目录型,62/172,题录,63/172,文
25、摘型,64/172,索引型,65/172,检索工具类型,类型,著录对象,著录款目,主要类型,代表,目录,单位出版物,书名、刊名、著者等,书本式,卡片式,馆藏目录,联合目录,题录,单篇文件,著者、篇名、出处等,全国报刊索引,文摘,单篇文件,著者、篇名、出处、摘要,报道型,指示型,化学文摘工程索引,索引,单位出版物、,单篇文件,文件中各知识单元,书名索引,主题索引,作者索引,分类索引,普通不独立成册,附在检索工具、参考工具、书刊之后,66/172,第二部分 网络资源,基本要求,:,掌握网络资源基本类别及对应操作方法,重点、难点,搜索引擎使用方法与技巧,67/172,www资源,电子邮件(Email
26、资源,文件传输(FTP)资源,远程登录(Telnet)资源,流媒体资源,网络资源,68/172,www资源,一、Internet介绍,二、中国互联网络发展,三、中国教育与科研计算机网,四、因特网基础,1、TCP/IP,2、IP地址,3、域名地址及DNS,4、URL,五、WWW信息服务,1、基本概念,2、基于WWW信息检索-搜索引擎,69/172,三、因特网基础,TCP/IP协议,IP地址,域名,域名服务器,70/172,TCP/IP协议,TCP(Transmission Control Protocol,传输控制协议)将文本分成包(数据包),再加上尤其信息,使数据能够准确无误地发送到接收方计
27、算机上。,IP(Internet Protocol,网际协议)在数据包上标上尤其信息(接收主机IP地址),到目标地后,系统自动将IP地址去掉,再利用TCP检验数据是否完整,如有丢损则要求发送方重新发送被丢损数据包。,71/172,IP地址,在Internet上每一台计算机主机都必须有唯一“地址”,以确保Internet上全部计算机和网络能够被相互传送信息而不被混同,以数字表示,称为IP地址。为确保IP地址在整个网上唯一性,该地址普通由Internet网络信息中心统一分配。,72/172,IPv4,地址,比如福州大学WWW服务器IP地址为,:,11010010.00100010.00110000
28、00110000,210.34.48.48,4段,取值0255,nnn.nnn.nnn.nnn,IPv4,格式:,73/172,域名,DN采取,层次结构,,入网每台主机都能够有一个类似下面域名。,www,.,fzu,.,edu,.,cn,主机名.机构名.网络名.顶层域名,从左到右,域范围变大,含有实际含义,比,IP,地址好记,74/172,国家和地域代码,cn:中国,tw:中国台湾地域,hk:中国香港地域,ca:加拿大,sg:新加坡,各省市简称:bj,sh,fj,fz,xm,75/172,组织机构代码,com 商业机构,edu教育机构,gov政府机构,org非盈利性组织,mil军事机构,ne
29、t网间连接组织,int 国际组织,76/172,组织机构代码,rec娱乐休闲资源,info信息服务,store商场,arts文化艺术团体,nom个人,77/172,中国域名要求,顶级域名:CN,二级域名(40):,类别域名:AC、COM、EDU、GOV、NET、ORG,行政区划代码(34个):FJZJSHBJ等省、市名称简写,管理机构:,IP地址:国际:InterNIC国际互联网络信息中心,国内:CNNIC 中国互联网络信息中心,域名地址:国际:几个商业性网络机构,国内:CNNIC,78/172,域名例子,www.whitehouse.gov,79/172,域名服务器,210.34.48.48
30、IP,地址,域名,DNS,(domain name servers),DNS,从事域名和IP地址之间翻译工作,80/172,HTTP,协议,:,/主机地址,:,端口号/路径/文件名,FTP,TELNET,GOPHER,ftp:/210.34.51.1,telnet:/210.34.48.50,,:80,/cindex/,index.html,统一资源定位器 URL,81/172,WWW,信息服务-相关概念,Browser,(浏览器),HTTP,(超文本传输协议),HTML,(超文本标识语言),网页与主页,82/172,浏览器(,Brower,),INTERNET,WWW,Browser,软件
31、信息服务,Communicator,Internet,explorer,83/172,超文本标识语言,(HTML),WWW信息是基于超文本标识语言(HTMLHyper Text Markup Language)描述文件,全部WWW页面都是用HTML编写超文本文件。HTML是WWW用于建立与识别超文本文档标准语言。,84/172,超文本传输协议,(HTTP),HTTP是Web服务器和Web客户机进行通讯语言。全部Web服务器及浏览器必须遵照这一协议,才能发送或接收超文本(超媒体)文件。Web服务器又称HTTP服务器。,85/172,超链接,Hyperlink,给你带来更多与此相关文字、图片等信
32、息。,86/172,网页与主页,浏览器与,Web,服务器之间是以,页为,单位来传送信息。,网页,(,Web Page),Page,),87/172,二、电子邮件(Email)资源,1、什么是电子邮件,2、电子邮件工作原理,3、电子邮箱申请与使用,4、电子邮箱在获取信息中应用,88/172,电子邮件E-mail是一个利用网络交换信息非交互式服务。,经济,迅捷,灵活,可靠,功效多样,特点,1、什么是电子邮件,89/172,电子邮件工作过程,接收方邮,件服务器,接收方计算机,INTERNET,发送方邮,件服务器,发送方计算机,调制解调,器或网卡,调制解调,器或网卡,SMTP,协议,POP3,协议,2
33、电子邮件基本知识,90/172,SMTP,(Simple Mail Transfer Protocol),表示简单邮件传送协议,利用存放、转发形式来进行电子邮件传递。,SMTP邮件服务器或发送邮件服务器,例:,POP3,(Post Office Protocol),表示邮局协议。允许用户访问接收邮件主机,并取走存放在上面邮件。,POP邮件服务器或接收邮件服务器,例:,2、电子邮件基本知识,91/172,三、文件传输FTP,FTP是File Transfer Protocol(文件传输协议)缩写,它允许两台因特网主机相互传送/拷贝文件,能够把自己计算机上某个文件拷贝到网络上某台计算机上,或是把
34、网络上某台计算机上文件拷贝自己计算机上。,92/172,1、文件传输原理,FTP,服务器,文件,客户机,文件,请求,响应,控制连接,数据连接,客户机与服务器之间建立双重连接,下载(download),上载(upload),93/172,Guest,或有效Email地址,2、文件传输工具FTP,使用,FTP,传送文件要求在远程机上有一个,帐号,,提供,匿名FTP,服务主机,上有一个,公共,anonymous,帐号。,Anonymous,匿名服务器,FTP,帐号,口令,94/172,3、怎样查找FTP上资源 P138,一、文件搜索引擎,天网资源:,搜集信息:利用自动搜索机器人程序(称为网络蜘蛛),
35、在网络上寻找和发觉有用或相关信息。,(2)整理信息:将搜集到信息保留下来,并进行分类整理,建立检索数据库。,(3)接收查询:在Web站点上提供检索界面,用户向搜索引擎发出查询,搜索引擎接收查询并向用户返回资料。,搜索引擎运行,需要,网络搜索软件,、,索引数据库,及,检索软件,协同工作。,98/172,99/172,3、搜索引擎类型,全文,搜索引擎(Full Text Search Engine),分类目录式搜索引擎(Search Index/Directory),元搜索引擎(Meta Search Engine),100/172,类别,搜索方式,检索评价,搜索引擎,全文,搜索引擎,搜集保留每一
36、个网站网页地址和网页全部内容,查全率高,查准率低,Google,Baidu,天网,元搜索引擎,在接收用户查询请求时,同时在其它多个引擎上进行搜索,并将结果返回给用户。,查全率高,查准率低,对检索结果整合有待改进,Dogpile,Mamma,Vivisimo,分类目录式搜索引擎,搜集保留各网站站名和网址,再按类编排,查准率高,信息量少,更新不及时,Google网页目录,新浪,搜狐,101/172,全文搜索引擎,经过从互联网上提取各个网站信息(以网页文字为主)而建立数据库中,,检索与用户查询条件匹配相关统计,,然后按一定排列次序将结果返回给用户,所以他们是真正搜索引擎。,102/172,Googl
37、e,由美国斯坦福大学两位博士生拉里佩吉和谢尔盖布林于1998年创建。,其优势在于掌握信息量以及检索模型和检索速度。,Google采取全文标引方式,提供每日更新。现在,Google能够查询网页达40多亿个,天天需要提供2亿次查询服务。,103/172,元搜索引擎,元搜索引擎(metasearch)又称,集合型搜索引擎,,将多个单一搜索引擎集成在一起,提供统一检索界面,将用户检索提问一次搜索多个搜索引擎,并将结果返回给用户。比如 www.谷歌,优点,:能同时搜索多个搜索引擎,能在一定程度上提升查询广度。,缺点,:因为有时后并不能对一个搜索引擎全部查完,有时后也会遗漏一些主要信息。,104/172,
38、分类目录式搜索引擎另一个形式,中国网络之门,网址名目,:两个关键词之间用空格,如:计算机 信息检索(表示“计算机”与“信息检索”),逻辑“或”:大写“OR”,如:计算机 OR 电脑,逻辑“非”:减号“-”,如:coldweather,107/172,2、限制检索,指定网域:利用,site:,能够在某个特定网站或域中进行搜索,指定文件类型:,filetype:,文件类型,能够在某一类文件中进行搜索,比如,filetype:doc,filetype:ppt等,搜索关键词包含在网页标题中:,intitle:,搜索关键词包含在URL链接中:,inurl:,108/172,3、准确检索,搜索定义,def
39、ine,搜索整个短语或者句子,双引号”,。如:“检索技术”和“关于谷歌 使用技巧文章”,4、截词检索,截词检索也是普通数据库检索中惯用方法。通常采取“*”。,5、更多使用技巧,“手气不错”功效,提供可能最符合要求网站;,高级搜索(如使用权限),Google不区分大小写,如:搜索Java、JAVA、java是完全一样。,利用一些特色服务,查询特殊信息。,109/172,为了完整准确地表示检索需求,提升检索准确度。,正确选择关键词,利用各种检索语法与技巧,设计出一个高质量检索式,总结:怎样使用搜索引擎,110/172,图书检索,111/172,一、图书概述,图书主要特征(内容特征),全方面、系统、
40、可靠,判定图书主要依据,著录项中有出版社和出版地、出版年份,著录项中通常还有定价,国际标准书号(ISBN),112/172,CIP(图书在版编目数据),题名、书名;副题名、其它题名,责任者、著者、作者;译者;编者;校对者,出版项:出版地、出版者、出版时间,ISBN号,标题词(主题词),分类号,113/172,图书分类举例,三级考试应试过关30练(A类)匡松主编.,中图法分类号:,TP 3-44,索书号:,TP 3-44/36,索书号=分类号+著者号(或次序号),ABC DEF GHI JKL MNO PQ RS TU WX YZ,0 1 2 3 4 5 6 7 8 9,114/172,二、图书
41、信息检索工具,印刷型书目信息,联机公共检索系统,电子图书与数字图书馆,网上书店,115/172,(一)印刷型书目信息 1/2,全国总书目,按年度收录我国各出版单位出版公开发行图书。,著录简单,无内容介绍,全国新书目,每个月出版一本,及时向读者报道全国最新出版图书。,采取题录和介绍混合报道方式,116/172,馆藏目录,是图书馆或信息资料部门所收藏全部书刊统计目录。,反应一个图书馆藏书情况。,联合目录,是汇总某地域或若干地域甚至是全国图书馆或其它收藏单位所收藏全部书刊统计目录。它为开展,馆际互借,和复制创造了条件。,(一)印刷型书目信息 2/2,117/172,(二)联机公共检索系统,公共检索目
42、录:,各图书馆网上,公共检索目录,OPAC,(Online Public Access Catalog),即一个基于网络书目检索系统,提供图书馆书目信息检索服务。,可经过互联网检索世界各地图书馆,OPAC,。,福州大学图书馆OPAC,清华大学图书馆,OPAC,118/172,经过OPAC查取馆藏文件,10050043 CN35-1048,Vol.26 No.4,V26 N4,26(4),英文期刊名称经常缩写,而且常以斜体给出。,128/172,期刊著录格式,题 名:,环境保护,责 任 者:,国家环境保护局,出 版 社:,中国环境科学出版社,I S S N:0253-9705,C N :11-1
43、700,索 刊 号:,X3/230,出 版 年:,1973,现刊刊频:,月刊,旗山校区五楼南区汉字过刊区在库阅览 7-12,129/172,期刊论文著录格式,题名:福建海洋经济发展浅析,作者:林岳夫,机构:国家海洋局第三海洋研究所,厦门361005,刊名:海洋信息.,21(4).-9-10,18,关键词:福建 海洋经济 产业结构 海洋资源 环境保护,分类号:P74,文摘:福建省是一个含有战略区位优势海洋资源大省,合理开发海洋优势资料、,130/172,期刊论文,篇名,作者,作者单位、联络方式,摘要,正文,关键词,收到日期或编发日期,参考文件,中图法分类号,131/172,二、,期刊检索,书目:
44、馆藏目录,:,联合目录,:,中国高等教育文件保障系统,注:Calis是书、刊一起检索,可依据创刊年来判定是否是期刊。,比如,:,外语教学与研究,132/172,133/172,(一)汉字期刊论文数据库检索,(二)外文期刊论文数据库检索,三、期刊论文检索,134/172,课题检索检索步骤,分析检索课题,选择检索工具,确定检索路径,选择检索方法,查找文件线索,获取原文,135/172,(一)分析检索课题,1、分析检索课题主题内容,2、确定文件类型,3、确定检索时间范围,4、分析已知信息,136/172,分析检索课题主题内容,民营企业中人力资源开发与管理,明确情报需求和检索目标、确定检索词、制订检
45、索策略,1)切分,民营企业 中 人力资源开发 与 管理,2)删除,民营企业 人力资源,3)补充,私营企业家族企业乡镇企业家庭企业 薪酬制度 绩效评定,制订检索表示式,137/172,检索表示式,关键词=(私营企业+家族企业+民营企业)*(人力资源+薪酬制度+绩效评定),例:张锦芯 硕士英语 大学四级英语 北京大学学报,检索表示式:,作者=张锦芯*标题=(?硕士英语?+?大学四级英语?)*刊名=北京大学学报,138/172,分析检索课题 1/2,分析检索课题主题内容,确定所属学科,类号类目,F276各种企业经济私营企业,F279 世界各国企业经济,139/172,分析检索课题 2/2,2.确定文
46、件类型(重点查哪些文件类型),若课题属理论探讨性质:,会议文件、期刊,了解某一个课题历史现实状况及未来:,图书,若课题属工艺革新、创造创造等:,专利文件,若课题属产品设计、生产造型:,标准文件、产品资料,若课题属尖端技术科技汇报:,科技汇报,140/172,(二)选择检索工具,依据课题学科性质和专业性质选择适当检索工具。,选择检索工具,要看其存放内容是否全方面,注意综合使用权威性综合检索工具和专业性较强各学科检索工具。,全国报刊索引,生物学文摘,管理科学文摘,141/172,(三)确定检索路径,分类路径,(反应主题内容),主题路径,(反应主题内容),题名路径,(反应特定文件外表特征),著者路径
47、反应特定文件外表特征),号码路径,(反应特定文件外表特征),142/172,(四)选择检索方法,惯使用方法,-,顺查法,-,倒查法,抽查法,追溯法,综正当,143/172,(五)查找文件线索,在查找中将在检索工具中查得文件题录、文摘与检索课题要求一一进行比照,将符合检索要求文件题录、文摘统计下来。假如发觉检索出文件线索不符合检索课题要求,能够及时调整检索方案,或扩大或缩小检索范围,直到检出符合要求文件为止。,如:,021006993 私营企业人力资源人力资源开发觉实状况分析/刘银花(云南财贸学院);,鲁敏/经济问题探索.-,(8).-6265,144/172,(六)获取原文,利用检索工具检
48、出文件,只是文件题录或文摘,要深入了解文件详细内容,必须依据检出文件线索去索取原始文件。,(1)判断文件类型,(2)获取原文路径,145/172,获取期刊原文,1,.依据,文件出处,项到本单位图书馆或资料部门去获取(利用馆藏目录),2.依据,文件出处,项从国内其它图书信息机构,由近及远地获取(利用联合目录),3.给,著者,写信获取,4.从文摘、索引等,检索工具、出版机构,获取,5,.网上查询,,利用全文期刊数据库等获取,6.,经过互联网、搜索引擎获取,7.利用国际联机检索终端,向国外订购原文,146/172,数据库检索,147/172,汉字期刊论文数据库检索,全 文 型:,中国学术期刊全文数据
49、库,数字化期刊(万方),中国人大复印资料全文数据库,文 摘、题 录 型:,全国报刊索引数据库,汉字科技期刊数据库(维普),引 文 型:,汉字科技期刊引文数据库(维普),中国科技引文数据库(万方),148/172,中国(学术)期刊全文数据库检索方法和技巧,149/172,(一)概况 CNKI数字图书馆,CNKI,是中国知识基础设施工程(China National Knowledge Infrastructure)英文简称。,国家信息化重点工程,1999年由清华大学、清华同方发起创建。,150/172,中国期刊全文数据库(CJFD)是当前世界上最大连续动态更新中国期刊全文数据库。全文文件总量22
50、00多万篇。,文件起源:国内8200各种综合期刊与专业特色期刊全文。,收录学科:以学术、技术、政策指导、高等科普及教育类为主,同时收录部分基础教育、大众科普、大众文化和文艺作品类刊物,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域。,收录年限:1994年至今(大部分刊物回溯至创刊,最早回溯至19)。,151/172,CJFD专辑专题:,10大专辑,168个专题、近3600个子栏目。,1.理工A(数学物理力学天地生),2.理工B(化学化工冶金环境矿业),3.理工C(机电航空交通水利建筑能源),4.农业、,5.医药卫生、,6.文史哲、,7.政治军事与法律、,8.教育与社会科学






