1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,现代计算机检索技术,1,教学安排,周,授课内容上机内容,自学,1,信息信息检索基本原理及信息检索技术概述(第章),文献信息概论(第,1,章),2,事实与数据检索原理(第章),特种文献检索原理(专利文献,博硕士学位论文,会议,标准文献,科技报告),普通文献检索原理(第章),3,国内网络数据库的主要类型、搜索引擎的信息检索、中文维普咨讯数据库、万方数据资源系统、国研网等专业信息的检索策略及检索演示。,课题研究:,确定研究问题的主题,4,利用中文数据库,中国期刊网、国研网、维普数据库、万方数据库等检索本专业的有
2、关文献信息。,实验报告:中国期刊全文数据库,5,利用国外著名的检索工具,WEB OF SCIENCE SCI,、,EI,、,EBCSO,数据库、,DIALOG,国际联机检索系统等检索工具检索本专业的有关文献信息。,课题研究:,查询中文的文献,总结国内的发展状况,2,教学安排,周,授课内容上机内容,自学,6,EBSCO,、,ELSEVIER SCIENCE,全文电子期刊、,IEEE,数据库、,KLUWER,电子期刊的检索方法及检索策略的实习。,实验报告:全文数据库,7,网络信息利用原理(网上信息资源,网络信息检索工具,网上学术资源及其查找方法 学术网站资源的评价方法)(第五章),课题研究:,查询
3、英文的文献,总结国外的发展状况,8,综合性,WEB,检索工具的基本使用方法、检索语言,了解网络信息咨询的特点、咨询主体及相关性的服务,网站信息检索和评价实习,实验报告:网站信息检索和评价,9,本专业学术论文的设计与撰写的特点、资料的收集与整理的方法、课题资料的检索步骤与检索策略,并进行检索策略的评价。(第六章),课题研究:,查询网上的文献,总结目前的问题的难点和热点,10,课题研究整理成文,3,评价方式,出勤,.10%,自学,.8%,检索报告,.32%,,每份报告,8,分,课题研究,.50%,4,课题研究,每周根据课堂布置的要求,按进度完成工作,.,实验课下课前上交检索报告电子版,下周上课前上
4、交课题研究电子版,课题研究和检索报告的文件名格式必须为,:,学号姓名,-,周次,-,实验报告,学号姓名,-,课题名称,5,联系方式,陈娟,文商楼,516,69980028*55161,chenjuan82,6,问题,1,信息这个词从何时出现,?,7,信息的词源由来,观点,1:,唐代诗人李中,(,937-975,),暮云集,暮春怀故人,中的诗句:“梦断美人沉,信息,,目穿长路倚楼台,。,”,观点,2:,三国志,(,陈寿(,233-297,),西晋,),:“诸葛恪围合肥新城,城中遣士刘整出围传消息。王子俭期曰:,“,正数欲来,信息,甚大。,”,二程外书,程颐和程颖,(,南宋,),叔,8,问题,2,
5、信息是什么,?,9,信息的含义,控制论的创始人维纳的定义,信息是人和外界相互作用的过程中互相交换的内容的名称,信息论的奠基人申农的定义:,信息是“用来消除不确定性的东西”,10,信息是按照一定的方式排列起来的,信号序列,所揭示的内容。,所谓,“,信号,”,,就是能够引起其他事物感知的各种客观存在的,“,刺激,”,。当这些,“,刺激,”,按照可以揭示某种内容所特有的方式排成,序列,时就成为信息。,信息的含义,判断,1,:,A,1,和,A,2,是不完全相同的,判断,2,:,A,1,和,A,2,是完全不相同的,11,有 趣 的 回 文 现 象,回文对联:,客上天然居,居然天上客,回文句:,江苏宜兴,
6、丁蜀镇,环刻在,紫砂茶壶上,也,心,可,清,以,12,DNA,的,三维空间序列,DNA,脱氧核糖核酸结构图,基因是,负责一项遗传任务的,一段,DNA,分子,就是,由于不同的空间序列,导致世界上,成千上万的不同物种,脱氧核苷酸长链,脱氧核苷酸长链,碱基,A,碱基,C,碱基,T,碱基,G,13,问题,3,信息、知识、情报与文献有什么区别,?,14,信息,知识,信息、知识、情报与文献的比较,信息,是按照一定的方式排列起来的信号序列所揭示的内容,英文:,Information,知识,是人类已经认识的、具有一定的系统性的信息,情报,文献,文献,是由载体承载着的知识,情报,是对于用户有用、经过传递到达用户
7、的知识,英文词:,Intelligence,15,问题,4,信息有什么用,?,16,17,日本人巧妙搜集信息,第二次世界大战后,日本经济高速发展,一个重要原因就是重视信息的,采集、开发、利用,。,日本的信息传递、查询非常迅速,。,5,10,分钟搜集到世界各地金融市场的行情;,3,5,分钟查询并调用日本国内,1,万多重点公司、企业经营数据;,5,分钟模拟出国际国内经济因素变化可能给宏观经济带来的变动图和曲线;,5,10,分钟可查询或调用政府的法律、法令和国会记录。这种现代化的信息处理技术,大大提高了行政效率,。,18,日本人巧妙搜集信息,日本人善于从平淡的信息报道中分离出重要的信息内容,。,例如
8、日本人在二十世纪六十年代,根据中国的媒体公开报道,分析判断出大庆油田开发的重要信息,从而与中国谈成了产品设计买卖。,日本人对大庆油田早有耳闻,但始终得不到准确信息。,1964,年,4,月,人民日报,写到,“,大庆精神大庆人,”,,于是判断,“,中国确有大庆油田,”,。,1966,年,7,月,中国画报,封面有一张照片,铁人王进喜身穿大棉袄、头顶鹅毛大雪,猜测到,“,大庆油田在冬季零下,30,度的东北地区,”,。,19,日本人巧妙搜集信息,1966,年,10,月,日本人又从,人民中国,找到了王进喜的先进事迹,从事迹介绍分析得知,“,最早钻井地点是在北安东北部的马家窑,”,。日本人又从伪满州地图上
9、查到,“,马家窑是黑龙江省海伦县东面的一个小村,”,。这就找到了大庆油田的准确地理位置。,1966,年,7,月,从,中国画报,上的一张大庆炼油厂反映塔的照片上,日本人根据反映塔上的扶手栏杆和反映塔的直径,推算出大庆炼油厂的规模,其年产量为,1 000 000 KL,。根据这个油田的出油能力和炼油厂规模,日本人得出结论:中国将在最近几年出现炼油设备不足,买日本的轻油裂解设备是完全可能的。于是就按他们估计的大庆油田要求进行产品设计。最后等待中国人去购买。,20,日本人巧妙搜集信息,思考问题,:,(,1,)日本人采集信息对我们有什么启示?,(,2,)信息采集与信息利用是否有关联?,21,第二章 信息
10、检索原理,信息检索与信息检索系统,文献信息数据库文档,记录,字段的概念,信息检索的五个步骤,课题分类号和主题词的确定方法,逻辑,词组,位置,截词和优先算符的概念,22,信息检索,信息检索全称是检索存储与检索,是将无序的信息按照一定的标准和规范有序化形成信息集合,并根据需要从文献集合中查找出特定信息的过程。,我们通常所说的信息检索,是指采用一定的方法和策略从信息集合(可以是数据库、某个搜索引擎中)查找所需信息的过程。,23,信息源,检索提问,主题概念,主题概念,检索词表(分类法、主题法),信息标识,信息集合,检索表识,所需信息,组织,检索,输出,标引词,检索词,学科、关键词,学科、关键词,内容分
11、析,内容分析,信息检索,信息存储,24,25,信息检索系统,文献检索,目录检索,-,“本”,或”件,”,书(刊)名,卷(期)数,作者,出版年月,出版地,收藏情况等,题录检索,-,“篇”,篇名,作者,来源出处,文摘,检索,-,全文检索,-,数据检索,事实检索,26,文献信息检索,索引,27,信息检索数据库,(P.22),文档,顺排,倒排,28,信息检索数据库,记录,对某一实体,的全部,属性进行,描述的结果,29,信息检索数据库,(P.22),字段,对实体具体属性的描述结果,题名(,TI,),作者,(AU),文摘,(AB),作者单位,(AF),期刊名称,(ST),语种,(LA),关键词,(KW),
12、30,文献检索一般步骤,分析研究课题,明确检索要求,需要分析出课题的研究范围,课题性质及将要达到的目的。确定检索词,明确需要的文献类型。,选择检索工具或检索系统,选择检索工具的原则,:,目的原则,;,信息需求的内容,专业范围原则,;,数据库记录的文献来源原则。,确定检索途径,分类途径,主题途径,著者途径,序号途径,记录和阅读文献线索,索取原始文献,31,如何找到课题的主题概念,?,股票预测,32,课题分析要点,课题属于哪个学科,?,课题性质是什么,?,探索型,调查型,应用性,课题的背景是什么,?,33,股票预测,34,股票预测,35,概念的切分方法,词语是信息表达的最小单位,在检索时,必须对汉
13、语表示的课题进行词语切分,才能查出更多的文献。,36,汉语词语切分方法,词语切分方法:,去掉课题中的虚词和泛指的词语,然后按照概念单元分成不能再拆分的词语,股票价格预测方法研究,神经网络在股票价格预测中的研究,基于变维分形的股票指数预测模型,37,检索概念切分比较,概念切分不彻底的检索策略,修改后的正确策略,古代小说,OR,古代诗歌,古代,AND (,小说,OR,诗歌,),历史,AND(,中国古代历史,OR,世界古代历史,),历史,AND,古代,AND(,中国,OR,世界,),企业档案,AND,企业人事档案,档案,AND,(人事,OR,企业),38,概念扩展方法,同一概念的检索词扩展,同一事物
14、的学名或俗名,儿歌 童谣,同一事物的简称,全程,音译,意译,上海 沪,同一事物的反义词,安全 风险,39,概念扩展方法,基于内容分析上扩展,上位概念扩展;下位概念扩展,40,概念扩展方法,隐含概念扩展,普通家庭收入预测方法研究,各种可能的方法名称,:,指数方法,统计方法,基于检索结果的概念扩展,股票预测,模糊神经网络,小波,BP,神经网络,EMD,方法,波浪理论对中国股票市场的解读及预测,基于伊藤过程对股票价格的模拟和预测,41,检索语言,分类语言,主题语言,42,分类语言,A,马、列、毛、邓,B,哲学、宗教,C,社会科学总论,D,政治、法律,E,军事,F,经济,G,文化,科学,教育,体育,H
15、语言、文字,I,文学,J,艺术,K,历史、地理,N,自然科学总论,O,数理科学和化学,P,天文学、地球科学,Q,生物科学,R,医药、卫生,S,农业科学,T,工业技术,U,交通运输,V,航空、航天,X,环境科学、安全科学,Z,综合性图书,中图法,结构,基本大类,43,主题词,按照是否经过人工规范化可以分为,叙词语言,关键词语言,44,叙词语言,经过人工规范化的语言,常以规范词表的形式出现。,等同关系、属分关系和相关关系,例如:经济规律,D,经济法则,特殊经济规律 等同关系,一般经济规律,F,货币流通规律,价值规律 属分关系,基本经济规律,C,生产力与生产关系 相关关系,45,关键词语言,是没有
16、经过规范化的,直接选自文献的题目或者文章中的自然语言。例如:,脚踏车,单车,46,检索算符,布尔逻辑组算符,截词,词位限制,检域限制,47,逻辑或(,OR,)运算符,Enterprise OR Company,逻辑与(,AND,)运算符,Chinese and culture,逻辑非(,NOT,)运算符,Culture NOT Chinese,布尔逻辑算符,48,优先算符,逻辑算符如果混合使用,其运算顺序通常为,NOT,AND,OR.,当需要改变这种运算顺序时,必须使用优先算符,(),例如有计算机,电脑,文献,信息四个检索词:,S1,计算机,OR,电脑,S2,文献,OR,信息,S3 S1 AN
17、D S2,(计算机,OR,电脑),AND(,文献,OR,信息),布尔逻辑算符,49,按截断的位置来分有,后截断,前截断,中截断,History,Histories,Historical,History-related,Histor?,截词符,50,edit?,edit edition editor editorial editing editorialist editorialize editress editorship editorially,截词符,51,后截断检索技术主要使用在下列,4,个方面:,词的单复数,如:,book?New?,等,.,年代,如:,199,?(表示,90,年代),
18、19?(20,世纪,).,作者,如用,Roboter?,可检出所有姓,Roboter,的作者,.,同根词,如用,business?,含有下列词的文献即为命中,businesslike businessman businessmen businesswom,。,截词符,52,又称,邻接算符,,使用于两个检索词以制定间隔距离或者制定的顺序出现的场合。,常用的位置符有“,W”,和“,N”,算符,以及它们的变体(,Wn,)和,(Nn),Chinese W1 culture,Chinese N2 culture,位置算符,53,提高检索结果的查准率的场合。,字段限制,54,本周自学内容,第一章 文献信息概论,文献的类型划分,加工深度,载体,内容和出版方式,(,了解各类文献区别,),纸质,图书,期刊,报纸,会议,报告,专利,标准文献,学位论文,档案,电子文献,电子图书,电子期刊,动态信息,文献的分布,查找资料基本方法,核心期刊,核心网站,-,布拉福文献分散定律,影响因子,如何确定核心期刊,55,课堂练习,根据自己的专业寻找国内外核心期刊各两种,并比较它们的影响因子,举出纸质和电子文献三种类型的实例,考虑自己准备研究的问题,56,






