1、完整版)3采集与筛选商城网站信息(一) 《网站内容编辑》教案 教学课题 (章、节或主题) 采集与筛选商城网站信息(一){板书} 计划课时 2 周次 2 教学方法 讲授 教具 多媒体 教学目的 理解信息采集的网络手段与方法 重点难点 信息采集的网络手段与方法。 教学过程 复习提问 1.网络信息管理法律法规就其内容来说具体包括哪些方面? 引入新课 小张成功应聘了一家电子商务网站公司,在网站运营部任实习编辑工作,协助其他编辑完成相关工作,他接受的第一个任务就是收集网站更新的资讯及补充商品信息。 完成本任务,需要掌握扫雪引擎使用方法,能够高效、准确搜索有
2、效信息,能够通过行业网站进行信息的收集,关注行业最新动态,了解电子商务。 讲授新课 步骤一:通过网络渠道采集信息{板书} (一) 网络信息采集的相关知识{板书} 1. 了解网络信息资源。网络信息资源是一种数字资源,与非网络信息资源相比有其独特的特点,了解网络信息资源的分类有助于人们对其搜索、开发和利用。网络信息资源的分类有: (1) 按信息形式划分:文字、图像、声音、视频、动画、图表等. (2) 按信息内容的属性划分:新闻信息、学术信息、娱乐信息、教育信息、科技信息商务信息、体育信息、财经信息、法律信息等。 (3) 按人类信息交流方式划分:非正式出版信息、正式出版信息、半正式出版
3、信息。 (4) 按信息加工层次划分:网络资源指南搜索引擎、联机馆藏目录、网络数据库、电子期刊、电子图书、电子报纸、参考工具书和其他动态信息等。 (5) 按信息发布机构划分:企业站点信息资源、学校及科三名院所站点信息资源、信息服务机构站点信息资源、行业机构站点信息资源以及政府站点信息资源等。 2.网络信息资源的特点 (1)数量庞大、增长迅速。 (2)内容丰富、覆盖面广。 (3)信息质量参差不齐、有序与无序并存。 (4)信息共享程度高、使用成本低。 3.认知网络信息采集 (1)网络信息采集.网络信息采集是指利用计算机软件技术,针对定制的目标数据源,定时进行信息采集、抽取、挖掘、处
4、理,将非结构化的信息从大量的网而中抽取出来保存到结构化的数据库中,从而为各种信息服务系统提供数据输入的整个过程。 (2)信息打住的原则。信息的完整性、信息的时效性、信息的价值性和信息的易用性原则。 (二)网络信息采集的方法{板书} 1。通过搜索引擎采集.搜索引擎是一个系统,能从大量信息中找到所需的信息,提供给用户.搜索引擎的出现,逐渐改变着我们 的生活习惯和思维方式. 2.通过网站采集。根据需要的信息类别,直接到相关网站进行采集。如新闻信息网站可以访问人民网、新华网、中国日报网等;财经信息网站可以访问国家商务部网站、国家财政部网站、人民银行网站等;教育信息网站可以访问各个大学网站、中国
5、教育和科研计算机网、教育部网站等;信息网站可以访问国家科技部网站、各门户网站科技报道频道中国公众科技网等;网络文学网站可以访问榕树下、红袖添香、潇湘书院等。 3.通过论坛采集。网络编辑可以到各种论坛中找内容、发现信息源。论坛中的信息质量参差不齐,很多原创内容被埋没在了大量的无关内容中。综合论坛如天涯社区、猫扑、新浪论坛、搜狐论坛等。 4.通过邮件列表采集。邮件列表是指建立在互联网上的电子邮件地址的集合。利用这一邮件地址的集合,邮件列表的使用者可以方便地利用邮件列表软件将有关信息发送到所有提供分类或关键词邮件新闻订阅等服务。 5.通过网络数据库采集.网络数据库具有信息量大、更新快、品种齐全
6、内容丰富,数据标引深度高、检索功能完善等特点,也是获取信息尤其是文献信息的一个有效途径。网络数据库有收费数据库和免费数据库之分。收费数据库一般是需要购买使用权;免费数据库主要是专利、标准、政府出版物,一般是政府、学会、非盈利性组织创建并维护的数据库。 (三)通过搜索引擎获取信息{板书} 1.关键词搜索{板书} 关键词是指表示文献实质意义的名词或词组,常出现在文献篇名或文献正文中.是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇.关键词选得是否恰当,关系到该文被检索和该成果的利用率。、、 为了更好的利用关键词搜索我们所需要的信息,我们可以灵活利用运算符号把几个关键词连起来,以
7、便搜索同时满足这几个条件的信息,具体操作如下: (1)+:用加号把两从此关键连成一对时,只有同时满足这两个关键词的匹配才有效,而只满足其中一项的将被排除。比如我们键入“电脑+计算",则在查询“电脑”的结果中将不包含“计算”的结果排除. (2)-:如果两个关键词之间用减号连接,那么其为包含第一个关键词,但结果中不含有第二个关键词。例如,我们键入“电脑—计算”,则在查询“电脑"的结果中将包含“计算"的结果排除.(注意电脑后有空格) (3)():当两个关键词用另外一种操作符号连在一起,而又想把它们列为一组就可以对这两个词加上圆括号。我们可以键入“(电脑—计算)+(程序设计)”来搜索包含“电脑”
8、不包含“计算"但同时包含“程序设计”的网站。 (4)*:可代替所有的数字及字母,用来检索那些变形的拼写词或不能确定的一个关键词。比如键入:“电*"后查询结果可以包含电脑、电影、电视等内容. (5)“”:用引号起来的词表示要精确匹配,不包括演变形式。比如我们键入带引号的“电脑报”,刚“电脑商情报”等信息就不会在结果中出现. (6)使用元词检索:大多数搜索引擎都支持“元词"(metawords)功能,依据这类功能用户把元词放在关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。 例如,你在搜索引擎中输入“title:清华大学”就可以查到网页标题中带有清华大学的网页.在
9、键入的关键词后加上“domainrg",就可以查到所有以org为后缀的网站。其他元词还包括:image:用于检索图片,link:用物检索链接到某个选定网站的页面,URL:用于检索地址中带有某个关键词的网页。 常用高级搜索指令:intitle: ur: site: filetype:(后面要加空格) 没查到关于:image和domainrg指令. 2. 使用常用搜索引擎-百度{板书} 百度搜索引擎于1999年年底由李彦宏和徐勇创建.百度是目前国内最大的商业化全文搜索引擎。百度搜索引擎由四部分组成:蜘蛛程序、监控程序、索引数据库、检索程序. 百度
10、搜索引擎使用了高性能的“网络蜘蛛”程序而自动在互联网中搜索信息,可定制、高扩展性的高度算法使得搜索器能在的极短的时间内收集到最大数量的互联信息。百度搜索拥有庞大的中文信息库,总量达到 6000万以上,并且还在以每天几十万页的速度快速增长。 我们以搜索“智能手机"为例,介绍百度的常用功能。 (1)百度快照。每个未被禁止的网页,在百度上都会自动生成一个临时缓存页面称为“百度快照”。 当我们无法打开某个搜索结果,或遇到网站服务器暂时故障或网络传输堵塞时,可以通过“百度快照”快速浏览页面文本内容。百度快照只会临时将网页的文本内容进行缓存,而那些图片、音乐等非文本信息,仍然存储于原网页。当原网页进
11、行了修改、删除或者屏蔽后,百度会根据技术安排自动修改、删除或者屏蔽相应的网页快照。 (2)相关搜索。当不满意搜索结果时,可能是因为选择的关键词不是很妥当。这时可以通过参考别人是怎么搜的,来获得一些启发.百度的“相关搜索”,就是提示和用户的搜索很相似的一系列查询词.相关搜索排布在搜索结果页的下方,按搜索热门度排序 (3)拼音提示。如果只知道某个词的发音,却不知道怎么写,或者嫌某个词拼写输人太麻烦,这时就可以用百度的拼音提示功能。只要输人查询词的汉语拼音,百度就能把最符合要求的对应汉字提示出来。它事实上是一个无比强大的拼音输人法.拼音提示显示在搜索结果上方。 (4)错别字提示。由于汉字输人法
12、的局限性,在搜索时经常会输人一些错别字,导致搜索结果不佳.这时百度会给出错别字纠正提示.错别字提示显示在搜索结果上方。 (5)英汉互译词典。百度网页搜索内嵌英汉互译词典功能.如果想查询英文单词或词组的解释,可以在搜索框中输人:“英文单词或词组”+“是什么意思,搜索结果第一条就是英汉词典的解释。如果想查询某个汉字或词语的英文翻译,可以在搜索框中输人:“汉字或词语”+“的英语单词”,搜索结果第一条就是汉英词典的解释。如:智能手机的英语单词。屏幕上就会显示多个选项。 (6)货币换算.要使用百度的内置货币换算器,只需在百度网页搜索框中键人需要完成的货币转换,单击“回车”键或点击“百度一下”按钮即
13、可。 百度无法保证计算所使用汇率的准确性.汇率的变化会对交易产生影响,因此在进行任何交易之前,请确认汇率是否准确. (7) 专业文档搜索(百度文库).很多有价值的资料,在互联网上并非是普通的网页,而是以Word ,PowerPoint, PDF等格式存在。百度支持对Offiee文档(包括Word , Excel , Powerpoint ) ,Adobe PDF文档、RTF文档进行全文搜索。因此,要搜索专业文档,可以在普通的查询词后面,加一个“filetype:”文档类型限定。“filetype:”后可以跟以下文件格:DOC, XLS, PPT, PDF, RTF, ALL。其中,A
14、LL表示搜索所有这些文件类型. 百度还有股票、列车时刻表;飞机航班查询;精确匹配(双引号和书名号);高级搜臻和个性设置等。常用搜索引擎还有谷歌、搜狐、必应、有道等。 (四)通过专业行业网站获取信息{板书} 随着计算机技术、网络技术的迅猛发展,使得以网站为依托的信息传播、管理储存、检索对社会各行业的渗透广度和深度发生了巨大变化.网站专业化发展的趋势表现尤为突出。由于不同网站对不同行业的影响或是其关联度不同、相继出现了门户网站、专业网站、专业垂直网站等。其中,垂直行业门户网站对该 行业的广度、深度、精细度、准确度更高,时效更好。我们以垂直行业门户网站为例,讲解通过行业专业网站获取信息的方法.
15、 1. 垂直行业门户网站及分类{板书} (1) 垂直行业门户网站是什么?垂直行业门户网站是指面向特定行业领域,为企业以及商务人士提供信息交流。资源互享、提供实物和服务交易的第三方电子商务平台。 “垂直行业门户"是相对传统门户网站内容广泛而全面,覆盖各行各业而言的,“垂直门户"则专注于某一领域(或地域)如IT、娱乐、体育,力求成为关心某一领域(或地域)内容的人上网的第一站。 垂直网站的特色就是专一。他们并不追求在而全,只做自己熟悉领域的事。他们是各自行业的权威、专家,其吸引顾客的手段就是将网站做得更专业、更权威、更精彩。而垂直网站的顾客也不是普通的顾客。他们基本上都 是该 行业的消费者。
16、每一顾客代表的购买力,比综合网站顾客的平均水平要高出许多倍。因此,垂直网站便为顾客提供一条龙式的服务模式-——以自己内容指引顾客消费自己的商品。垂直门户网站的电子商务有专家指引,购物方便 又明智,吸引了越来越多的消费者. (2) 垂直行业门户网站的分类.企业性质行业门户网站:利用企业在该 行业的领先地位而建立,以行业信息资源整合、扩大企业形象宣传为目的。如中国联通.运营性质行业门户网站:利用自身技术优势、运营优势等建立的,以信息资源整合、为行业供需双方提供服务从而达到赢利目的。如365网络是一家电子商务服务公司,该公司自主研发的Emarket软件,是为垂直行业类门户网站量身订做的大型软件系统
17、 行政性质行业门户网站:利用行业号召力和社会公信力,以行业资源整合推广、服务行业企业和用户、提高辖区行业知名度、进行招商引资等为目的。 2. 通过垂直行业门户网站获得信息{板书} 例1:慧聪网成立于1992年,是国内领先的B2B电子商务服务提供商.依托其核心互联网产品买卖通以及雄厚的传统营销渠道—慧聪商情广告与中国资讯大全、研究院行业分析报告为客户提供线上、线下的全方位服务,这种优势互补,纵横立体的架构,已成为中国B2B行业的典范,对电子商务的发展具有革命性影响。 通过慧聪网获取商品、交易等方面的专业信息,在检索信息的同时也可以发布信息,用户可以根据自己的需要和屏幕上的提示进行。我
18、们可以在慧聪网上搜索智能手机的相关内容。 例2:通过百企网可获得以下信息: (1)展会信息。为广大中小企业提供最新展会信息、组织企业参加展会,提高企业知名度; (2)网上仃单。为广大中小企业提供网上交易平台,促进企业电子商务发展; (3)网上融资。为广大中小企业收集网上仃单数据,为中小企业选择合适的金融产品; (4)设备采购.为广大中小企业提供进口大型印刷、纺织等设备融资咨询服务; (5)网上物流。为广大中小企业收集网上物流数据,提供给银行作为企业信货评分项之一; (6)水电数据.为广大中小企业收集水、电单数据,提供给银行作为企业信货评分项之一 除此以外还有很多垂直行业网站,可以根据自己的需要选择。 课后小结 本节主要介绍了通过网络渠道采集信息,重点是利用搜索引擎的采集信息,特别 是元词的搜索。 作业 Title url site filetype高级搜索指令的使用方法,举例说明。{板书} 课后反思 第9页






