资源描述
《信息资源规划》课程论文
———————————————————————————————— 作者:
———————————————————————————————— 日期:
13
个人收集整理 勿做商业用途
《信息资源规划》
课程论文
国内社会化媒体研究热点和研究趋势
-基于关键词的计量分析和社会网络分析
国内社会化媒体研究热点和研究趋势
—基于关键词的计量分析和社会网络分析
。
[内容摘要] 本文运用统计学、数据挖掘和社会网络分析相关理论,对中国知网以社会化媒体为主题的学术论文关键词进行了研究。采用频次统计、聚类分析及共词分析方法对提取出的样本数据进行了定量分析与定性分析,希望研究结果能够对社会化媒体的深入研究提供一些有益借鉴与启示。
[关 键 词] 社会化媒体、聚类分析、共词分析、多维尺度分析
[中图分类号] G203 [文献标识码] A
信息分析是以社会需求为基础,以先进的信息技术和方法为手段,以形成增值的知识产品并为决策科学化服务为主要目的的一种知识生产活动。信息分析的研究对象是信息, 它是科技信息研究机构中为不同层次的科技管理人员提供科技发展和战略服务的工作。信息分析研究工作的基本形式包括:决策研究,主要是为各级政府机构进行科技决策、发展战略研究及专题研等提供服务;咨询服务,大多是为企业提供市场信息咨询、技术信息咨询、决策信息咨询等[1]。从应用的领域来看,当前信息分析已越出了情报界的范围,广泛 地进入了咨询、商务、金融、电信等领域,扩展至国民经济的各行各业,从而实际上成为我国情报研究的主要称谓[2]。
Web of Science(简称WOS)是目前世界上较为大型的引文检索和引文分析数据库.WOS是SCI(Science Citations Index)及其系列数据库的统一检索平台,是谈森路透公司于2001年推出的ISI Web of Knowledge(WOK)网络数据库中的核心产品[3]。
本文以中国知网数据库中主题词为“社会化媒体”的文献为研究对象,抽取关键词进行一系列的定性分析和定量分析,探索社会化媒体的热点问题和发展趋势。
一、研究方法及工具
1.1研究方法
1、聚类方法。本文采用层次聚类中的层次聚类对关键词进行聚类分析,用于揭示信息分析领域的研究热点结构。层次聚类过程是:首先,总体中的n个个体各自自成一类;然后按照每种方法度量出个体间亲疏程度,并将其中最“亲密”的个体聚成一小类,形成n—1个类接下来再次度量剩余个体和小类间亲疏程度,并将当前最亲密的个体或小类再聚为一类;重复上述过程,直到所有个体聚到一起,形成一个最大的类或达到某个终止条件为止[4]。
2、共词分析法。“共词分析法"属于内容分析法的一种,它的原理是通过对能够表达某一学科领域主题或研究方向的专业术语共同出现在同一篇文献或论文中的现象的分析,判断学科领域中主题间的关系,进而展现该学科的研究结构.以这种“共现”次数反映这些词之间的关联程度,两个词的“共词强度”(指两个词同时出现于一篇论文中的次数)越高,则这两个词之间的关联越紧密.以此为基础对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,进而分析这些词所代表的学科和主题的结构变化。从20世纪70年代中后期的法国文献计量学家提出至今,共词分析法已日益完善并被广泛应用于各个领域[5].
3、多维尺度分析法。多维尺度分析,又称多维量表法,是多元分析技术的新分支,是主成分分析和因素分析的一个自然延伸,它是检验观察数据是否能反映研究者提出的结构关系的一种理想方法。这一方法将高维空间中点际之间距离压缩到低维空间,并以图形的形式直观呈现研究变量之间的相似性或差异性关系,达到简化数据、揭示数据潜在规律的目的[4]。
1。2 分析工具
1、SATI。SATI是浙江大学刘启元、叶鹰等利用C#编程技术,基于。NET平台开发的文献题录信息统计分析软件,它可导入处理EndNote格式、NoteExpress格式及NoteFirst格式的国内文献题录数据和HTML格式的WOS国际文献题录数据,进行数据格式的转换、字段信息的抽取、词条频次的统计[6]。
2、SPSS。 SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生Norman H。 Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研发成功。SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面都受到研究人员的高度评价。
3、Ucinet。Ucinet网络分析集成软件包括一维与二维数据分析的NetDraw,还有正在发展应用的三维展示分析软件Mage等,同时集成了Pajek用于大型网络分析的Free应用软件程序。该软件包有很强的矩阵分析功能,如矩阵代数和多元统计分析。它是目前最流行的,也是最容易上手、最适合新手的社会网络分析软件[7].
二、数据处理
2。1 关键词提取及清洗
本文所使用的数据来源于中国知网数据库中的文献,数据采集时间为2012年12月26日,主题设定为“社会化媒体”,时间段设定为“2013年1月1日—2012年12月27日”,文献类型为“Article",检索出1480条文献记录。
由于web of science每次能导出的文献最多为500条,因此需要分三次导出检索得到的1480篇文献,得到三个后缀名为.txt文本文档格式。但SATI只能识别和处理一个。txt文本文档,要想对所有的文献数据中的关键词进行共现分析,就需要对三个文档做进一步的合并处理。本实验中,作者采用在dos命令行窗口中输入“copy *。txt* z.txt”命令的方法生成合并文档的方法。
将合并后的文档导入SATI,选择文件格式为Text--(Web of Science),将文件转换为SATI专用的XML格式文件。在Option面板选择Keywords.为解决“一意多词"现象对统计结果的影响,勾选Tokenization&Stemming选项[5],进行字段抽取并统计词频.选取词频大于等于10的关键词进行分析,共有51个,列出如下表1所示。
表1 高频关键词统计
共有论文620篇,含有关键词的有599篇,不含关键词的21篇文献来源21世纪经济报道、第一财经日报等报刊。本文从样本数据中提取了关键词共4323个,相异的关键词共1999个,仅出现1次的关键词1509个,占相异关键词总数的75。45%,占关键词总数的34。91%。
21世纪经济报道:
社会化媒体:跨国营销新势力
从Facebook到解放广场
北京商报
康剑飞:让版画变成“社会化媒体”
新闻爱好者
19
社会化媒体时代的注意力赢取
科技日报
9
社会化媒体欲开启营销时代
第一财经日报
C02
使用社会化媒体给品牌做长期规划
第一财经日报
C07
“林氏旋风”——社会化媒体助推
中国工商报
B04
“蝴蝶效应”表现全新传播态势
光明日报
6
社会化媒体打造全新图书出版
中国经济导报
B06
发言人微博:主动回应关切才能隔断谣言传播
新华每日电讯
5
梦想成真,社会化媒体正在融入生活
北京商报
B02
康剑飞:让版画变成“社会化媒体”
人民政协报
C01
数字化休闲是与非?
21世纪经济报道
18
社会化媒体:跨国营销新势力
中国民航报
5
社会化媒体:危机公关的利器
21世纪经济报道
17
从Facebook到解放广场
第一财经日报
C01
社交网络VS社会化媒体
中华工商时报
7
三大新趋势加速互联网营销变局
人民政协报
B02
社会化媒体:社会管理新挑战
中国企业报
11
借力社会化媒体
上海金融报
B16
社会化媒体“遍地开花”
中国图书商报
X03
用社会化媒体预测未来?
国际商报
7
中国社会化媒体口碑营销高峰论坛召开
中国证券报
A07
社会化媒体掀起营销浪潮
高频关键词统计
对异形同义进行合并,如:社会化媒体营销(13)和社会媒体营销(1),互动(13)和互动性(10)、网民(9)和用户(34)等
序号
关键词
词频
序号
关键词
词频
1
社会化
277
23
粉丝
18
2
社会化媒体
123
24
品牌营销
17
3
消费者
78
25
品牌传播
17
4
媒体
78
26
营销
17
5
传统媒体
69
27
微博营销
17
6
媒体营销
63
28
网络媒体
16
7
互联网
57
29
营销活动
16
8
微博
47
30
信息传播
16
9
用户
43
31
意见领袖
16
10
新媒体
41
32
新浪
16
11
平台
34
33
时代
14
12
企业
33
34
社会化媒体营销
14
13
广告主
28
35
传播模式
13
14
博客
28
36
口碑营销
13
15
社交
27
37
搜索引擎
12
16
品牌
25
38
营销模式
12
17
受众
23
39
中国互联网
12
18
网络营销
23
40
营销策略
11
19
互动
23
41
电子商务
10
20
移动互联网
22
42
商业模式
10
21
网站
19
43
社区
10
22
网络
18
10
词共现矩阵(部分)
关键词
社会化
社会化媒体
消费者
媒体
传统媒体
媒体营销
互联网
微博
用户
新媒体
社会化
1.00
0.00
0.23
0.20
0。13
0。20
0.12
0.00
0.11
0.10
社会化媒体
0。00
1.00
0。00
0.00
0.00
0。00
0。00
0.08
0。00
0。00
消费者
0。23
0.00
1.00
0。05
0.02
0。11
0。04
0。00
0。01
0。01
媒体
0。20
0.00
0.05
1.00
0.00
0。00
0.02
0.00
0.02
0.00
传统媒体
0。13
0.00
0.02
0.00
1.00
0。03
0。03
0。00
0.01
0.07
媒体营销
0。20
0。00
0.11
0.00
0。03
1。00
0。05
0。00
0.03
0.00
互联网
0.12
0.00
0.04
0.02
0。03
0。05
1。00
0。00
0。02
0.03
微博
0.00
0.08
0。00
0.00
0。00
0.00
0.00
1。00
0。00
0.00
用户
0.11
0.00
0.01
0。02
0.01
0.03
0。02
0.00
1。00
0。01
新媒体
0。10
0.00
0.01
0。00
0。07
0。00
0.03
0.00
0。01
1.00
相异矩阵(部分)
社会化
社会化媒体
消费者
媒体
传统媒体
媒体营销
互联网
微博
用户
新媒体
社会化
0.00
1.00
0.77
0。80
0.87
0.80
0.88
1.00
0.89
0.90
社会化媒体
1。00
0。00
1.00
1。00
1.00
1。00
1.00
0。92
1。00
1.00
消费者
0.77
1.00
0。00
0。95
0.98
0。89
0.96
1。00
0。99
0。99
媒体
0。80
1.00
0.95
0。00
1.00
1.00
0.98
1。00
0。98
1。00
传统媒体
0.87
1.00
0。98
1.00
0。00
0.97
0。97
1.00
0.99
0.93
媒体营销
0。80
1。00
0。89
1.00
0.97
0.00
0。95
1。00
0。97
1.00
互联网
0.88
1.00
0.96
0。98
0.97
0.95
0.00
1.00
0。98
0.97
微博
1.00
0。92
1.00
1.00
1。00
1.00
1。00
0。00
1.00
1.00
用户
0。89
1.00
0.99
0。98
0.99
0。97
0.98
1。00
0.00
0.99
新媒体
0。90
1.00
0。99
1。00
0。93
1。00
0.97
1.00
0.99
0.00
多维尺度分析
点度中心度(Degree Centrality)
1.定义
指的是该点的度数,即与该点直接相连的点的个数.在无向图中是点的度数,在有向图中是点入度和点出度之和。
2。意义
分析节点直接影响力,即考察此人的直接社会关系。
序号
关键词
中心度
序号
关键词
中心度
1
社会化
2。248
23
粉丝
0。274
2
社会化媒体
0.137
24
品牌营销
0.225
3
消费者
1.095
25
品牌传播
0。143
4
媒体
0.636
26
营销
0。152
5
传统媒体
0.631
27
微博营销
0.042
6
媒体营销
0。930
28
网络媒体
0.228
7
互联网
0。625
29
营销活动
0.320
8
微博
0。131
30
信息传播
0。125
9
用户
0.611
31
意见领袖
0、162
10
新媒体
0。379
32
新浪
0。210
11
平台
0.503
33
时代
0。171
12
企业
0.467
34
社会化媒体营销
0.061
13
广告主
0。367
35
传播模式
0。121
14
博客
0.220
36
口碑营销
0。257
15
社交
0.446
37
搜索引擎
0.167
16
品牌
0.314
38
营销模式
0。256
17
受众
0。338
39
中国互联网
0.310
18
网络营销
0。234
40
营销策略
0.179
19
互动
0.301
41
电子商务
0。273
20
移动互联网
0.365
42
商业模式
0.172
21
网站
0。31
43
社区
0.292
22
网络
0。25
展开阅读全文