收藏 分销(赏)

基于灰色预测GM(1,1)模型的情报学热点关键词与主题发展预测.pdf

上传人:自信****多点 文档编号:583246 上传时间:2024-01-02 格式:PDF 页数:6 大小:3.79MB
下载 相关 举报
基于灰色预测GM(1,1)模型的情报学热点关键词与主题发展预测.pdf_第1页
第1页 / 共6页
基于灰色预测GM(1,1)模型的情报学热点关键词与主题发展预测.pdf_第2页
第2页 / 共6页
基于灰色预测GM(1,1)模型的情报学热点关键词与主题发展预测.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、经营与管理基于灰色预测GM(1,1)模型的情报学热点关键词与主题发展预测李德昌,董坚峰峰通信作者,苏佳旺,黄紫涵吉首大学旅游学院,湖南张家界42 7 0 0 0摘要要对近6 年情报学领域CSSCI期刊研究论文进行题录筛选与关键词统计、研究主题分类及赋权评分,建立灰色预测GM(1,1)模型,对比较具有代表性的8 类关键词数据进行预测,结合时代发展趋势对其代表的研究主题进行分析,模型预测较为合理准确。研究发现,各研究主题发展趋势紧随时代变化,新技术、新话题更多地结合了领域内研究与应用,不同主题间呈现多元融合与拓展创新态势。关键词同情报学;灰色预测;文献分析;研究热点doi:10.3969/j.is

2、sn.1006-8554.2023.08.0330引言预测作为学术研究中的一种常用手段,可对未来事物的发展情况及发展水平进行科学的预测,进而给当前的研究和工作提供参考,并指导未来的工作规划。学术期刊,尤其是核心权威期刊中刊载的研究论文,往往能够代表相关学科的研究历史和现状,对其内容进行挖掘研究分析,有利于把握该学科领域的研究全景。本文对近6 年来情报学学科的发文情况进行统计分类分析,建立了灰色预测GM(1,1)模型,结合时代特点,对未来的情报学研究热点进行适当预测。1楼数据来源及关键词分析1.1数据来源本研究选取了中文社会科学索引(CSSCI2021一2022)中情报学领域的1 1 种主要期刊

3、,分别为情报科学情报理论与实践情报学报情报杂志情报资料工作数据分析与知识发现图书情报工作图书情报知识图书与情报现代情报信息资源管理学报。文献来源为中国知网,剔除刊物编辑部讯、学术会议通知等非研究论文,最后统计得到研究论文1 38 2 7 篇。1.2关键词统计与排序对所收集文献题录使用SATI3.2软件进行数据基金项目:湖南省教育厅科学研究重点项目(2 2 A0361);湖南省研究生科研创新项目(CX20221096)处理并统计关键词,得出各类关键词出现的频次。根据信息生命周期理论和新信息优先原理,信息具有时效性,其价值随时间推移而不断衰减,因此不同时间发表的论文也有着不同的影响力。通常来看,论

4、文发表时间距离当前时间越近,则其影响力越大。因此,在分析不同年份发表的论文的关键词时,应对其的赋权有所不同,发表年份越靠近,则其所赋的权值越大。研究假设1 个关键词在2 0 1 7 2 0 2 2 年的权值为V,i=1,2,3,4,5,6,前1 年的权值为当前年份权值的1/2,也即:,i=1,2,3,4,5,62设关键词在2 0 1 7 一2 0 2 2 年每年出现的次数为X=(x 1,x 2,x 3,x 4,x,x 1,设总体评分为S,且6S=ZXV,令V。=1依上述运算式可得出各关键词的总体评分,排序后如表1 所示。1.3关键词分类与主题分析图书馆类包括了高校图书馆、图书馆、公共图书馆、智

5、慧图书馆、数字图书馆、移动图书馆、图书馆学、阅读推广等与图书馆相关的关键词。该类占比连续多年位于首位的主要原因有2 点:一是图书馆学与情报学的许多研究存在相关之处,两者关系紧密,图书馆学自然占比较高;二是选择的部分期刊(如图书情报工作图书与情报等)在刊载情报学相关研究论文的同时也会刊载图书馆学相关研究论文。137经营与管理关键词图书馆类网络典情类热点话题类新技术类信息行为类知识图谱扎根理论情报学信息服务类美国数字人文突发事件社会网络分析情感分析文献计量科学数据突发公共卫生事件竞争情报可视化研究热点评价指标网络舆情类主要包括了网络舆情、社交媒体、社交网络、微博等与其相关度较高的关键词。当前的网络

6、舆情类研究也主要着眼于这些主题,如移动社交网络舆情传播演化 、微博评论观点演化趋势2 、各类网络舆情的传播主题图谱3 等。我国网络奥情相关研究从2 0 0 7 2 0 1 0 年为上升期,2 0 1 1 2 0 1 6 年为繁荣发展期,2 0 1 7 年后研究热度有所下降,为调整期,关键词的分布频次符合相关研究发现4热点话题类包括了大数据、人工智能、区块链等关键词。近年来大数据时代、人工智能时代、区块链时代相关的研究呈现新陈代谢的趋势,如大数据相关研究始于2 0 1 2 年,从2 0 1 3年开始爆发性增长,于2017年达到顶峰,之后进人调整期5 ,其在情报学的研究主要着眼于大数据时代下学科发

7、展面临的机遇与挑战6 、大数据的应用7 等;人工智能相关的研究138TECHNOLOGYANDMARKETVol.30,No.8,2023表1 220172023年关键词统计与最终评分2017年2018年3072531531381371149084667540342025433551353329822341939362628342217101127232529272123162019年185119131109753530333630222820282224220172416也与大数据类似,着眼于人工智能时代下情报学的发展创新研究8 ,不同点则在于其出现时间点略近,因而其相对于大数据为上升趋势;

8、区块链相关的研究虽然不多,但近3年来上升趋势非常明显。新技术类包括了深度学习、机器学习、数据挖掘、文本挖掘、LDA模型等关键词,这些技术通常出现于应用研究中,如信息情报价值计算9 、文献计量分析1 0 、研究主题的挖掘 等等。这类关键词呈逐年上升趋势,说明情报学的研究与时俱进,与信息技术、网络技术联系紧密信息行为类包括了用户行为、信息行为等关键词,其内容包括但不限于信息需求、搜寻、获取、共享、采纳等内容1 2】,其目的是使信息能更好地为人类服务。知识图谱、可视化等方面的研究则将数据、信息、知识转化为图形,例如使用CiteSpace、V O Sv i e w e r 等2020年17112314

9、412483383934353120281836222437111615122021年1511151121356542454025303639312911303017139152022年1071107510571445028252547262825171632158611最终评分640.5434.0394.0376.0253.0138.5129.5120.5116.0101.5101.0100.0100.098.572.568.567.564.058.054.052.0技术与市场2023年第30 卷第8 期软件了解相关领域的研究动态、热点、发展趋势等1 3,这可以为学科研究提供切实且有价值的参

10、考。扎根理论作为一种质性研究方法,在人文社科领域有着广泛的使用,其在情报学领域中的主流应用情境为图书馆研究,其研究问题大多涉及影响因素等机制问题,同时该方法也常与在线群体、科研人员、信息行为等关键词一同出现,这反映了其在研究问题和对象上呈现多元化的态势1 4情报学、竞争情报、信息服务这3个关键词出现的频次总数相较于2 0 1 0 2 0 1 4年有所下降1 5 ,其中情报学基本处于持平状态,竞争情报则大幅下降,信息服务类则是缓慢下降状态,这在一定程度上反映了我国情报学研究存在的不足,即淡化了“打仗”理念、角色定位以及战略决策和战术决策的目标导向1 6 。在不断引进新技术、新方法、新名词的同时,

11、也不应忽视更不应遗忘最具有生命力的竞争情报数字人文最早出现在图书情报领域是在2 0 0 6年,在2 0 1 42 0 2 2 年出现了大幅增长,其与图书馆结合紧密,衍生了不少相关研究,同时也常与关键词“美国”一同出现,说明近年来我国对美国在数字人文方面的研究进行了越来越多的深人了解1 7 。“文献计量”指采用数学、统计学等方法,研究已有文献的分布结构、数量关系、变化规律等,探讨某一领域科学研究的结构、特征和规律1 8 。其与科学数据、评价指标、专利分析、altmetrics、学术评价等关键词高度相关。学术评价、科学评价、学术影响力、影响因子等关键词相关的研究出现较早且具有较强的生命力,H指数、

12、评价体系、学科评价、社会影响力、综合评价则是较年轻的关键词,是新近出现的研究热点1 9 。情感分析常应用于网络评论、网络奥情2 0 、社交媒体2 1 等相关研究中,同时应用了机器学习等不同的方法2 2 ,应用面较为广泛。突发事件主要分为3个方面的研究:突发事件网络舆情、图书馆或其他主体在突发事件中的应急管理、突发事件的应急情报研究。2 0 1 7 年以来,突发事件网络舆情相关论文发表量稳中有降,逐渐进入平稳期2 3,同时该领域的高频词也包括了突发公共事件、舆情监测、预警机制、指标体系等,这说明该主题研究经营与管理广度较大,各研究方向有不少交叉融合。2基于GM(1,1)模型的主题发展预测灰色预测

13、模型以小样本、贫信息的不确定性系统为研究对象,这正适合于本研究中关键词出现频次及影响力的“部分信息已知,部分信息未知”的特性。其将系统看成一个随时间变化而变化的函数,在建模时,不需要大量数据的支持,也不需要数据服从典型的概率分布就能够取得较好的预测效果,达到较高的拟合和预测精度,因此本文选取灰色预测GM(1,1)模型进行预测。研究选取表1 中比较具有代表性的关键词:图书馆类、网络舆情类、热点话题类、新技术类、信息行为、知识图谱、扎根理论、数字人文这8 类进行建模,以预测这些关键词在未来2 年可能出现的频次,进而推测可能的研究方向。2.1数据缓冲处理及光滑度检验根据灰色预测GM(1,1)模型的理

14、论要求,需要累加原始数据,使得无规律的数据成为规律性较强的数列再进行建模,由模型生成的数据进行累减以得出预测值进行预测。由于灰色预测GM(1,1)是基于累加生成和最小二乘法的齐次指数增长模型,对增长趋势多样的实际数据,其预测模型精度往往较差而不能满足实际要求。研究认为模型的精度很大程度上取决于原始数据序列的光滑度,光滑度与模型精度呈正比关系。为改善序列光滑性的效果和计算的方便程度,使用对数算子改善数据序列的光滑性,也即:X(k)d=ln X(k),k=1,2,3,4,5,.令关键词在2 0 1 7 2 0 2 2 年出现的次数为:X=X1,X2,X3,X4,Xs,X。f对其进行对数算子作用:X

15、(0)=(X(0),X(0),x(),x(0),X(0,X(0)式中:X(0)=ln(X,),i=1,2,3,4,5,6。对X()进行一阶累加作用,生成序列:X()=(X(),X),Xg),X(),X(),X(式中:X()一i=1对处理后的数据X()和序列X(I)进行准光滑性检验:139X(),h=1,2,3,4,5,6经营与管理()X0.5对处理后的数据X()和序列X(1)进行准指数规律检验:()8(k)=1,1.5对处理后的数据X()和序列X(1)进行级比检验:g(h)n+1en+1满足检验,即X(1)序列具有指数增长的归类,也即满足一阶线性微分方程2.23建立预测模型及发展系数检验根据灰

16、色系统理论对X(1)建立关于t的白化微分方程(影子方程)GM(1,1):dX)+aX(1)=udt将上式离散化,微分变差分,得到GM(1,1)灰色微分方程:x(0)+az()=u,=2,3,4,5,6式中:为发展灰数,反映发展趋势;u为内生控制灰数,反映数据间的变化关系。以序列X(1)为基础,令Z(1)为X(1)的背景值序列:TECHNOLOGYANDMARKETVol.30,No.8,2023-2)171式中:B=-Z.1,Y=11Z则如上式所示,依上诸式可求得式中的值与u值。建立X(1)的预测公式为:ux(1+1)=(X(I(1)7(0)(1)在初始条件x113=x()=()下,进行累减还

17、原,可得对数算子后序列的数据模型(0)(1)=x将k=2,3,n 代人上式,便可得到数据的拟合值及灰色预测模型对未来的预测值。以此得出的为对数算子,因而需要将得出数据进行还原,获得初始数据。X,=er(),i=2,3,n研究表明,当发展系数lal小于2 时,GM(1,1)有意义;当小于等于0.3时,GM(1,1)模型具有较好的适用范围,可用于短期预测和中长期预测2 4。V(O)()Qkuk=0,1,2,n-1aa表2 为通过GM(1,1)模型预测的2 0 2 3年与2 0 2 4年Z(1)=1(1)(1)23Z式中:Z()R)=x(1-1)+(1-)x(1,k=2,3,4,5,6(1)一般来说

18、,=0.5,则构造紧邻均值生成序列:z(1)=0.5 x(h)+0.5 x(b-1),h=2,3,4,5采用最小二乘法可确定:=(a,u)=BB-IBy(1)(1)(1)各类关键词可能出现的次数。由于研究使用对数算子改善了原始数据的光滑性,因此各关键词的发展系数均小于0.1,因而,该预测有意义且适用于短、中、长期预测,较为合理准确。表2基于灰色模型GM(1,1)的预测2017年2018年(X)(X2)图书馆类307网络典情类153热点话题类137新技术类90信息行为类66知识图谱40扎根理论20数字人文81402019年(X,)253185138119114131841097575343525

19、3022222020年(X4)171123144124833839202021年(X,)151115112135654245362022年(X。)10711075105714450472023年(X,)9810485134684864542024年(X)82997814367517970a0.0370.0100.020-0.0140.006-0.0190.049-0.063技术与市场2023年第30 卷第8 期3研究主题发展方向分析根据表2 的预测结果可知,图书馆类关键词在2023年、2 0 2 4年可能出现的次数为9 8 次和8 2 次,说明未来情报学领域与图书馆学交叉研究仍将是重点之一,但

20、其研究数量可能会有所下降,这也符合我国“新四科”建设的实际趋势和时代发展需要由于网络舆情类关键词与其他学科领域如新闻与传媒、高等教育、社会学甚至互联网技术有着不少交叉研究,在可预见的将来,它仍将占据较高的地位和较多的发文量。热点话题类关键词则通常与研究热点高度相关,不论是正处于下降趋势的大数据,还是正处于平稳上升趋势的人工智能,抑或是急剧火热的区块链,他们终将被新的概念、新的名词所代替,例如元宇宙、虚实结合、世界3、虚拟数字人等。该方面的研究更多地取决于新概念的出现及与情报学领域的相关程度和融合程度。新技术类关键词的预测值呈现较大幅度增长态势。在新文科背景下,越来越多的研究者借助计算机信息技术

21、和知识分析技术开展情报学研究。提供智慧化服务、构建战略决策情报、专利技术分析等研究主题将日益受到情报学领域学者的重视,信息行为类和知识图谱等关键词的研究呈现平稳发展态势,其作为情报学研究领域的重要组成部分和方法,对其的研究仍会适当增加。扎根理论在情报学研究中的学科交叉特征更加突出,受计算机等学科研究方法影响较大,扎根理论的三阶段编码分析法、现象学七步分析法都是与理论匹配的具有深度的资料分析方法2 5 。此外,扎根理论被称为“今日社会科学中最有影响的研究范式”2 6 ,其在情报学中的使用极其广泛,具有相当可观的前景。数字人文及人文计算与情报学关系密切,已成为情报学学科发展的重要方向,新文科背景下

22、,越来越多的情报学研究试图立足于人文实现对量化数据的解释,从新的角度发现人文科学的问题,弥补传统人文科学研究方法手段的不足,保持进步的技术变革使得计算人文的未来越来越近2 7 。O经营与管理4结束语本文选取了情报学领域1 1 种高影响力期刊在20172022年刊载的1 38 2 7 篇研究论文为研究样本,借助于SATI3.2文献题录信息统计分析工具,对关键词进行统计和加权处理,得出情报学的研究现状,建立灰色预测模型GM(1,1)对部分关键词未来2年的频次进行预测,并对发展方向进行了一定阐述。研究结论为:图书馆类仍将是情报学领域研究重点;热点话题类的发展取决于新概念、新名词的出现及与情报学领域的

23、相关程度和可融合程度;新技术与信息行为类、知识图谱类关键词将呈增长态势并互相结合,多元化的同时也将随时代发展;扎根理论在情报学研究领域已经比较广泛但尚未形成统一范式,仍具有可观前景;数字人文与图情档的融合契合了新文科建设的发展理念和发展趋向,二者将以深度融合为导向,积极拓展创新。参考文献:1张继东,蒋丽萍.融入用户群体行为的移动社交网络舆情传播动态演化模型研究J.现代情报,2 0 2 1,41(5):159-166.2吴诗贤,张必兰.基于观点场模型的微博评论观点演化趋势预测方法J.现代情报,2 0 1 8,38(9):7 4-7 8.3邢云菲,李玉海.高校网络舆情传播主题图谱可视化研究J.情报

24、科学,2 0 2 0,38(1 1):8 6-9 1.4赵蕾.我国网络典情研究的知识图谱:基于CiteSpace软件的可视化分析J.秘书,2 0 2 0(4):40-5 6.5毛平.多维度视角下的国内外人文社科大数据研究脉络J.图书与情报,2 0 1 9(1):8-1 6.6王知津.大数据环境下情报学的继承与发展J.图书情报工作,2 0 2 1,6 5(1 7):3-1 2.7储节旺,李振延.图书馆大数据知识生态系统特征及构成研究J.情报理论与实践,2 0 2 2,45(2):35-42.8丁波涛.人工智能时代的情报学发展与创新:基于情报交流理论的视角J.情报学报,2 0 2 1,40(3):

25、32 1-332.9张敏,刘欢,丁良萍,等.基于深度学习的网络科技信息情报价值计算方法研究J.图书情报工作,2 0 2 1,65(23):70-78.10邱科达,马建玲.机器学习在术语抽取研究中的文献141经营与管理计量分析J.图书情报工作,2 0 2 0,6 4(1 4):9 4-1 0 3.11田园,宫婷婷.基于LDA模型的在线教学需求数据主题挖掘研究J.情报科学,2 0 2 1,39(9):1 1 0-1 1 6.【1 2 李欣颖,徐恺英.我国信息行为研究动态及发展趋势研究J.情报科学,2 0 2 2,40(6:1 8 5-1 9 3.13孙鸿飞,张海涛.基于文献计量与可视化方法的国内外

26、大数据领域研究动态研究J.情报科学,2 0 1 8,36(11):169-176.14盛东方.我国图书情报研究中的扎根理论应用J.图书馆论坛,2 0 2 0,40(8):7 8-8 6.1 5 徐扬,孟文霞,李广建.基于灰色预测模型的情报学热点主题发展预测J.情报科学,2 0 1 6,34(7):3-6.1 6 王知津.大数据环境下情报学的继承与发展J.图书情报工作,2 0 2 1,6 5(1 7):3-1 2.17孙鸣蕾,房小可,陈忻.图书情报档案领域数字人文研究综述J.兰台世界,2 0 2 1(4):1 1 7-1 2 1.18邱均平.文献计量学的理论、方法和应用J.图书情报知识,1 9

27、8 4(4):43-46.19邱均平,周子番,张裕晨.近十年我国计量与评价研究的发展与趋势J.情报理论与实践,2 0 2 1,44(2:192-200.20王晰巍,刘宇桐,李玥琪.突发公共卫生事件中公民隐私泄露舆情的情感演化图谱研究J.情报理论与实践,2 0 2 2,45(3):1 9-2 7.TECHNOLOGYANDMARKETVol.30,No.8,202321】孙晓宁,姚青.多元主题场景下的用户弹幕与评论特征比较研究:基于Bilibili网站J.情报理论与实践,2021,44(9):135-141.22钟佳娃,刘巍,王思丽,等.文本情感分析方法及应用综述J.数据分析与知识发现,2 0

28、2 1,5(6):1-1 3.23杨应全,刘子辉.我国突发事件网络典情研究综述J.重庆科技学院学报(社会科学版),2 0 2 2(2):40-48.24刘思峰,邓聚龙.GM(1,1)模型的适用范围J.系统工程理论与实践,2 0 0 0(5):1 2 1-1 2 4.25】包鑫,柯平.访谈法在我国图书情报领域的应用探析:基于5 34篇文献的文献计量与内容分析J.图书情报工作,2 0 2 1,6 5(1 5):7 1-7 7.26牛静.扎根理论及其在新闻传播学的运用J.东南传播,2 0 1 0(4):1 4-1 6.27】情报学前沿领域研究进展荟萃(一):情报学进展第1 4卷摘编J.情报理论与实践

29、,2 0 2 2,45(6):2 0 7-210.作者简介:李德昌(1 9 9 8 一),男,湖北大冶人,硕士研究生在读,研究方向:情报分析、网络舆情。董坚峰(1 9 7 7 一),男,湖北孝感人,博士,副教授,研究方向:信息资源管理、网络舆情。(上接第1 36 页)参考文献:1郭占元,胡关斗.民办高校科研能力的提升与可持续发展J.现代教育科学,2 0 0 8(7):5 3-5 5.2郑丽君.民办高校科研工作现状研究J.北京城市学院学报,2 0 0 6(4):1 1-1 3+6.3贾东荣.民办高校科研工作的现状与对策J.职业技术教育,2 0 0 6,2 7(2 5):6 4-6 7.4卢丽琼,

30、王邦永.民办高校科研工作现状及改进策略:基于上海市五所民办高校的调查分析J.浙江树人大学学报(人文社会科学版),2 0 0 9,9(4):2 6-30.5陈洁.我国民办本科院校科研现状调查J.中国成人教育,2 0 0 8(3):1 0 6-1 0 7.6迟萍萍.激励理论视域下民办高校教师科研能力提升研究J.职业技术,2 0 1 6,1 5(1 1):8-1 1.7陈宏敏,董建新.民办高校创新发展中的问题及对策研究J.文化创新比较研究,2 0 2 1,5(2 0):7 8-8 1.8周涛.创新民办高校科研管理J.高教论坛,2 0 1 8(12):22-25.9汤冬冬,徐兴林,王红霞.新时代民办高校科研能力提升探析J.教育与职业,2 0 2 0(8):9 1-9 6.10谢吟,姜永镔.高校科研管理效能评价体系构建:基于清华国际科研合作实践的几点思考J.中国高校科技,2 0 2 1(增刊1):5 2-5 6.作者简介:刘祖琼(1 9 8 3一),女,福建泉州人,本科,助理研究员,研究方向:高校科研管理。142

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服