1、研究目的动态意见领袖识别是探究突发网络舆情危机事件“引爆点冶和网络话题持续高热原因的关键,也是理清网络生态构成和建设和谐网络社会的必经之路。研究方法社会网络理论是研究信息扩散模式,刻画突发舆情传播的重要方法。然而传统静态社会网络分析研究方法存在构图方式表浅、静态分析获取信息滞后等缺陷。基于此,本文以“新疆棉事件冶为例,运用实时社会网络分析法对突发舆情事件开展动态研究。首先从内容、主题、情感三层维度计算文本相似度,替代交互行为作为构建网络的依据,更深刻地表现信息内在关联。随后利用滑动时间窗口不断更新阶段文本数据,构建实时社会网络,分析舆情事件扩散的动态拓扑特征,并挖掘不同阶段的意见领袖及影响力特
2、质。最后依据动态识别结果,提出三种类型的意见领袖,并指出了相应的检测方法与指导建议。研究结论本文提出的方法拓展了社会网络理论在网络舆情分析中的应用思路,对于有关部门开展舆情监测与管理实战具有一定参考价值。关键词:网络舆情;突发舆情事件;意见领袖识别;社会网络分析;文本相似度;PageRank中图分类号:G350摇 摇 摇 摇 摇 摇 摇 摇 摇 文献标识码:A摇 摇 摇 摇 摇 摇 摇 文章编号:1002-1965(2023)09-0109-08引用格式:张霁阳,张摇 鹏,李思佳,等.基于实时社会网络分析的突发舆情事件动态意见领袖识别方法研究J.情报杂志,2023,42(9):109-116,
3、126.DOI:10.3969/j.issn.1002-1965.2023.09.016Research on Dynamic Opinion Leader Identification of Public OpinionEmergencies Based on Real-Time Social Network AnalysisZhang Jiyang1,3摇 Zhang Peng1摇 Li Sijia1摇 Liu Jing2摇 Dou Yunlian1摇 Lan Yuexin1(1.Research Center for Network Public Opinion Governance,C
4、hina Peoples Police University,Langfang摇 065000;2.School of Liberal Arts and Sciences,North China Institute Aerospace Engineering,Langfang摇 065000;3.Ningbo Entry Exit Border Inspection Station,Ningbo摇 315040)Abstract:Research purpose Identification of dynamic opinion leaders is the key to explore th
5、e tipping point of sudden online public o鄄pinion crisis and the reasons for the continued high popularity of online topics,and is also the only way to clarify the composition of net鄄work ecology and build a harmonious network society.Research method Social Network Theory is an important method to st
6、udy infor鄄mation diffusion mode and depict the spread of sudden public opinion.However,the traditional static social network analysis and researchmethods have some defects,such as shallow composition pattern,and lag in obtaining information through static analysis.Based on this,第 42 卷摇 第 9 期2023 年 9
7、 月摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇情摇 报摇 杂摇 志JOURNAL OF INTELLIGENCE摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇Vol.42摇 No.9Sep.摇 2023the paper takes the Xinjiang Cotton Incident as an example,and uses real-time social network analysis to conduct dynamic research onpublic opinion emergencies.Firstly,the text similarity is cal
8、culated from the three dimensions of content,theme and emotion,replacingthe interactive behavior as the basis for building the network,and expressing the internal relevance of information more deeply.Then,thesliding time window is used to continuously update the text data at different stages,build a
9、 real-time social network,analyze the dynamictopological characteristics of public opinion event diffusion,and mine the characteristics of opinion leaders and their influence traits at dif鄄ferent stages.Research conclusion The methods proposed in this paper expand the application of social network t
10、heory in network pub鄄lic opinion analysis,and have certain reference value for relevant departments to carry out public opinion monitoring and management prac鄄tice.Key words:network public opinion;public opinion emergencies;opinion leader identification;social network analysis;text similarity;PageRa
11、nk0摇 引摇 言中国互联网中心的数据显示,截止 2022 年 6 月,我国网民规模为10.51 亿,互联网普及率达74.4%,网络已经成为网民表达观点,表达意见倾向的主阵地1。近年来,各类不同大小和范围的突发事件层出不穷,围绕着事件的发展,网民在不同平台积极发表自己的各类观点。但事件发生后网络上各种力量的争夺,加速了信息的流动,也加剧了网络信息表达的盲目性和不确定性,因此网民的观点和情感随着舆情事件的相关议程发生变化。同时,每次网络舆情危机事件中都可能存在网络流言、传言等相关不实信息传播,在这种环境下如果缺乏及时明确的官方意见,则很有可能舆论话语权掌握在少数意见领袖手中。意见领袖的失范行为或
12、者刻意为之与网民群体的错误认知,都极易造成网络谣言的发酵与消极舆论的传播。重大负面舆情事件更是会突破网络层面,通过线上线下互动,给现实社会造成不利影响2。因此在突发舆情事件中进行快速有效的舆情分析引导,动态精准识别意见领袖并挖掘关键传播路径,有助于网络监管部门掌握舆情态势和控制舆情变化,维护网络平台的安全与健康,为社会营造一个良好稳定的舆论环境。1摇 相关工作当前,国内外学者针对突发网络舆情事件及意见领袖识别问题已经开展了研究,常用的方法包括生命周期理论3、信息扩散理论4、社会网络理论5等等。其中前两者是对网络舆情的宏观刻画与描述,而社会网络理论更加聚焦舆情事件中的微观个体行为,更加适用于突发
13、事件中动态信息挖掘与实时舆情检测。近年来,随着深度学习系列算法的兴起,使社会网络理论能够在舆情研究探索过程中创造更多可能,发挥更大潜在作用。摇 1.1摇 社会网络分析社会 网 络 分 析 法(System Network Analysis,SNA)是基于图论等数学理论研究社会关系与网络结构的定量分析方法6。社会网络理论被广泛应用于舆情事件的研究,基于客体与关系构建社会网络系统,可以客观有效的展现网民之间的复杂联系7-9。从宏观角度出发,SNA 可以探讨突发事件中信息传播的网络结构特征10、密度与传播速度11以及演进与演化过程12等问题,把握舆情总体概况。从微观角度出发,SNA 可以研究在线网络
14、平台用户的拓扑特征,挖掘网络意见领袖13,进而利用机器学习等算法预测每个舆论个体的网络行为14。当前研究一般基于转发、评论等显性交互行为建立关联,忽视了在浏览阅读时用户间潜移默化的隐性思维影响。在多元开放的社交平台中,交互关系并非意识传播的必要前提。一条文本对阅读者产生影响后,可能发表相似共情言论。因此,本文采用文本相似度作为建立联系的依据,建立更能体现传播特征的网络系统。摇 1.2摇 文本相似度文本相似度计算是自然语言处理中的一项重要工作。让机器理解自然语言并筛选出相似的文本原是一项富有难度的任务。随着自然语言处理技术的兴起,Word2Vec15、Glove16等语言预处理模型通过将文本转化
15、为机器可读的词向量,进而计算距离。然而,单纯的词向量训练往往存在不能识别一词多义,无法分辨语境等缺陷。唐焕玲等将 LDA 主题模型与 Word2Vec相结合,提出一种语义增强方法 Sem2vec17。融入主题信息的词向量模型可以更好地识别语义,但网民言论不仅蕴含着其思想和观点,更是抒发着自己或喜或怒的强烈情绪,网民情感也是舆情扩散与演化的重要助推剂。赵蓉英等基于情绪向量距离量化情感表征,计算信息发布者与受众的情感相似度,从而较好的量化了文本情感距离18。基于 以 上 研 究,本 文 采 用 句 向 量 训 练 模 型Doc2Vec19,主题聚类模型 LDA20以及 DUTIR21情感词典分别计
16、算文本的内容、主题与情感的相似度,从三个维度全面测算出可靠的文本距离。011 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 情摇 报摇 杂摇 志摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 42 卷摇 1.3摇 意见领袖识别意见领袖是指一些在人际关系网络中表现活跃,且具有较高的代表性和威信的人物22。在舆情传播过程中,意见领袖起着观念传递与情绪引导的重要作用,需要及时识别与适时管控23。当前,社会网络经典算 法 PageRank 被 广 泛 用 于 意 见 领 袖 识 别 问题24-25。PageRank 根据入度的数量与质量
17、评估节点中心度,并将中心度高的节点视为具有影响力意见领袖。然而,传统 PageRank 仅从网络结构出发识别重要节点,为适应社交媒体平台的真实复杂环境,许多学者对该算法提出了改进与创新。Aleahmad 等人在 Pag鄄eRank 的基础上融入用户的胜任度与流行度指标,提升了算法在现实环境下的鲁棒性26。Qiu 等人使用主题敏感分析以获得社交网络中的集群,以计算用户更具价值的区域影响力27。突发舆情事件衍化速度快,不确定性高,在多方舆论势力博弈中意见领袖会频繁变化。因此本文结合前人研究,在 PageRank 的基础上融入热度与时间要素,以期在突发事件中对舆情实现更加精准有效地识别防控。本文以“
18、新疆棉事件冶为例,运用社会网络分析方法对突发舆情事件开展动态分析。对比之前的研究,本文的主要贡献在于:a.当前的意见领袖识别工作往往依据事后数据,构建静态网络,无法对关键用户与热度话题进行实时有效地检测引导。本研究按时间顺序获取并更新文本,构建实时变化的网络系统,从而得以把握突发事件扩散的动态拓扑特征。b.为适应突发事件的随机性与复杂性,本研究使用基于内容、主题、情感的综合文本相似度替代交互行为作为构建网络的依据,得以更全面深刻地表现信息关联与传播规律。c.在 PageRank 的基础上融入热度指标与时间衰减因子,使模型更加真实地反应出突发舆情事件在萌芽、爆发、衰退的过程中,不同阶段意见领袖的
19、动态影响力特质。2摇 研究方法摇 2.1摇 研究框架本文的社会网络体系以文本相似度为构图规则,根据时间变化不断更新社会网络节点并实现动态意见领袖识别。具体研究内容可以分为爬取微博数据、测算文本距离,构建社会网络、挖掘意见领袖四个模块,见图 1。淤爬取微博数据模块的主要工作是利用 Python+Selenium 爬虫,获取新浪微博平台上某一事件的微博及其评论回复数据,并进行相关预处理;于测算文本距离模块的主要工作是提取内容、主题、情感信息特征,计算微博之间的文本相似度;盂构建社会网络模块由更新文本集合内容、构建社会网络两个步骤组成,文本集合随时间而不断变化;榆挖掘意见领袖模块则是使用改进 Pag
20、eRank 算法迭代计算影响力,识别当前时段意见领袖。图 1摇 本文研究框架摇 2.2摇 文本距离计算传统舆情事件分析一般基于用户交互行为构建社会网络,然而在突发事件扩散过程中,交互行为并不一定是信息传播的必要条件。如图 2 所示,用户之间通过浏览阅读,也可能潜移默化地受到影响,并发表出受影响后的言论。因此,本文重点考虑言论的关联性,基于文本距离构建突发舆情信息传播网络。图 2摇 用户潜在影响示意图基于文本相似度的构图策略,可以更深刻的展现信息在用户中的传播过程,并更好地保证网络的关联性。本文选择从内容、主题、情感三个角度出发计算文本相似性。2.2.1摇 基于 Doc2Vec 的内容相似度计算
21、Doc2Vec 是 Mikolov 等提出一种可以将任意长度文档 转 化 为 固 定 程 度 向 量 的 无 监 督 训 练 模 型,Doc2Vec 基于 CBOW 和 Skip-Gram 两种词向量训练模型,在训练过程中添加段落向量。实验表明,该方法可以较好的挖掘语义信息,提炼文本内容,目前已被广泛应用于不定长短文本的向量表示工作当中。提取文档向量后,采用余弦相似度方法计算内容相似度,公式如下:111摇 第 9 期摇 摇 摇 摇 摇 张霁阳,等:基于实时社会网络分析的突发舆情事件动态意见领袖识别方法研究consim(i,j)=移nk=1xikxjk移nk=1x2ik移nk=1x2jk(1)2
22、.2.2摇 基于 LDA 的主题相似度计算LDA 模型是 Blei 等提出的一种对文本数据的主题信息进行聚类与提取的方法,并将文章主题以概率分布的形式给出。实验表明,LDA 模型能够从大规模文本数据中快速识别主题类型,进而成为判别文本主题相似程度的依据。通过 LDA 聚类主题,并获得文本的主题概率后,采用欧式距离的方法计算主题相似度,公式如下:thesim(i,j)=1-移k沂topics(pik-pjk)2(2)2.2.3摇 基于 DUTIR 的情感相似度计算大连理工大学情感词汇本体库(DUTIR)是目前我国较为成熟的情感词典之一。该词库从不同角度描述中文词汇的情感极性、类别与强度等信息,将
23、情感词分为了“乐好怒哀惧恶惊冶7 个情感大类,并将强度划分为 5 个等级。根据该情感词典,统计文本数据的情感词并计算各类情感强弱程度。将 7 类情感属性值归一化后,采用欧式距离的方法计算情感相似度,公式如下:emosim(i,j)=1-移7k=1(Eiksum(Ei)-Ejksum(Ej)2(3)综上,结合内容、主题、情感相似度,得到文本相似度计算公式:sim(i,j)=consim(i,j)*thesim(i,j)*emosim(i,j)(4)摇 2.3摇 动态社会网络构建突发舆情事件的信息扩散过程充满了不确定性,尤其在舆情爆发初期,各种观点言论、小道消息频发,舆论倾向变化迅速,意见领袖更替
24、频繁。如果在事件结束后挖掘意见领袖,则会忽略舆情传播过程中起到过重要影响的用户,不利于突发舆情事件的实时监测与处理。因此,本文提出一种动态社会网络构建方法,不断融合先前领袖与实时数据,生成最新网络,如图 3所示。具体步骤如下:第 1 步,确定时间窗口 T 与社会网络的节点上限S。第 2 步,获取第一个时间窗口的文本数据,数量记为 t0,生成文本集合。第 3 步,计算文本相似度,构建社会网络。当文本相似度大于阈值 sim(i,j)S,则筛选重要度排名前 S-ti的关键结点,与新数据组合形成新文本集合。第 6 步,重复第(3)(4)(5)步,实现动态意见领袖识别。图 3摇 动态社会网络构建示意图摇
25、 2.4摇 意见领袖识别本文基于 PageRank 算法进行意见领袖识别。PageRank 是衡量社会网络节点重要性的经典算法,其基本原理为:节点重要性与其入度数量和质量有关。节点的入度越大,或节点入度越重要时,则表明该节点重要性越强。PageRank 采用迭代方式求解,当遇到自环或节点陷阱,用户会选择以一定的概率 琢 重新选择一个随机网页出链,公式如下:PR(pi)=琢+(1-琢)移Pj沂I(pi)PR(pj)O(pj)(5)其中,PR(pi)是不断迭代的节点 pi的 PageRank值,I(pi)是节点 pi的入度集合,O(pi)是节点 pi的出度总数,琢 为随机跳转概率,一般取 0.15
26、。开始迭代时,传统 PageRank 会平均分配各节点的初始 PR 值,这样就忽略了现实网络社会中的复杂因素。言论的追随者数量易受热度影响,点赞评论数量越多,该言论就越容易出现在显眼的位置,引起其他用户注意28。同时热度也会随着时间迁移而消退29。早期融入信息传播过程的用户往往更具影响力。发表时间越久,其他用户刷到的概率就越低。因此,结合文本点赞评论数量评估用户热度,并融入时间衰减因子30分配 PR 值,公式如下:PR0(pi)=酌(lg(like(pi)+1lg(max(like)+1+lg(comment(pi)+1lg(max(comment)+1)(6)根据热度呈指数衰减的特征,设置衰
27、减因子 酌 计算方式如下:酌(t)=b(1-e-t)+(1-b)摇 摇 摇 摇(7)211 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 情摇 报摇 杂摇 志摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 42 卷获得初始 PR 值后,迭代计算文本影响力,最后基于文本影响力挖掘意见领袖。为避免同一用户多条言论的影响,用户影响力由其最大的文本 PR 值决定:PR(ai)=max(PR(pj)|pj沂 text(ai)(8)融入热度与时间因素的 PageRank 算法既能提取动态社会网络的体系结构,又全面考虑了突发事件传播的实际情况
28、,从而更加适应意见领袖的动态识别工作。3摇 实证分析摇 3.1摇 案例回顾2021 年 3 月 24 日,H&M 集团以“强迫劳动冶为借口发表了拒绝使用新疆棉花的声明,这一污蔑性的涉疆言论引发了众怒。随着新疆棉事件持续发酵,国外品牌抱团打压新疆棉花,许多明星纷纷与国外品牌解约合作关系,互联网上掀起了一股抵制洋货,支持国货的热潮。新疆棉事件属于典型突发网络舆情事件,通过研究该事件,可以观测短时间内各类意见领袖的更迭过程及发挥的作用。600?000500?000400?000300?000200?000100?000图 4摇 新疆棉事件百度指数变化图通过百度指数图可以看出,突发舆情从 20
29、21 年 3月 24 日开始,仅用了 1 天时间便达到热度高峰,随后经过了一周左右的持续发酵和逐步衰减,于 4 月 1 日起渐趋平缓。根据舆情阶段划分理论,将新疆棉事件的网络舆情传播过程大致分为萌芽期、爆发期、成熟期、衰退期四个发展阶段31。摇 3.2摇 数据采集本文数据来源于新浪微博平台,以“新疆棉冶为关键词,爬取了 2021 年 3 月 24 日至 2021 年 4 月 4 日的所有热门微博及各级评论。经过数据清洗去重,去除与主题明显无关的数据,最终共获得来自 21 663 个用户的 23 471 条微博言论。其中热门微博 1 625 条,一级评论数据 15 292 条,二级及以上评论数据
30、 6 553 条。随后进行数据预处理,使用 HanLP 工具分词,得到词袋数据。摇 3.3摇 实验准备经过调试,本文将参数设置如下:时间窗口 T=1h,节点上限 S=2000,PageRank 随机跳转因子 琢=0.85,时间衰减因子基数 b=0.5。相似度阈值 着 是构建社会网络的关键指标,其大小将直接影响网络密度。因此,本文选取不同阈值进行了多次仿真实验,并采用文献32提出的未知影响力标签评估法,多次实验投票并进行 N 折交叉验证,将其结果作为参考标准结果,检验不同实验的结果准确率。具体做法为:首先设定五个实验阈值 着=(0.05,0.1,0.15,0.2,0.25),将识别出的影响力 T
31、op-k 用户集合记录下来,计 N=3,即若三次实验结果都包含某用户,则认定该用户符合影响力 Top-k 标准。选取不同 k 值(k=100,2001900)进行实验,计算算法的准确率,并进行交叉比对。如图所示,当相似度阈值 着=0.1 时,意见领袖识别准确率最高(为保证实验的代表性,选取最热时段 3 月 25 日 10-11 时的 1971 条微博进行构图实验)。图 5摇 选取不同相似度阈值的识别准确率对比为检验本文提出的相似度指标合理性,采用随机抽取了 200 条文本进行相似度实验,如图 6 所示。图 6摇 相似度指标合理性检验图 6 呈现了随机选取文本的内容、情感、主题相似度的分布情况。
32、图中的每个点代表一条文本距离数据,其中黑点为三种相似度两两之间作差均小于 0.1的文本距离数据。结果表明三种相似度的总体相关性较高,可以结合作为评估文本相似度的指标。摇 3.4摇 动态社会网络分析确定所需参数后,根据时间窗口选取微博数据,更311摇 第 9 期摇 摇 摇 摇 摇 张霁阳,等:基于实时社会网络分析的突发舆情事件动态意见领袖识别方法研究新文本集合,计算相似度,构建社会网络。基于 Gephi 社会网络分析软件进行可视化,根据影响力 PR 值赋予节点大小,可以看出舆情网络的基本变化动态。如图 7 所示,在萌芽期时,网络节点数量极少且几乎没有关联。到了舆情的爆发期随着节点数量的增加,网络
33、密度也随之同步提升,逐渐形成一片高连通、高密度的社会网络。由于节点上限的设置,舆情网络的节点数量在达到上限后便不再增多,但网络密度仍在增大。此现象表明网民观点联系日益紧密,而发表内容之间不断互相影响。图 7摇 新疆棉事件舆情社会网络变化图通过观测节点相对大小,可以观测到 25 日 0 时影响力最大的几名意见领袖非常突出,而到了后期节点大小逐渐趋同,没有了明显的意见领袖。说明一般在舆情的爆发期,强力的意见领袖很容易出现,他们影响人们观点,左右网民言论,在舆情的快速传播和扩散的过程中起了至关重要的作用。而随着舆情事件热度的逐渐消退,社会网络的节点大小也逐渐趋同,这时的关键领袖不再能够起到左右局势的
34、效果。此现象表明,舆情事件发生后 12 24 小时的爆发期内是意见领袖相对影响力最大的时期,也是挖掘关键意见领袖的最重要时期。对重要言论进行精准识别与实时疏导,对于维护舆情场和谐健康具有重要意义。摇 3.5摇 意见领袖识别基于热度与时间赋予文本初始 PR 值,经多次迭代达到稳定后获得节点影响力,并据此计算用户影响力。如图 8 所示,观察用户 PR 值分布,发现极少数的用户拥有极高的影响力,且随着时间的推移,意见领袖比例迅速减小,影响力差距越来越大。以上说明突发事件中,用户 PR 值分布呈现出越来越明显的幂律特征33。基于此,本文以某一时间段内最大 PR 值的一半作为该时间段的意见领袖基准,挖掘
35、出不同时间的意见领袖及其影响力排名。图 8摇 不同时间段用户 PR 值分布基于上述标准筛选意见领袖,并研究意见领袖数量与比例动态变化,图 9 显示了突发舆情各个阶段的变化趋势。在最初 12 小时的萌芽期时意见领袖寥寥,随着舆情的爆发,在接下来 24 小时内意见领袖数量迅速提升,逐渐达到峰值。而在舆情衰退期,随着观点的多元化及用户影响力的平均化,意见领袖的数量开始呈现衰退趋势。图中黄线展现了意见领袖在全用户数量中的占比。可以看出除了起始时因网络结构尚未形成,影响力区分不明显之外,在大多数时间内意见领袖占比在 2%10%之间。这样的比例符合我们对意见领袖的日常认知,说明本文识别方法科学有效,具有一
36、定实战价值。图 9摇 意见领袖数量比例变化趋势摇 3.6摇 意见领袖分析经过筛选,共从 21 663 个用户中找出 12 天内意见领袖用户 1 153 个,其中成为意见领袖时间超过 24小时的用户共有 267 个。表 1摇 成为意见领袖时间最长的 10 名意见领袖用户 ID持续时间(h)首次进榜时间平均排名脑壳疼的小风262Mar.24th9:004.887咕噜呼呼呼呼呼252Mar.24th10:0032.792昭君好像纪湘237Mar.24th18:007.212中国日报237Mar.24th18:0027.753央视网206Mar.24th16:0043.923411 摇 摇 摇 摇 摇
37、 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 情摇 报摇 杂摇 志摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 42 卷续表 1摇 成为意见领袖时间最长的 10 名意见领袖用户 ID持续时间(h)首次进榜时间平均排名财联社 APP229Mar.24th18:0026.719羊羊 Vip226Mar.24th13:0047.0界面新闻227Mar.24th19:0023.545-水蛋蛋-218Mar.24th16:0037.549环球时报230Mar.24th18:0027.853摇 摇 另通过对 267 位意见领袖的排名动态分析,可以将用户的影
38、响力的时效特征大致分为长期意见领袖、前期意见领袖、后期意见领袖三类,如表 2 所示。表 2摇 意见领袖分类种类特征典型代表长期意见领袖长期处于 Top100 行列,始终具有较高影响力脑壳疼的小风、昭君好像纪湘、中国日报前期意见领袖在舆情爆发前期影响力较大,后期影响力逐渐减小半月谈、女生帅哥、31 三缺一 88后期意见领袖在前期没有作为,后期对舆情起到了重要作用娱乐指南、中国企业家杂志、剧综指南摇 摇 图 10 展现了三种类型的意见领袖在舆情扩散过程中的实时排名变化过程与态势。图 10摇 三类意见领袖典型代表排名变化摇 摇 如图 10 所示,长期意见领袖在舆情扩散过程中始终保持在第一行列,而短期
39、意见领袖往往只能在发表言论的一段时间内影响舆论。其中,前期意见领袖虽然在较早的时候发表了言论,但在随着爆发期网民意见的井喷式增长,这些意见领袖的观点的影响力逐渐落到了下风。而后期意见领袖则是在舆情爆发期后才发表有关言论,虽也在一定阶段造成了一定影响,但由于舆情热度渐趋衰微,其影响力终究无法与长期意见领袖相媲美。为实现各类意见领袖的动态识别与区分,提前预警长期意见领袖,本文统计对比了意见领袖各项指标(见表 3)。将持续时间 48 小时以上的划分为长期意见领袖,48 小时以内的为短期意见领袖。根据在舆情爆发期结束前(3 月 26 日 0 时)是否成为过意见领袖,将短期意见领袖划分为前期意见领袖与后
40、期意见领袖。筛选得到 110 个长期意见领袖,136 个前期意见领袖,21 个后期意见领袖。对比发现,长期意见领袖平时的活跃度与影响力要明显高于短期意见领袖,该类用户往往是官媒、自媒体等权威用户。在突发舆情事件中,长期意见领袖会发表更多高质量的言论,以维持自己的高影响力,同时,早发言的意见领袖在事件传播过程中能够掌握先机,获得更持久的影响力。综上,对动态产生意见领袖的基本情况、言论热度与时间等信息进行画像分析,有助于尽快预判其成为长期意见领袖的可能性,进而更有效地展开实时监督与引导。表 3摇 意见领袖平均指标对比摇 摇 摇 摇 基本指标摇 摇 摇 摇摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
41、摇 摇 突发事件话题内指标摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇粉丝数累计发博数发博数累计点赞数累计评论数发言时间(最早)发言时间(最晚)长期意见领袖1092.2 万6.72 万2.8937484.51902.2Mar.24th9:00Mar.24th20:00前期意见领袖450.1 万2.77 万1.756188.5872.9Mar.24th10:00Mar.26th0:00后期意见领袖55.1 万0.98 万1.565343.5646.2Mar.26th0:00Apr.2nd11:004摇 研究结果与引导策略摇 4.1摇 研究结果本文以新疆棉事件为例,分析了突发事件中舆情社
42、会网络的动态演化过程。总体来看,突发舆情网络结构的连通性、变化性在不同时期呈现出截然不同的特性。动态计算网络中意见领袖 PR 值,对于大规模精准识别意见领袖,实现舆情动态监测能够提供有效参考。意见领袖的动态识别和监管,对敏感舆论事件的引导和管理具有独特效用,对于热点舆论降温更具针对性,便于动态调整舆情治理策略。根据意见领袖在不同阶段呈现的不同特征,动态调整识别与引导策略。舆情爆发期容易孕育出影响力巨大的意见领袖,在扩散信息、引导舆论的过程中起到决定性作用,因此,需要更加注重舆情爆发后 12 24小时内的检测与治理。根据事件发散过程中影响力的变化特征,可以将意见领袖分为长期意见领袖、前期意见领袖
43、、后期意见领袖三类。其中,长期意见领袖影响力度强,持续时间久,需要进行及时识别与重点引导。根据长短期意见领袖的特征区别,我们可以通过用户511摇 第 9 期摇 摇 摇 摇 摇 张霁阳,等:基于实时社会网络分析的突发舆情事件动态意见领袖识别方法研究画像分析与发言内容分析,提前预判长期意见领袖并尽早进行相应的引导。摇 4.2摇 引导策略通过上文研究,我们针对意见领袖特性可以制定区别性引导策略:第一,对于短期意见领袖,减少监管力度,促进网络主题活力。由于不同时间段的意见领袖强度不同,非爆发期诞生的意见领袖往往只能在短期内发挥一定作用,因此对于短期意见领袖可以适当减少监管力度,降低引导成本。第二,对于
44、中期意见领袖,把握引导时机,及时检测监管。在舆情爆发过程中,信息传播速度快,意见领袖左右局势能力强,稍有不慎便可能让虚假信息带来恶劣影响。因此官方针对中期意见领袖语言风格和行为特征即时甄别,对于意见领袖引导方向重点关注,针对偏离方向的语言行为,及时发声有利于舆情风险管控。第三,对于长期意见领袖,需要实时追踪,重点监管。长期意见领袖一般从舆情爆发期起便不断活跃于舆情传播过程中,并通过不断更新言论,维持热度,左右舆论,如有脱离真相或者夸大其词的信息,很容易通过这些意见领袖进行传播,造成巨大损害。特别针对独立账号意见领袖,要重点判断其价值观和观点动向,加强对长期意见领袖语言、观点、粉丝互动行为进行关
45、注与判断。为和谐网络社会,建设更健康的网络环境创造有利条件。第四,对于官方意见领袖,也要区分短期、中期、长期进行监管,尤其官方意见领袖更应该在中长期意见领袖环节进行加强建设,与本文方法筛查出的中长期意见领袖进行舆论流量对抗,充分发挥官方意见领袖的作用。对于部分意见领袖夸大其词或无中生有的虚假信息,及时辟谣澄清,避免谣言散播。对于意见领袖引领的焦点话题,应予以重点核实,发表更加客观全面的解释以引导民众关注,争夺用户粘性。5摇 结摇 论本文基于文本相似度构建突发舆情事件的实时社会网络,提出了一种动态意见领袖识别思路。首先基于内容、主题、情感三层维度信息计算文本相似度,充分挖掘了信息间的潜在联系,体
46、现了突发事件过程中信息的传播过程,同时也有效解决了为实现动态识别而导致的样本数量减少问题。随后提出一种实时网络构建方法,并采用改进 PageRank 算法实现意见领袖识别。结合突发舆情事件信息时效性强,变化速度快的特征,在 Pag鄄eRank 的基础上融入热度要素与时间衰减因子,使改进算法更加适应社交平台真实环境。最后根据识别结果,提出了突发事件中存在的三种意见领袖类型,并通过分析各类意见领袖的特征与变化趋势,针对性的给出了监测与引导意见。本文的研究结合社交媒体平台实际,对意见领袖的实时筛查、精准分类与有效引导提出了针对性的建议,能够为突发事件网络舆情的管控与引导提供帮助。参 考 文 献1摇
47、中国互联网络信息中心.第50 次中国互联网络发展状况统计报告R.2021-08-31.http:/ 李摇 纲,陈璟浩.突发公共事件网络舆情研究综述J.图书情报知识,2014(2):111-119.3摇 孙亦祥.网络舆情信息传播视域中传播效果理论的嬗变与思考J.图书情报工作,2014(1):35-39.4摇 Wang H,Li Y P,Feng Z N,et al.ReTweeting analysis and pre鄄diction in microblogs:An epidemic inspired approachJ.ChinaCommunications,2013,10(3):13-24
48、.5摇 徐雅斌,孙秋天.特定舆情的意见领袖挖掘和关键传播路径预测J.数据分析与知识发现,2021,5(2):32-42.6摇 Otte E,Rousseau R.Social network analysis:A powerful strategyalso for the information sciencesJ.Journal of Information Sci-ence,2002,28(6):441-453.7摇 刘金荣.基于 SNA 的突发事件微博谣言传播研究J.情报杂志,2013,32(7):78-82.8摇 陈云伟.社会网络分析方法在情报分析中的应用研究J.情报学报,2019,38(1):21-28.9摇 Che