收藏 分销(赏)

基于深度学习的地震舆情信息提取及时空可视化.pdf

上传人:自信****多点 文档编号:2324217 上传时间:2024-05-28 格式:PDF 页数:16 大小:4.40MB
下载 相关 举报
基于深度学习的地震舆情信息提取及时空可视化.pdf_第1页
第1页 / 共16页
基于深度学习的地震舆情信息提取及时空可视化.pdf_第2页
第2页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷 第 期 年 月自 然 灾 害 学 报 .收稿日期:修回日期:基金项目:河北省自然科学基金项目()河北省高等学校科学技术研究项目()资源与环境信息系统国家重点实验室开放基金项目 :()()作者简介:王晨雨()女硕士研究生主要从事地质灾害大数据可视化研究:.通讯作者:叶妍君()女副教授博士主要从事时空大数据可视化相关研究:.文章编号:()./.基于深度学习的地震舆情信息提取及时空可视化王晨雨叶妍君邱英俏杜美庆(.河北工程大学 地球科学与工程学院河北 邯郸 .中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室北京 .山东正元数字城市建设有限公司山东 烟台.烟台市智慧城市及物联设施

2、工程技术研究中心山东 烟台)摘 要:社交媒体平台作为网络舆情的重要载体可为地震等重大灾害事件的应急管理提供及时有效的信息但针对社交媒体数据中蕴含的细粒度主题信息提取并分析灾情的研究尚有欠缺 基于深度学习算法提取社交媒体数据中蕴含的细粒度地震主题信息以 年 月 日“大理漾濞.级地震”事件为例构建一个主题信息提取流程框架通过对模型进行优化训练整体精度达到 以上将新获取的青海地震数据集输入模型进行验证也达到预期效果 次地震验证结果说明该模型在灾害主题信息提取中具有可行性 最后结合关键词挖掘技术、情感分析和核密度估计等辅助舆情分析法将地震主题时空可视化为灾情研判和应急管理工作提供新思路关键词:新浪微博

3、卷积神经网络文本分类地震主题提取时空特征中图分类号:文献标识码:(.):.“.”.第 期王晨雨等:基于深度学习的地震舆情信息提取及时空可视化:引言地震是造成破坏最为严重的自然灾害之一重大地震发生会对民众的生命和财产安全构成威胁还会引发滑坡、泥石流等次生自然灾害有效的灾害应急管理和防灾减灾策略迫在眉睫 传统的灾情信息获取方式具有时间周期长、工作量大、滞后于灾情等特点不能满足政府开展实时性救援工作的需求 因此震后黑箱期内及时获取灾情信息并采取有效应急策略是救援部署工作开展的关键 据中国互联网络信息中心()年 月 日发布的第 次中国互联网网络发展状况报告显示:截止 年 月我国网民达.亿互联网普及率达

4、.统计结果表明随着“互联网”时代的到来网络使我们获取信息的方式更便捷、更迅速社交媒体平台受到网友广泛关注人们可以通过互联网社交平台分享日常、发表观点、互动交流社交媒体数据来源于公众这些数据背后隐藏的舆情信息反映了人的态度、情感倾向、社会行为在进行灾情研判和救援处置时更具针对性 等基于 年日本.级地震将公众和媒体对灾害的看法进行研究分析了地震对灾后感应和行为产生的不同影响 社交媒体平台新浪微博以随时随地发布身边事的特点获得公众认可 年 月微博用户月活跃量达.亿日活跃量达.亿网友可以在微博发表文字、图片和视频等这种方便快捷的表述更加符合现代人的生活方式还可以随时随地进行留言、对来访者的评论进行回复

5、具有良好的互动性 地震事件发生后大量用户在微博平台发布言论表达自己的情感、态度海量数据汇集成为震后应急救援开展的一手资料目前已有国内外学者利用新浪微博数据研究地震事件其成果主要包括实时地震系统构建、灾情影响范围、灾情时空分析等郑嵘等基于微博数据构建了灾害实时处理系统并在实际地震中验证了系统可行性曹彦波等基于微博数据挖掘四川九寨沟地震灾情信息并与实际灾评结果进行空间对比对救灾决策部署提供一定参考徐敬海等利用位置微博提取地震灾情的方法实现了点集微博灾情向面状灾情的转化 等使用支持向量机算法分析了日本地震相关推文 微博平台是获取灾害事件中公众情绪的有效跟踪工具重大灾害的发生会使公众产生恐惧、怀疑和悲

6、伤等情绪这种状态不及时调节会给灾区民众带来不同程度的精神和心理问题可见灾后针对公众情感情绪研究的重要性 杨腾飞等基于深度学习算法抽取的情感信息结合时空信息为应急救灾提供了一定参考曹彦波基于微博数据采用情感词典与规则相结合的方法分析了灾区民众情感极性特征和情绪反映时空变化万岩等基于微博数据建立了一个新的情感分析模型提高了细粒度情感分类的准确率林筱妍等、张岩等基于微博文本特征分析了台风事件公众情感倾向有助于政府掌握和引导灾害舆情 等、等利用多源社交媒体数据对桑迪飓风等灾害进行情感分析并可视化重大地震发生会给人们带来极大精神压力和心理伤害产生不同程度的心理应激反应赵高锋等、罗兴伟等、范方等和耿富雷等

7、通过大量调查研究发现震后民众会出现心理失衡状况尤其会对地震亲临者的心理应激情绪带来重大影响严重影响他们未来的生活还可能产生负面社会心理效应对社会稳定构成威胁 一般情况下地震对于我们来说是短暂的、瞬时的然而这种灾害对于地震亲临者的伤害却是持续的、长期的震后 生命黄金救援期也是心理救援的关键期“”汶川地震的救援工作使人们深刻体会到灾后应急管理和社会救援工作中心理干预的重要性虽然此次地震的心理危机干预工作得到高度重视但由于响应机制缺失、缺乏专业队伍依然存在较多问题因此针对震区心理危机干预方法的研究尤为重要青少年作为震后灾区重点心理干预对象灾后教育重建中应加以重视谭友果等、胡丽等和张晓林等利用班级团体

8、结合个别辅导、体育锻炼等方式对震区学生进行干预同时一些针对地震灾区现场实施的心理干预方式也取得良好效果杨一等提出心理干预是一项长期系统工作应构建“医院学校行业”等多元主体协同的专业化研究团队与此同时政府在心理危机干预中发挥了不可忽视的作用政府的正确引导保障了社会救援的通畅何江新等、曹蓉等和宋晓明等学者已从事件预防、响应、恢复等多方面为政府提出可行性建议为了应对心理危机干预、了解公众关注热点、掌握并正确引导网络舆论如何从海量、非结构化的微博文本自 然 灾 害 学 报第 卷信息中快速挖掘舆情信息国内外学者已从多方向进行研究:等基于微博数据利用卷积神经网络进行文本信息提取并应用于武汉和深圳暴雨事件的

9、监测上杨辰等基于自然语言处理算法提取分析报警灾情描述信息进一步分析了气象灾害的时空特征及致灾条件 等结合 模型和 算法对暴雨主题文本流进行了分类陈瑷瑷等对社交媒体文本中的位置浅语义特征进行提取并与地理空间结合对于场所感知和城市规划有积极意义谭永滨等提出的微博文本位置信息识别与提取模型可进行文本位置挖掘分析王艳东等提出的基于共词网络社区演化进行灾情态势感知方法可辅助了解灾情发展过程马莹雪等和苏晓慧等采用机器学习算法提取灾害热点话题为灾害应急管理提供帮助目前学者已从文本分类、信息抽取等方面进行舆情分析但对社交媒体数据中蕴含的更细粒度地震主题信息提取并分类的研究存在不足本文以 年 月 日“大理漾濞.

10、级地震”事件为例基于新浪微博数据研究了一种利用卷积神经网络()提取地震主题信息并分类的方法并将结果以地震主题时空演变特征可视化为震后灾情研判、救援部署工作提供重要参考研究区域与数据.研究区域 年 月 日云南漾濞发生.级地震截至 年 月 日 时此次地震共造成.万人受灾 人死亡、人受伤多处房屋开裂甚至倒塌地震造成的坍塌和滑坡导致道路受损、交通中断 因此本文以漾濞彝族自治县.级地震为研究对象以大理白族自治州为研究区域地震震中位于.如图 所示图 研究区域.数据获取与处理漾濞.级地震在震后一段时间内一直是新浪微博的热点话题并登上微博热搜榜第一震后人们反响强烈纷纷在微博表达自己的态度、情感期间网友发布的微

11、博包含了大量与此次地震相关的舆情信息如:救援信息、伤亡情况等 本文以新浪微博平台为数据源使用 软件爬取微博热搜话题数据数据获取形式为发布时间、用户名、性别、位置、点赞数、博文内容等如表 所示采集时间为震后 (年 月 日 时 分 日 时 分)为解决爬取的数据重复率高、无关内容多等问题使用 等统计软件和人工判读对数据进行筛选、分类和统计最终获取大理漾濞.级地震数据 条表 微博数据获取格式 时间用户名性别地理定位点赞数博文黑皮哥的生活日记男昆明躺在沙发上突然有点晕突然楼下喊了一声“地震了”感觉有 房子都在晃 平安喜乐女大理大理古镇.震了 次?怕了怕了我们全家还蹲外面的第 期王晨雨等:基于深度学习的地

12、震舆情信息提取及时空可视化 续表时间用户名性别地理定位点赞数博文:毛毛虫做的圆子女大理大理大学(下关校区)操场风太大根本睡不着在教室、在宿舍、跑去楼下、回宿舍、换衣服、那次是真的是害怕脑子里空白了拿了瑜伽垫、面包、毛毯和水 个人躺在了 个瑜伽垫上互相取暖广播站放了周杰伦和陈奕迅的歌一点以后都是让人放松的纯音乐:月亮去哪了 夜怎么那么长一切都会好起来的妍曦曦妍女大理大理站 分又被摇醒了一次我真的想好好睡觉杨翠芳同学女四川成都 年这个不平凡刻骨铭心的一年都已经过去了 年一定会一切平安万事顺遂 中国力量!中国加油!愿美丽的青海平安男文山富宁县云南发生感谢山西同学的关心我没事很好离我这远呢其中地理定位

13、为用户发布微博时所处位置以文本描述的形式存在如:“大理大理大学(古城校区)”、“大理大理古镇”等为了便于分析需要将这些文本数据转换为坐标数据 通过 语言编程使用:/网站中的位置转坐标功能将地理位置转换为地理坐标如表 所示研究区域为大理白族自治州故表中展示了大理市部分地点坐标表 地理定位转换结果示例 地理定位地理坐标大理大理白族自治州人民医院.大理大理大学(下关校区).大理大理古镇.大理大理国际奥林匹克体育中心.大理大理国际大酒店.大理大理机场.大理大理交通运输集团大理汽车客运站.地理定位地理坐标大理大理站.大理大理州民族中学.大理洱海.大理洱海公园.大理鹤庆站.大理环海西路.通过对微博文本进行

14、阅读并参照微博灾情信息分类指标、地震现场灾情信息分类代码表和位置微博地震灾情分类映射表结合漾濞地震后灾区实际情况将地震文本分为正能量祈祷、动作状态、场景描述、预警信息、救援处置、震情信息和伤亡受灾七类主题如表 所示 为满足 模型训练的需要每条微博文本通过人工标注方式得到一个主题即每条训练文本对应一个地震主题表 微博主题分类表 主题分类主题描述正能量祈祷愿平安、希望平安、一切安好、平平安安、注意安全、保佑、山河无恙、祈祷、不要再有伤亡、保护好自己、大家平安、孩子们平安、一起加油、希望家乡没事、愿国泰民安、人民安好、祈祷两地都平安、天佑中华、愿安好、都要好好的、平安无事场景描述不停地摇晃、超市货物

15、散落顾客慌忙逃生、整栋楼都在摇、楼灯都晃了、灯晃的厉害、床在晃、感觉有人剧烈晃床、铁架子也开始晃、鞋都来不及穿跑了、房子在晃、床突然剧烈晃动、抱着被子往外跑、床和玻璃都在抖、被摇晃醒了、亲眼看见墙体在动、吊灯、鱼缸等晃动明显、路牌强烈的摇晃动作状态从楼梯跑下去、穿着拖鞋连忙跑下楼、抱头、吉他一丢就跑出门、救命、把我脸都吓白了、连震 次有点吓人、把我魂都吓没了、被吓得脚塌手软、心慌、好揪心、今夜惊吓不断、打开手机、下楼避险、编辑微博、晃得站不稳、在篮球场中央瑟瑟发抖、毫无睡意、心里有阴影了、手抖脚软、吓哭、以为头晕、摇醒、打地铺救援处置消防救援支队、消防救援、紧急倡议、救援人员、第一时间、组织抢

16、险救援、赶赴震区、安全知识、疏散转移群众、救援汽车、启动计划、搭建帐篷、救援指挥、救灾物资 车、消防员、救援部门、自救、抗震救灾、指挥部预警信息演练、逃生指南、警报声响、排练、手机提醒、小爱同学突然开始地震播报、手机收到预警震情信息震感强烈、刚刚震感好强、昆明震感明显、保山震感都很强啊、大大小小感受到了 次震感、临沧也震感强烈、震源深度、震了 次、眼睛刚闭上又震了、接连震了几次、正式测定、台网速报、新闻快讯、震感明显、震中、余震伤亡受灾造成伤亡、人死亡 人受伤、人员被困、人员伤亡、救治、造成轻伤研究方法基于新浪微博数据利用构建的卷积神经网络模型可从大量文本中识别出救援、伤亡和震情等与此次地震事

17、件相关的信息对地震数据集做分词和去停用词处理构建文本向量矩阵作为卷积神经网络的输入层自 然 灾 害 学 报第 卷通过不断测试和优化得到地震舆情信息提取结果最后将训练完成后的模型应用于新的地震数据集分类中.基于 的地震舆情信息提取随着深度学习技术的发展其已应用于不同研究领域如灾害信息自动提取与分类、空间情绪感知评价等 常用的深度学习算法包括卷积神经网络()和循环神经网络()对信息分类是依据整个文本或文本间存在较长的语义关系的词语加权和而 是将文本中具有明显特征的关键词或短语作为分类依据 微博数据以短文本为主具有口语化、碎片化等特点由于微博文本中包含了大量与地震舆情有关的特征词基于卷积神经网络构建

18、的多分类模型有较好的特征词识别能力且据研究 在文本分类中具有明显优势且比较稳定因此本文使用 提取地震舆情信息图 为主题信息提取流程图 地震主题信息抽取流程.微博文本特征信息获取文本向量矩阵是文本特征信息获取的重要部分主要思路为:图 微博文本向量矩阵结构.)读取地震主题相关语料库使用结巴分词工具对获取的微博文本进行分词、去停用词操作停用词是与本次研究无关、无实际意义的词比如“呀”、“啊”等语气词“这些”、“那么”等没有反映灾情的词)利用 软件 包的 模块构建 模型生成词向量空间 主要有 和 这 种模型基于微博数据的特点 模型适用于小语料库在处理效果上更具优势该模型通过对大量文本进行训练可依据当前

19、词计算出上下文的语义关系并以向量的形式表示 依据语料库使用 模型进行训练得到词向量空间)将每条微博文本单独分词这些词对应词向量构成了词向量列表根据列表转换为文本矩阵 由于微博文本不超过 个字符所以设置词向量维度为文本中的词汇从上向下排列长度不足的微博文本用“”补齐此方式解决窗口滑动时会遇到文本长短不一的问题 文本向量矩阵如图 所示第 期王晨雨等:基于深度学习的地震舆情信息提取及时空可视化.卷积神经网络模型构建与训练本文构建的卷积神经网络模型使用了基于 的 深度学习框架卷积层和池化层没有重复叠加结果表明简单的模型可防止过拟合达到最优效果如图 所示)输入层:将每条地震灾害相关微博文本分词嵌入词向量

20、中变量 和 分别为地震灾害微博文本和地震主题类别将训练文本对应矩阵输入到卷积层中)卷积层:利用固定窗口的过滤器对嵌入的词向量进行卷积过滤器的宽应与词向量维度一致设置窗口大小每次窗口覆盖连续的几个词 卷积可提取相邻的离散文本特征如单一词语“交通”、“中断”结合后的词“交通中断”作为新的特征词出现突出了文本中的震情信息这样的词还有很多如“震感”和“明显”等)池化层:池化是对卷积操作后的结果进一步筛选常用的池化方法有最大池化和平均池化研究表明最大池化的效果比平均池化好 本文使用最大池化使卷积后的输出值作为池化层的输入值输出矩阵中最大的元素为卷积之后具有最明显的特征)全连接层和分类层:把池化层的结果做

21、一个拼接加一个 非线性映射对标准主题分类与拼接结果求一个交叉熵损失损失值越小效果越好使用 函数计算输入文本的主题类别输出每个主题可能的概率值最终确定的地震主题为概率值最大的一类图 用于文本分类的 结构.辅助舆情分析方法基于提取的地震主题类别结合辅助舆情分析方法:热度分析、关键词挖掘和核密度估计等方法将震情可视化.地震热度分析方法对地震舆情热度进行量化分析统计每 内有关地震事件的讨论次数并结合不同时段的关键词进行分析其中微博话题热度微博点赞数评论数转发数将每次微博用户行为都视为一次热度微博文本特征提取的方法有词频逆文档()和信息熵等本文使用 分词的 算法进行关键词挖掘计算公式为:()()()式中

22、:为频率 为某个词 在文本 中出现的次数为数据集 中文本 包含特征词 的总数值越大表明该特征词对文本的贡献越大为逆文档频率表示一个特征词 在数据集 中出现的概率主要用于降低一些常见却对文档影响不大的词 为数据集中文本总数 为数据集中包含特征词 的文本总数.情感分析方法将大连理工大学信息检索研究室研发的中文情感词汇本体库作为基础词典综合考虑句法对语义表达自 然 灾 害 学 报第 卷的影响结合知网 否定词和程度副词词典构成一个新的地震舆情情感词典 每个词在每个情感下对应一个极性情感词的情感极性有“正面、负面、中性”三类情感极性大于 的赋值为 代表正面情绪情感极性等于 的直接作为中性情绪情感极性小于

23、 的赋值为代表负面情绪词汇的情感值如式():()式中:为词汇情感值 为词汇情感强度 为词汇情感极性由于情感词典中的情感词汇不只有一个情感分类和强度因此对于词语 的情感强度值使用式()计算设置初始权值 为 从第一个情感词开始权重 该情感词的情感值作为数量如与下一个情感词之间有程度副词程度副词的程度值如有否定词将()依次遍历每一条微博数据集中所有情感词由此判别出每一条微博所对应的情感 由于文本中可能存在多种情感共存的现象不能简单抵消或只取其一需要将情感词的情感分类归为七大类中某一类因此使用式()计算完成后可得到每条微博属于的 种情感向量集合 其中包含情感类别 和情感强度 ()()()式中:分别为好

24、、乐、哀、怒、惧、恶、惊 种情感、分别为 类情感词的强度和修饰该情感词的程度副词强度 为否定词个数 为情感词个数.核密度估计法核密度估计()是一种基于非参数密度估计的对点要素进行地理空间分析的方法其几何意义是以样本点 为中心计算每个样本点在指定半径范围内的密度值越靠近中心点处的密度越高 在地震主题研究中核密度估计值越大地震主题在空间上的分布就越聚集计算公式如式():()()式中:()为核密度估计值 为搜索半径 为核函数 为指定半径范围内的点数()为 个要素之间的估计距离地震主题信息精度评估基于.节七类地震主题信息人工阅读并标记了 条带有地理定位的数据做为训练样本每个主题对应 条数据由于“伤亡受

25、灾”类主题的微博数量不足 条故从新浪微博爬取青海发生.级地震热搜话题数据作为补充数据集数据采集时间范围为 年 月 日 时 分 日 时 分 将标记的主题数据按 划分为卷积神经网络模型的训练集和测试集训练样本划分为训练集和测试集以便构建误差最小的模型保证每个地震主题的完整性 本次研究主题信息分类通过召回率()、准确度()和综合评价指标()值 个指标进行衡量各项指标计算公式如式()式():精确度正确识别某主题类别文本条数识别为该类主题类别文本总条数()召回率正确识别某主题类别文本条数原有该主题类别下文本的总条数()综合评价指标值精确度召回率精确度召回率()表 文本主题分类精度评估 精度评估精确度召回

26、率 值.模型优化是神经网络训练的重要步骤通过多次迭代寻求最合适的参数其中词向量维度设为 滑窗大小设置为 丢弃正则化参数设为.设为 地震主题分类精度评估结果如表 所示 值处于精确度和召回率之间数值达到.整第 期王晨雨等:基于深度学习的地震舆情信息提取及时空可视化体精确度达到.说明模型在地震主题提取中有一定效果针对每个主题分别计算其精度评估结果据漾濞地震评估结果:精确度、召回率和 值都在 以上说明大部分文本内容可以被准确识别 为了对模型进行验证从青海玛多地震数据集中抽取 条人工标记的微博数据作为验证集对数据进行分词、去停用词以及文本向量矩阵转化等处理将 条文本输入主题分类模型中进行分类结果如表 所

27、示整体精度高于 主题“正能量祈祷”、“场景描述”、“震情信息”的精度达到 模型在新的地震数据集上也有较好表现说明分类器有自动提取文本特征的能力在灾害信息提取方面具有可行性表 漾濞地震和青海地震主题信息精度评估结果 主题类别漾濞地震精确度召回率 值青海地震精确度召回率 值正能量祈祷.场景描述.动作状态.救援处置.预警信息.震情信息.伤亡受灾.舆情分析及可视化.数据描述调用 中的结巴分词库、词频统计库等库对获取的地震数据进行中文分词和词频统计结合地震主题类别进行分析如图 所示 主题“正能量祈祷”的微博数量最多比例达 震后高频形容词“平安”出现 次位居第一“希望”一词出现 次与地震主题信息提取结果相

28、符图 漾濞.级地震主题对应微博数量及所占比例.表 漾濞地震高频特征词统计(排名前)()名词词语词频动词词语词频形容词词语词频云南救援平安大家发生平平安安今天希望一定一切应急注意安全消防预警多次你们看到紧急震中组织保佑自 然 灾 害 学 报第 卷 续表名词词语词频动词词语词频形容词词语词频人员赶赴安全我们造成突然中国警报安好学生受伤没有时间救出好好自己测定无恙震感自救天佑台网撤离心慌如表 所示主题“动作状态”占比 震后“下楼避险”、“在篮球场中央瑟瑟发抖”、“手抖脚软”等一系列动作状态表明当时公众害怕、惶恐不安 主题“场景描述”和“震情信息”分别占比 和 结合震后高频名词和动词统计结果:“救援”

29、一词出现 次、“应急”一词出现 次、“警报”一词出现 次、“震感”一词出现 次、“自救”一词出现 次表明无论何时我们都应该提高警惕面对突如其来的灾害不要慌张公众自身平时要多加防范此次地震出现人员伤亡情况政府及相关部门应提高重视宣传防震避震知识并做好应急措施以及预警预报.时序变化震后 地震微博热度达到 以 为单位分析地震讨论热度(从地震发生后登上微博热搜开始计算 为划分单元以此类推)对图中局部热度峰值进行关键词分析该峰值 内对应的微博博文作为分析对象 所得结果进行标注如图 所示 从图中可看出以 为划分单元的舆情热度时序讨论与实际地震舆情时序变化相符震后 一直保持较高的讨论热度震后 是话题讨论高峰

30、期热度值最高的为中国地震台网发布的官方震情、祈祷祝福、对震后救援的肯定、赞美随着地震事件在微博热度减小 次地震话题讨论度明显减少余震发生时会出现小的起伏 以一天 为区间来看热度变化随公众日常作息呈现出规律性变化凌晨 时舆情热度逐渐迅速下降凌晨 时之后舆情热度出现上升趋势一天内讨论热度最高时期为早晨 时前后和中午 时前后晚上 时前后也会出现话题讨论小高峰图 年 月 日 时 分 日 时 分地震讨论热度.为了进一步验证各类地震主题在实际减灾中的作用通过统计每个地震主题的数量变化得到各时段公众对地震的响应情况有助于了解地震舆情发展规律本文对 月 日 月 日 时间段之间的数据进行时序分析震后每个主题随时

31、间变化的趋势如图 所示直观反映了地震舆情基本情况和发展规律 从图中可知大部分微博主题数量随地震事件发生经历了较大起伏震后数小时微博数量居高不下余震发生后微博数量也会出现小高峰说明基于第 期王晨雨等:基于深度学习的地震舆情信息提取及时空可视化微博数据抽取地震主题与实际地震发生阶段相符 总体来看白天时段微博发布量略高于在晚上时段呈现出“昼多夜少”的特征地震发生后的 和次日上午微博数量最多夜间和下午微博发布量相对较少随着时间推移热度降低 月 日微博发布数量明显减少之后一段时间基本没有发布量“正能量祈祷”和“动作状态”个主题的微博数量最多震后地震亲临者和网友纷纷在微博传播正能量信息相互鼓励提醒大家注意

32、安全并宣传转发防震自救等相关微博 发布“场景描述”和“震情信息”的微博发布量也较多“震情信息”类微博在余震发生后会有所上升 用户名为“婷婷婷婷婷在这呢”发布微博:“一晚上震十几次 我真的太慌了 救命 看见整栋楼都在摇 我真的怕了!”此条微博包含了场景描述信息“整栋楼都在晃”和震情信息“一晚上震好几次”以及地震亲临者的感受“慌”和“怕”“救援处置”类微博数量增多趋势晚于“伤亡受灾”类微博主题随着救援工作持续进行救援和伤亡信息逐渐减少民众情绪得到平复 此次大理漾濞地震震级较大影响范围广存在人员伤亡通过不同的地震主题变化趋势有助于从多角度分析震后舆情演变图 年 月 日 时 分 日 时 分地震主题时序

33、变化.空间分布特征为了直观地震后公众舆情态势运用地理统计分析方法筛选出大理白族自治州范围内带有地理定位的微博数据对网友发布的微博进行解析发现微博数量空间分布总体呈现出不均衡的特征大理白族自治州微博数量最高的地区为大理市其次为发震地点漾濞彝族自治县距离震中较远的鹤庆县、南涧彝族自治县微博数量最少 主要原因是大理市经济发达信息传播快有大理古城、苍山洱海等著名景区当地民众和外来旅客聚集公众对热点事件关注度高震后通讯设施未受到重大破坏微博数量较多漾濞彝族自治县附近地区由于无线电通讯设备受损信号中断影响震区民众与外界联系加之人口密度低微博发布量较少图 年 月 日 时 分 日 时 分地震舆情空间分布.由图

34、 微博核密度空间分布可知漾濞地震舆情高值区为大理市距离震中较近的漾濞彝族自治县城区、区域、区域 的核密度值也较高区域、区域、区域、区域 虽远离震中但也表现出较周围区域更高的密度分布震后灾区开展应急管理时地震舆情高值区可为政府把握舆情信息、合理分配救灾物资提供重自 然 灾 害 学 报第 卷要参考加强对该区域的地震监测和震情管理可在震后黑箱期内预防意外发生带有定位的微博数据包含了地理位置一条微博文本对应一个地震主题类别故每条微博可被认为是带有一个主题的实体点.节微博主题时序变化抽取微博数量最高的 个时段:日 时 日 时、日 时 日 时、日 时 日 时作为研究对象结合 个时段对应情感类别分析地震舆情

35、如图()所示震后第一个时段该时段微博主题数量多且分布范围广具有分散性整个大理白族自治州除云龙县和鹤庆县都有分布主要集中在大理市和震中附近地震主题以“正能量祈祷”和“动作状态”为主永平县和宾川县出现主题“救援处置”抽取这一时间段微博主要关键词:“云南”、“震中”、“大家”、“余震”等表明此次地震对公众的影响较大漾濞.级地震前后又发生数次余震此时网友的情绪主要表现为恐惧、愤怒分别占比、怀疑情绪占比达 如图 所示人们比较担心是否还会有重大地震和余震发生震后部分网友通过关注中国地震台网、云南省地震局等官方微博了解最新震情 如图()所示震后第二个时段地震主题主要集中在大理市“震情信息”、“动作状态”和“

36、场景描述”等主题明显减少云龙县、弥渡县、剑川县出现“正能量祈祷”主题结合关键词“抗震”、“避震”、“救援”、“安好”等可知震后公众情绪逐渐恢复祝愿和安心情感占比增加怀疑和恐惧情感占比明显减少震中附近区域和大理市还存在主题“救援处置”结合关键词“抢险”、“救援”、“帐篷”等表明震区还需要一些应急物资这是震后对个人需求的满足是对震后精准救援的直接反馈 震后第三个时段见图()各类主题信息明显减少并聚集在大理市公众发布正能量祈祷信息居多结合关键词“平安”、“安好”、“希望”等可知震后人们“祝平安”“报平安”为灾区祈祷互相鼓励、安慰如图 所示从情感占比角度看祝愿和安心情感达 从侧面说明了公众对震后救援取

37、得成效的肯定值得注意的是该时段悲伤情感占比 虽然震后救援保障了灾区民众生命安全但地震造成的持续性心理伤害却没有减退因此将地震主题信息与公众情感相结合有助于政府关注震区情况及公众的心理变化为震后灾区应急管理提供一定参考图 不同时段地震主题的空间分布.图 不同时段各情感类型占比.年 月 日云南省地震局发布了云南漾濞.级地震烈度图此次地震的最大烈度为 度(度)对大理白族自治州 个县市造成严重影响 将主题信息与地震影响场、交通路网等数据结合(所涉第 期王晨雨等:基于深度学习的地震舆情信息提取及时空可视化及的交通路网数据根据高德地图的路网栅格底图矢量化得到)分析不同类别地震主题在应急管理中的作用 如图

38、所示地震主题主要集中在震中所在的漾濞彝族自治县、大理市、祥云县、宾川县等县城、乡镇及道路沿线区域呈条带状和团块状分布:条带状即主要沿交通路网分布通过大理市的 国道、连接大理市和漾濞彝族自治县的 国道保证了震后救援的通达性大理市、永平县和宾川县等地区的微博呈团块状分布在城区附近 通过地震烈度区可以确定地震影响范围在烈度 度区内漾濞县城受此次地震影响最大出现最多的主题为“正能量祈祷”和“救援处置”由于距离震中近震感强烈地震造成的破坏较严重应划为震后救援重灾区秀岭村及西北部发布的“救援处置”信息最多震中多山环绕的复杂地形可能会加剧二次灾害发生也加大了救援工作难度因此震后应根据主题“救援处置”的位置做

39、出应急响应以减少人员伤亡 在烈度 度区内太平乡以及平坡镇附近村庄发布的主题多为“正能量祈祷”、“动作状态”在烈度 度区内大理市的主题信息分布最为密集大理古城、大理苍山世界地质公园、太邑彝族乡、村落瓦世恒等附近均出现主题“正能量祈祷”和“动作状态”震后公众“抱头”、“下楼避险”、“打开手机”等一系列动作反应表明震后公众自救意识强这与政府日常宣传防震抗震自救等知识密切相关 花椒箐隧道和双廊镇附近出现主题“场景描述”结合微博内容多为游客发布的舆情信息 月 日 时 分微博用户名为“有妖眸的巫婆”发文称“双廊古镇感受强烈震了好几次最明显的那次整个地都在晃”可见当时双廊镇震感明显器物、建筑物出现明显晃动

40、在烈度 度区外村落白马庙和庙前村出现主题“救援处置”东山国家森林公园均出现主题“动作状态”大甘庄出现主题“伤亡受灾”救援医疗队应在震后第一时间赶往该区域进行伤亡救援 利用同样的方法可为其他灾区灾情监测、应急处置提供决策依据图 地震影响场主题信息空间分布.结论与展望本文基于微博平台爬取包含文本、时间、位置的数据通过人工判读和数据处理软件对数据进行结构化整理便于后期分析研究 结合灾情信息分类知识阅读微博文本判别不同类型的地震主题信息对带有地理定位的数据集进行标记 以 年 月 日“大理漾濞.级地震”事件为例构建了一个基于 模型的主题信息提取流程框架通过设置不同参数对模型进行优化训练整体精度达到 以上

41、各个主题精度也达到预期效果 将新获取的青海地震数据集输入模型进行验证 次地震验证结果说明该模型在灾害主题信息提取中具有可行性最后将地震舆情可视化得出以下结论:自 然 灾 害 学 报第 卷)时序变化:地震主题时序变化反映了震后各阶段舆情关注点的变化大部分地震主题随地震事件的发生产生较大起伏主题“正能量祈祷”数量最多比例达 余震发生后微博数量会出现小高峰总体呈现出“昼多夜少”的特征与实际地震发生阶段相符)空间特征:地震主题信息分布范围广具有分散性随着时间推移地震事件在微博的热度逐渐消退更多主题信息集中在大理市 不同市(县)区域对地震主题的关注度不同越靠近震中公众对地震事件的响应程度越高 微博数量除

42、与地震事件影响范围外还与经济水平、交通便捷程度、人口密度有密切关系本文提出的利用卷积神经网络提取地震主题信息并分类的方法对地震主题进行了更细粒度划分这些地震主题信息是人本身对灾后舆情的直接反馈深入挖掘主题信息有助于把握公众舆情倾向弥补震后心理危机干预快速增长的需求更有针对性的安抚受灾民众疏解重大灾害带来的心理恐慌提高公众心理应急能力提升社会救援效率为震后灾情研判、救援部署提供重要参考同时也为其他地区灾害事件监测和应急管理提供新思路 结合各时段文本关键词、公众情感情绪有助于政府关注震区情况及公众的心理变化为震区应急管理提供参考尽管此研究方法在救援减灾中具有很好的效果但还存在一些不足:仅仅依靠微博

43、数据分析地震舆情具有单一性后期可将手机信令、抖音等多源数据综合考虑进行分析震后并非每位网友发布微博时都会开启定位导致用于空间分析的地理位置数据不全面后期考虑智能化算法提取文本中可能包含的位置信息参考文献:刘耀辉 刘婉婷 张文焯 等.基于新浪微博数据的云南漾濞.级地震舆情时空特征及情感分析.自然灾害学报 ():.():.()刘磊 赵东升 朱瑜 等.年我国大陆地震灾害损失的时空特征.自然灾害学报 ():.():.()李亚芳 王新刚 梁庆云.基于新浪微博大数据的新疆伽师.级地震舆情分析及可视化研究.内陆地震 ():.():.()毛振江 吕佳丽 曹彦波 等.四川九寨沟.级地震微博灾情信息特征分析.华南

44、地震 ():.():.()聂高众 安基文 邓砚.地震应急灾情服务进展.地震地质 ():.():.()中共中央网络安全和信息化委员会办公室.中国互联网络中心().:年第 次中国互联网络发展状况统计报告/.().:/./.().:/():/./.().():.李想 刘纪平 罗安 等.面向微博的灾害类事件地址提取与空间定位方法 以地震事件为例.测绘与空间地理信息 ():.:.():.()郑嵘 张晨晓 乐鹏 等.基于微博的灾害信息快速提取方法研究.测绘地理信息 ():.():.()曹彦波 毛振江.基于微博数据挖掘的九寨沟.级地震灾情时空特征分析.中国地震 ():.():.()徐敬海 褚俊秀 聂高众 等

45、.基于位置微博的地震灾情提取.自然灾害学报 ():.第 期王晨雨等:基于深度学习的地震舆情信息提取及时空可视化 .():.().:.:.杨腾飞 解吉波 闫东川 等.基于深度学习的社交媒体情感信息抽取及其在灾情分析中的应用研究.地理与地理信息科学():.():.()曹彦波.基于社交媒体的地震灾区民众情绪反应分析.地震研究 ():.():.()万岩 杜振中.融合情感词典和语义规则的微博评论细粒度情感分析.情报探索():.():.()林筱妍 吴升.基于语义规则和词向量的台风灾害网络情感分析方法.地球信息科学学报 ():.():.()张岩 李英冰 郑翔.基于微博数据的台风“山竹”舆情演化时空分析.山东

46、大学学报(工学版)():.“”.()():.().().:.:.赵高锋 杨彦春 张树森 等.汶川地震极重灾区 名受灾群众心理状况调查.中国循证医学杂志 ():.():.()罗兴伟 高雪屏 蔡太生 等.汶川地震亲历者心理健康状况调查.中国临床心理学杂志 ():.():.()范方 柳武妹 郑裕鸿 等.震后 个月都江堰地区青少年心理问题及影响因素.中国临床心理学杂志 ():.():.()耿富磊 范方 张岚.汶川地震后 个月都江堰地区青少年睡眠问题共患、抑郁、焦虑状况.中国临床心理学杂志 ():.():.()付琳 程锦 刘正奎.芦山地震后儿童急性应激障碍症状、创伤后应激障碍症状与抑郁症状的交叉滞后分析

47、.中国心理卫生杂志():.():.()李洁 郭建雄 徐文军 等.四川汶川地震伤员的心理卫生状况调查.中国神经精神疾病杂志 ():.():.()高茹 吴俊林 张炳智 等.芦山地震后 年雅安市受灾居民心理健康状况及其相关因素.中国心理卫生杂志 ():.():.()吴蔚.新冠肺炎疫情中的心理危机干预:基于汶川地震心理危机干预的启示.中国应急管理科学():.:.():.()杨艳杰 乔正学 邱晓惠 等.地震灾区青少年学生心理健康状况调查.中国公共卫生 ():.():.()谭友果 甘枝勤 刘成文 等.汶川地震后低年级小学生心理状况及连续 年心理干预分析.四川医学 ():.():.()自 然 灾 害 学 报

48、第 卷 胡丽 赵玉芳 苏亮夫 等.汶川地震后中学生心理健康状况与心理干预的关系.西南农业大学学报(社会科学版)():.()():.()张晓林.地震灾后中学生心理健康发展的体育干预作用机制研究.西南师范大学学报(自然科学版)():.()():.()于红军.汶川地震后幸存人员心理危机干预方法研究.灾害学 ():.():.()王云峰 丁晓茜.地震灾害后频繁余震对群众心理应激情绪影响建模分析.灾害学 ():.():.()谢正 常亮 付鹏钰.汶川地震现场心理干预技术的实施及影响因素.神经疾病与精神卫生 ():.():.()吕建国 刘勇 杨曦 等.汶川地震灾后 例急性应激反应心理危机干预综合分析.成都医学

49、院学报 ():.():.()向明芳 王国蓉 黄敏 等.住院地震伤员的应激反应与干预效果探讨.中华物理医学与康复杂志 ():.():.()李亚云.我国应急管理心理危机干预的政府推进策略探论.理论导刊():.():.()杨一 石远鹏 张晓林.汶川地震灾后心理干预研究进展与展望.成都理工大学学报(社会科学版)():.()():.()何江新 许志国 李一璇.突发重大公共事件中政府在心理危机干预机制构建的作用研究.西安科技大学学报 ():.():.()曹蓉 刘奕.应急管理心理干预的政府角色探析.中国行政管理():.():.()宋晓明.重大突发事件心理危机干预长效机制的构建.政法学刊 ():.():.()

50、.:.:.杨辰 潘顺 严岩.基于自然语言识别的上海市报警灾情数据识别及其气象灾害特征分析研究.自然灾害学报 ():.():.().:.():.陈瑗瑗 高勇.利用社交媒体的位置潜语义特征提取与分析.地球信息科学学报 ():.():.()谭永滨 侯梦飞 张志军 等.基于模式匹配的交通微博文本位置信息提取模型.地理与地理信息科学 ():.():.()王艳东 付小康 李萌萌.一种基于共词网络的社交媒体数据主题挖掘方法.武汉大学学报(信息科学版)():.():.()第 期王晨雨等:基于深度学习的地震舆情信息提取及时空可视化 马莹雪 赵吉昌.自然灾害期间微博平台的舆情特征及演变 以台风和暴雨数据为例.数据

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服