收藏 分销(赏)

现代化书院未来发展策略研究_钱姊怡.pdf

上传人:自信****多点 文档编号:593309 上传时间:2024-01-10 格式:PDF 页数:3 大小:1.86MB
下载 相关 举报
现代化书院未来发展策略研究_钱姊怡.pdf_第1页
第1页 / 共3页
现代化书院未来发展策略研究_钱姊怡.pdf_第2页
第2页 / 共3页
现代化书院未来发展策略研究_钱姊怡.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、164 国际公关前 沿基金项目:徐州工程学院大学生创新创业训练计划重点项目“快节奏时代下历史书院的现代化发展策略以徐州市各级书院为例”(项目编号:xcx2022175)阶段性研究成果。作者简介:钱姊怡,女,汉族,江苏苏州人,本科在读,研究方向:应用统计学;张金玉,女,汉族,江苏南京人,本科在读,研究方向:应用统计学;韩秀,女,汉族,江苏徐州人,博士,数学与统计学院副教授,研究方向:统计建模与统计计算。现代化书院未来发展策略研究文钱姊怡 张金玉 韩 秀 徐州工程学院 江苏徐州 221018摘要:书院在千余年的发展过程中凝结和创造了辉煌的书院文化,成为推动中国传统文化普及、创新和发展的重要力量。本

2、文以徐州书院为例,基于文本挖掘法,建立了 LDA 模型,对书院游客网络评价进行情感主题分类,研究游客对于书院文化旅游的看法和评价,了解游客直观感受和潜在需求,提出书院发展策略。关键词:书院文化;书院文旅 IP;LDA 模型在文化旅游方面,书院具有极大的开发价值。我国历史上的书院多建立在依山傍水之地,虽然大多建筑在历史中损坏严重,但仍遗留大量古碑、古树等。现今留存的书院经过一系列的修缮和恢复,也能成为陶冶情操的旅游胜地。而书院文化对当今社会仍有极大的学习价值,书院文化的内在精神对当今社会的人极具文化熏陶作用。1一、基于LDA模型对游客评价分类(一)模型介绍LDA 是一种文档主题生成模型,是通过“

3、以一定概率选择某个主题,并从这个主题中以一定的概率选择某个词语”这样的一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。它采用了词袋的方法,每一篇文档包含词、主题和文档三层结构。2所谓生成模型是指,认为一篇文章的每个词文档视为一个词频向量,从而将文本信息转化为易于建模的数字信息。(二)模型构建1.Step1:评论数据预处理(1)数据获取本文采用网页爬取软件 GooSeeker(集搜客)对当下比较受欢迎的网络平台的游客评论文本数据进行爬取,具体的游客网络评论的数据构成详见表 1。表1 评论数据采集网络平台数据量(条)携程旅游网1 652同程旅游网530小红书456抖音592合计3

4、230DOI:10.16645/11-5281/c.2023.12.018PR Magazine 165数据获取首先要选择定义爬虫类,包括根据目标爬虫各自合适的应用场景去选择爬虫种类,设置一个初始 url,并生成一个能够请求的“解析”方法,最后在 item 类里得到了爬取的 3230 条信息和15 个相关主题帖子。(2)数据预处理本次预处理的主要工作是清除噪声序列和消费者随意发表的无意义数据,处理规则如下:a.评论文本内容与用户名均相同的数据视为水军发表的,予以删除。b.评论内容完全为英文字母、数字和标点符号的,视为随意发表的评论,予以删除。c.评论内容中出现重复的词语需要进行压缩,避免影响词

5、语频数统计。通过数据预处理,将原始数据中存在的噪声去除,得到高质量、规范化以及可以进行后续分析的 3030 条有效数据。2.Step2:自动分词为了判断句子中是否存在情感词典中相应的词语,需要把句子进行自动分词。我们对比了现有的分词工具,综合考虑了分词的准确性和在 Python平台的易用性,最终选择了“结巴中文分词”作为分词工具。3.Step3:训练情感词典训练感情词典是文本挖掘核心的部分,分为四个部分:积极情感词典、消极情感词典、否定词典以及程度副词词典。为了得到更加完整的情感词典,从网络上收集了若干个情感词典,并且对其进行整合去重,同时对部分词语进行了调整,以达到尽可能高的准确率。3除了对

6、网络收集而来的词典进行整合,还有针对性和目的性地对词典进行了去杂、更新,加入了某些行业词汇,以增加分类中的命中率。由于某些评论中出现多个感情词时情感词典的文本情感分类规则会较为机械化,为了使分类结果更加精确,设置权重累加判断程序。在假设所有积极词语、消极词语的权重都是相等的、权值是线性可叠加的以及不区分感情词程度的情况下,将每个积极情感词语赋予权重 1,将每个消极情感词语赋予权重-1,并且假设情感值满足线性叠加原理;接着将句子进行分词,若分词后的词语向量包含相应的词语,就加上向前的权值。其中,否定词和程度副词会有特殊的判别规则,否定词会导致权值为负,而程度副词则让权值加倍。最后,根据总权值的正

7、负性来判断句子的情感。(三)模型结果1.书院旅游网络评论情感倾向将数据分为积极和消极两个类别,依靠关键词限定,按照一定的规则进行聚类,再加以判别分析进行检验,得到整合结果详见表 2。利用 Python 进行信息爬虫,其中有效信息为 65.3%。表中可以看出在积极方面,游客评论多为“推荐”“不错”“赞”等,说明其游览满意度较高,对徐州的书院文化评价也较高;而观察消极方面,游客评论多为“无趣”“无聊”等,说明书院现有文化活动不足以吸引游客,传统的开放方式对游客没有足够的吸引力,由此可见,书院文化内涵需要进一步丰富;而“过时”“古板”则说明徐州部分书院的发展不符合现代化需求,需要创新思想。表 2 口

8、碑分类表词频顺序积极消极1推荐不好2不错过时3赞无聊4很好古板5美无趣6喜欢失望2.基于口碑指数对网络评论分析为了更科学地进行数据可视化分析,我们引入受到广泛认可且简单易行的口碑指数概念。4这是通过分析产品的评论综合计算得出的参考数值,这种方法与大数据技术获取网络舆情数据相结合,与当前实际情况有相当吻合度,在前期进行数据处理且分类严谨,可对徐州的书院文化旅游满意度进行粗略评估。其计算公式为:100其中,为口碑指数,Np和 Nn分别为正面情感评论数和负面情感评论数。书院的口碑指数为 78%,整体口碑情况较好,说明游客对于徐州书院的总体态度是比较满意的,但是仍然存在22%的评论属于负面评论。上述

9、LDA 模型对于书院游客的观感进行情感分类,此处口碑指数是对书院总体口碑情况进行综观,由此得到游客对于徐州书院文化旅游的情感倾向和整体评价情况。3.基于词云分析对评价的数据统计(1)方法介绍词云分析是对文中出现频率较高的“关键词”予以视觉化的展现,通过滤掉大量的低频低质的文本信息,呈现出直观的文本主旨结果。词云分析通常通过爬虫技术实现。5徐州各大书院中,以云龙书院最为著名,为得到更为精准详尽的评论导向,本文爬取各大网络平台中以“徐州书院”和“云龙书院”为关键词的相关评论和相关文章进行文本挖掘。(2)词频统计&词云绘制在中文分词之后,本文对分词结果进行了进一步的处理,由于有些词语是一些没有意义但

10、是使用频率又非常高的词语,本文将“此外”“如今”“作者”“近年来”“然而”“图片”“另外”“然后”等词语删除,在词频统计的时候不会计入上述词语。在 Python中,建立一个待删除的字典 A,使用 for 循环将文本中的所有含字典 A中内容的词语删除。待分词数据处理好之后,用 Python 的wordcloud 包进行词频统计。词频统计之后,就可以制作词云。用爬取的网络数据评价得到的结果并绘制词云图,详见图1。166 国际公关前 沿图1 书院游客评论词云图通过词云绘制的结果,可以对徐州书院网络评价进行归纳总结:a.徐州汉文化城市形象已经深入人心,在对书院的评价中“汉文化”“古风”“书香气”等字眼

11、层出不穷,由此可看出徐州城市文化底蕴深厚,为大力发展文化旅游产业提供发展契机。b.书院讲学文化是一把双刃剑,一方面,书院讲学能够将国学文化进行传播和推广,对弘扬传统文化有一定的积极作用;另一方面,游客对于书院的刻板印象难以改变,多数游客对于书院仅仅停留在“国学文化”“讲学”“古代”等印象中,现代书院的发展已经明显不同于传统讲学书院,该刻板印象对书院的现代化发展有着一定的阻碍作用。c.从词云图中可以看出“地标”“旅游”等词重复出现,这说明游客对于徐州书院的认识上升为“城市地标”,这对打造书院文化旅游 IP具有良好的促进作用。二、书院发展策略(一)政府支持和“书院造血”相结合政府主要可以从两方面来

12、支持未来书院的发展:一是提供资金支持,二是对书院发展进行指导,带领书院举办多元活动,以便书院的可持续发展。由于书院活动大多为公益性活动,经费筹集较为困难,政府的资金支持能让书院有更多的经费举办活动,更好地推广书院文化。但以政府的资金支持维护书院运营并不是长久之计,这就需要书院利用自身文化优势开发相关产业,建设书院自身“造血”系统。政府可以通过联合各地书院与当地书院举办多元活动,帮助书院突破活动的局限性。(二)创新宣传方式文旅市场需要进一步发展,需要改变传统的宣传方式,积极利用网络开展宣传,同时开展口碑宣传,通过游客口口相传,达到提高书院文化旅游影响力的目的,增加潜在游客对徐州书院文化旅游的了解

13、。未来书院的宣传方式需要创新性思维,改变书院宣传缺乏活力的现状,为书院发展提供更好的环境。未来书院的宣传方式可以从两方面进行:一是基于现有的宣传方式,对现有的宣传平台进行创新,推送更为新颖且有吸引力的宣传内容,突出书院文化的特点,找准书院文化吸引大众的创新点;二是创新宣传方式,很好地抓住对书院文化感兴趣的现有及潜在游客。(三)打造品牌,开发产业链书院产业链的延伸开发是书院未来发展的长久之计,能更好地推动书院文化的弘扬。开发产业链要从书院本身延伸出去,一是从各书院的自身特点出发,如书院建筑物特点等,将书院特点进行产业化,让其得到物化、产品化,更好地将书院特点宣传出去;二是从书院的内涵文化出发,将

14、其文化内涵进行产业化,例如,可将书院人文故事动漫化,能够让大众更好地理解与接受,也起到了相应的宣传作用,从而更好地弘扬书院文化。发展书院文创产品,形成书院文化产业链。三、结束语本文建立了LDA 模型,对书院的网络评价进行情感主题分类,对游客的评价及需求进行分析,并提出适合书院未来发展的策略。书院需创新宣传方式,打造书院品牌,开发产业链,运用适当的方法将其市场化,生产出相应的文化产品。发展书院文化产业,挖掘书院的文化旅游价值,既能对我国的书院文化进行传承,也能为书院创造相应的经济价值。参考文献:1 艾会雨.保定市旅游产业和文化产业耦合协调发展研究D.保定:河北大学,2019.2 张学民,赵明宇.基于LDA和情感分析的西塘古镇旅游形象研究J.河北工业大学学报(社会科学版),2020,12(3):23-30.3 曹青.基于LDA模型的湖南特色旅游线路设计D.北京:北京工业大学,2019.4 季鹏飞,王先超,张顺香.基于共现概率训练的情感词典的扩充J.阜阳师范学院学报(自然科学版),2019,36(04):49-53.5 李向宇.基于词云分析的近5年核心期刊幼儿体育文献研究现状J.运动,2014(05):79-81.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服