1、第 53 卷 第 4 期 总 第 236 期2023 年 7 月20232023年第年第4 4期期图书馆研究图书馆研究(Library Research)文天祥研究古籍及民国时期文献平台建设*胡玮(井冈山大学图书馆,江西吉安343009)摘要 吉安是庐陵文化的发祥地,文天祥是庐陵先贤的杰出代表,开展文天祥研究相关文献特别是古籍的整理、发现和挖掘等工作来推动庐陵文化的研究,意义非常重大。从拓展研究资源来源、规范数据标引内容、整合补充文献信息、选择采用B/S模式+MySQL数据库技术、应用React18软件灵活配置前端展示内容和应用NestJS9软件高效扩展后端技术6个方面构建一个特色资源集成平台
2、,平台具有个性化检索、汉字简繁体规范检索和按需同屏展示、自动和按需显示检索结果、浏览式导航、延伸应用等5项主要功能,展示了平台的创新之处,使该平台能充分发挥古籍检索、阅览、学习、研究和溯源等作用。关键词 文天祥研究;古籍;民国时期文献;平台建设中图分类号G250.7文献标识码A文章编号2095-5197(2023)04-0042-08The Construction of Wen Tianxiangs Research Platform for Ancient Books and Literature ofthe Republic of ChinaHUWei(Library of Jingga
3、ngshan University,Ji an 343009,China)Abstract:Jian is the birthplace of Luling culture,and Wen Tianxiang is an outstanding representative of the ancestorsof Luling.It is of great significance to carry out research on literature related to Wen Tianxiang,especiallythe organization,discovery,and excava
4、tion of ancient books,to promote the study of Luling culture.This paper explores to build a featured resource integration platform from six aspects:expanding research resourcesources,standardizing data indexing content,integrating and supplementing literature information,selectingB/S mode+MySQL data
5、base technology,applying React18 software to flexibly configure front-end displaycontent,and applying NestJS9 software to efficiently expand back-end technology.The platform has fivemain functions:personalized search,simplified and traditional standard retrieval of Chinese characters andon-demand on
6、-screen display,automatic and on-demand display of search results,browsing navigation,and extended applications,which demonstrates the innovation of the platform,enables it to fully leverage thefunctions of ancient book retrieval,reading,learning,research,and tracing.Keywords:Wen Tianxiangs research
7、;ancient book;literature of the Republic of China;construction of research platformCLC number:G250.7*本文系江西省吉安市社会科学研究规划项目“文天祥研究古籍及民国时期文献平台建设”(项目编号:23GHB660)成果。信息资源建设4220232023年第年第4 4期期第 53 卷 第 4 期 总 第 236 期2023 年 7 月1引言2022年4月25日,习近平总书记来到中国人民大学考察调研。中国人民大学图书馆收藏着许多古籍,总书记在这里强调,深入挖掘古籍蕴含的哲学思想、人文精神、价值理念、道德
8、规范,推动中华优秀传统文化创造性转化、创新性发展1。吉安古称庐陵,享有“文章节义之邦”的美誉。吉安是庐陵文化的发祥地,研究人员应开展庐陵名人研究方面的文献整理、发现和挖掘等重要研究工作来推动庐陵文化研究。文天祥作为庐陵名人代表之一,不但是一位伟大的民族英雄,也是一位杰出的爱国诗人。文天祥(12361283),初名云孙,字天祥,后改字履善,又字宋瑞,号文山,小字从龙。吉州庐陵郡军事庐陵淳化乡富田魁巷村(今吉安市青原区富田乡文家)人。南宋宝祐四年(1256)丙辰科状元2。相关文天祥研究的文献从宋代开始一直持续到当前,涉及的知识点有民族英雄、浩然正气、江西名人、庐陵名人、爱国诗人等。普通高等学校图书
9、馆规程 提出高校图书馆应积极参与各种资源共建共享,发挥信息资源优势和专业服务优势,为社会服务3。为推动庐陵文化的建设和研究,研究人员应将文天祥研究的文献特别是古籍文献进行整理,形成特色资源集合。本研究旨在解决将不同来源的文天祥研究古籍及民国时期文献进行搜集、整理、标注和校准,形成统一标准的特色资源集合,应用平台与数据库技术来建设资源平台,方便读者进行个性化检索、信息整合和发现等研究,满足读者快捷、精准阅读和开展古籍专题研究的需求,达到挖掘古籍资源蕴含的优秀元素的目标。2文献研究现状2.1资源类型笔者应用“文天祥”检索词在学习通平台进行检索,检索时间:2023年5月31日,检索结果:期刊文献(4
10、 976篇)、图书书目(699册)、电子书(97册)、报纸文献(1 020篇)、学位论文(85篇)、会议论文(128 篇)、故纸堆(738 册)、文史资料(147份)等。从研究的资源类型看,现代的文天祥研究文献在各大资源平台上都有详尽的展示,但是文天祥研究的古籍和民国时期文献相对较少,一些文献资源展示的信息也不多,资源也较分散。纸质古籍的学习和查询受制于其阅读和检索等方面的限制,可能难以满足读者快捷准确获取资源的需求,建设数字化古籍研究平台应是一个很好的解决方法。2.2研究主题当前,古籍研究平台建设的文献研究现状有:一是数字人文建设。覃熙4提出数字人文利用信息技术对文献的深度挖掘、文本处理、地
11、理空间分析、社会网络分析、群体分析和统计分析,将成为古籍研究的一种新范式,以及新的思维理念及方法。鞠孜涵5提出数字人文视域下,基于数据的细粒度管理,融合关联数据、地理信息系统、机器学习等新兴技术来进行古籍数据库建设。潘雨亭6提出将数字人文应用在古籍研究与推广中,研究构建了人文领域研究可以通用的数字人文方法框架,详细论述古籍文献中数字人文方法的应用,对每个环节的应用场景分类表述。二是建设技术。王镇7提出利用大数据技术搭建聚合型古籍资源数字化平台。孙宁8采用Laravel框架进行项目开发。三是数据库建设。万亚萍9提出运用现代技术对藏书印记图像进行采集加工,并以数字格式进行存储,来建立藏书印数据库。
12、胡蕊10提出通过数字化技术更好地完成对古籍的管理、检索和保护,通过扫描、拍照等技术将古籍信息转化为数字化信息。杨其霖11提出中医药古籍文献数据库建设为元数据加工、图文关联、数字化处理、构建服务平台、版权维护等过程。四是数据库技术。孙瑾12以KBASE,即信息资源建设胡玮:文天祥研究古籍及民国时期文献平台建设43第 53 卷 第 4 期 总 第 236 期2023 年 7 月20232023年第年第4 4期期图书馆研究全文检索服务器为核心,采用B/S浏览器的检索方式和先进的C/S 架构,能够同时管理文字、图片、多媒体等形式的信息,并提供全文检索服务。张毅13提出采用开源软件和数字人文技术进行西文
13、古籍数据库开发。五是古籍知识库建设。张杰14提出将古籍文献中所蕴藏的古代历史文化知识抽取出来,构造成各种各样的知识库,以知识图谱的形式支持互联网前端应用。这些文献探讨了建设数字化古籍研究平台的各种方法。2.3平台建设情况当前,古籍研究平台建设情况主要有:第一,数据方面主要是来源不同的文献,标引不统一;第二,一些古籍数据存在信息缺失、信息不准的情况;第三,部分平台建设技术有时还是沿用比较陈旧的技术,没有与时代同步;第四,检索结果的呈现方式比较固定,个性化程度不高;第五,资源建设的内容较多,具体的平台建设技术的研究较少。本研究分别通过从资源建设和技术建设两个方面来进行探索,并提出平台建设的创新之处
14、。3平台建设的价值与技术创新之处基于资源建设的目标,本研究采用:一是拓展检索词。不仅选择“文天祥”为检索词,还选择与“文天祥”相关的名称,如“文山集”“文信公”“指南集”等为检索词,构建科学的检索策略,尽可能将文天祥研究的文献收集完整;二是制定基本统一的能概括记录信息的标引内容。集中整合来自不同渠道、不同模式的异构文献,进行规范化处理。按照检索结果的标引项目,整合重复记录和标引,补充缺失的标引项目;三是丰富资源来源。科学进行资源信息考证,准确补充缺失的信息;四是建立文献质量评估体系。制定文献筛选标准和概括文献信息的著录项,确保平台数据库收录文献的标准和完整。基于技术建设的目标,本研究采用B/S
15、模式+MySQL数据库技术、应用React18软件的灵活配置前端展示内容和应用NestJS9软件的高效扩展后端技术,建立一个高质量、全面、翔实的特色资源平台。该平台具备检索快捷和准确的特点,便于读者浏览和检索。3.1资源建设3.1.1丰富资源来源资源主要来源于常用的古籍数据库、综合性数据库中的古籍专库和文天祥研究的专业网站,按照不同数据库的应用指南,科学选取检索词,设置检索策略,将检索的资源进行汇总。同时根据主题文献研究的线索,不断发现新的资源来源渠道,进行资源的搜集和补充。3.1.2科学整合资源数据资源数据的整合主要是对检索到的资源进行清洗、标引和规范处理的过程。数据清洗是从数据的完整性、重
16、复性、缺失性、正确性等方面进行整理,对于缺失的记录进行匹配补充,对于标识不清楚的记录进行校准,对于重复的数据进行详细比对,然后删除信息量少的数据。在统一标引结构的规范下,做好明晰模糊数据、清洗相同数据的工作,形成标准、统一的数据记录。数据标引是对文献的主题内容和某些具有检索意义的特征给予标记的过程15。将不同的来源的数据基于知识、逻辑、功能等特征进行规范处理,形成规范、整齐、详细的数据记录集合。本研究根据数据的内容属性,将可以检索的属性进行特别标注,设置了“朝代、年号、书名、作者、总卷册、分卷名、分卷册、内容、页码”等数据标引内容。同时,为了提高用户的检索效率和使用体验,建立一套完善的数据标引
17、规范和审核机制,对标引结果进行专业的质量检查和修正,确保数据记录的准确性和完整性。通过以上方式建立高效、规范、用户友好的数据标引系统,为数据整合和管理提供数据基础。数据规范整理采取应用上海图书馆的开放数据平台发布的人名规范库16、中国历史纪年信息资源建设4420232023年第年第4 4期期第 53 卷 第 4 期 总 第 236 期2023 年 7 月表17、地理名词表18等人文词表关联数据集,进行相关数据的规范整理。规范好的数据能为用户的个性化应用和研究提供标准化文献支撑与溯源。3.2平台建设技术本研究采用 B/S 模式(React18 前端+NestJS9后端+MySQL数据库)来实现目
18、标功能,主要价值和创新点如下。3.2.1平台基本情况平台采用B/S模式,客户端为可运行浏览器的设备,主要架构视图遵循MVC架构模式,分为前端与后端两个部分。前端使用的技术框架为React18,后端使用的技术框架为NestJs9,此项技术代码精简、结构清晰、功能组织灵活、便于测试。数据库使用MySQL,具有体积小、速度快、总体拥有成本低、开放源码的特点。平台的架构示意图见图1所示。图1平台的架构示意图平台架构的前端为第一层客户端,平台架构的后端为第二层服务层和第三层储存层。客户端接受用户的请求,将数据处理之后以网络请求的形式发送给服务器端,服务器获取并且解析请求内容,然后操作数据库数据,并且将其
19、包装成用户所需的网络响应的形式发送给前端,前端解析这个网络响应,将数据渲染到页面上,页面所展示的数据便可更新,用户即在页面中看到响应出的数据。平台前台技术选择React19,可实现导航式浏览和按照检索类型进行特定检索词检索。检索结果可以按需进行排序。后台技术使用nodejs技术栈中较为流行的NestJS框架及其配套生态软件,Nest(NestJS)是一个用于构建高效、可扩展的Node.js服务器端应用程序的开发框架20。后台技术功能主要在于可以在接受前台网络请求之后快速解析、查询以及运算。NestJS 封装了 typeorm库,使得其本身拥有更加便捷、高效的数据库连接以及使用的能力,支持大规模
20、数据库增删改查等事务操作。其实现关键点在于前台技术使用了响应式处理,快速获取用户的输入需求,向后台程序发送网络请求。后台解析网络请求之后调用配置的数据库连接模块可以快速查询所需数据并且返回前台,前台在接受了网络响应之后利用其响应式的特点,快速将相关数据渲染在页面的指定数据结构中,节约浏览器界面渲染时间,通过前后台技术的相互配合满足用户需求,达到数据索引速度快、检索结果呈现快等特点。数据库使用MySQL,数据实体为书目信息,包括9个字段。主键为“书目信息序号”,其他的字段分别为“朝代年号”“书名”“作者”“总卷册”“分卷名”“分卷册”“内容”和“页码”,通过记录的标引和规范后将数据导入到MySQ
21、L数据库。3.2.2个性化检索功能用户在平台检索框中选择检索类型,输入检索词进行检索。前端调用封装好的request请求向后端发送检索需求,后端的NestJS框架调用typeorm框架,根据封装好的实体类调用方法从数据库中查询所需的数据,并且将这些数据发送到前台进行渲染展示。平台的主页见图2所示。信息资源建设胡玮:文天祥研究古籍及民国时期文献平台建设45第 53 卷 第 4 期 总 第 236 期2023 年 7 月20232023年第年第4 4期期图书馆研究图2平台主页3.2.3汉字简繁体规范检索和按需同屏展示功能古籍平台的特点是要正确实现汉字简繁体规范检索功能,如果处理不好,就会造成相同检
22、索词因为简繁体的不同,检索结果完全不同,失去了平台建设的意义。汉字简繁体规范检索功能是在平台后端融合opencc模块,通过简繁体中文的互译来实现。当平台的后端接受网络请求时,会将用户内容输入到翻译模块中,进行转换得到对应的翻译内容,再将原始内容和翻译的内容使用typeorm框架进行数据库的查询和数据输出,读者不论是输入汉字简体还是繁体,均能检索到相同的结果。汉字简繁体按需同屏展示功能是实现读者同屏进行汉字简繁体对照阅读的功能。读者通过点击检索结果的内容,在展示框中有“转简体”的按键,读者如需要阅读简体,点击“转简体”按键,实现简体中文按需展示,方便读者的阅读和比对。展示功能见图3所示。图3汉字
23、简繁体同屏展示功能信息资源建设4620232023年第年第4 4期期第 53 卷 第 4 期 总 第 236 期2023 年 7 月3.2.4自动和按需展示检索结果功能自动展示检索结果的功能是检索结果会自动展示,根据数据库中点击量高低数据进行排序展示。如读者在“书籍名称”检索类型中检索“文山集”,则会显示数据库中与 文山集 古籍内容相关的书籍,按照点击量高低数据排列展示给用户,用户可以点击某条数据,即可进入到详细信息页面进行浏览等操作。读者可通过点击条目右边的上下箭头“应用条目的排序项”功能来获取记录的排序结果,实现按需展示检索结果功能(见图4)。图4检索结果的排序3.2.5浏览式导航功能平台
24、设置常用的名词浏览式导航栏来实现浏览式导航功能,通过分析文献记录与文天祥研究的历史,挑选出常见、热门的文献和历史故事,将数据库中的相关记录进行连接,便于读者通过点击常用栏目记录来阅读文献内容。如点击“白鹭洲书院志”能自动检索到书籍名为“白鹭洲书院志”的记录。目前已构建部分常见的导航条目,见图5所示。图5导航栏目设置信息资源建设胡玮:文天祥研究古籍及民国时期文献平台建设47第 53 卷 第 4 期 总 第 236 期2023 年 7 月20232023年第年第4 4期期图书馆研究3.2.6延伸应用服务功能平台还能为读者开展延伸应用服务,如需考证著名的“留取丹心照汗青”语句的来源,在检索框中选择“
25、内容”检索项,输入检索词,检索结果为30条记录,其中“钦定续通志”“延平府志”、“资治通鉴后编”等30篇文献刊载了这句话。如图6所示。平台还可对文天祥研究文献进行深层次的开发应用,如对研究主题数据进行比对、印证和分析,形成丰富的资源互补、互证关系,为开展相关文献信息比对、校准、文献计量等方面的研究提供相关的资源保障。图6“留取丹心照汗青”检索结果4结语本研究通过整合文天祥研究资源,对资源进行清洗、标引和规范处理,保证资源的完整性和准确性,采用 B/S 模式(React18 前端+NestJS9 后端+MySQL数据库)建立统一检索平台,满足了读者的个性化检索需求。读者既能进行研究资源的阅读、溯
26、源和校正,又能通过文献的信息指引来选择全文的渠道和途径,为文天祥研究提供资源支撑。丰富的平台资源和先进的平台功能能帮助研究人员深入挖掘文天祥研究的古籍与民国时期文献资源信息,结合各自的研究内容,以点带面,应用新方法、新技术创新开展古籍研究工作,推动中华优秀传统文化创造性转化、创新性发展。参考文献1学习强国.一见 这类书,总书记为何“坚持一点一滴学”EB/OL.2022-04-27.https:/ 普通高等学校图书馆规程 的通知.EB/OL.2022-01-04.http:/ J.四川图书馆学报,2022(4):46-51.5鞠孜涵,白如江,张玉洁,等.数字人文视域下古籍数据库建设关键技术研究兼
27、评稷下学文献资料数据库的建设思路 J.图书情报工作,2022,66(19):4-14.6潘雨亭.古籍文献中数字人文方法的应用研究 D.重庆:重庆大学,2020.7王镇.数字化背景下图书馆古籍资源开发问题研究信息资源建设4820232023年第年第4 4期期第 53 卷 第 4 期 总 第 236 期2023 年 7 月J.河南图书馆学刊,2023(3):92-94.8孙宁,赵维平,王宇飞,等.中国古谱数据库管理平台设计与实现 J.现代计算机(专业版),2017(1):64-699万亚萍.日本藏书印数据库的开发利用及其启示 J.大学图书馆学报,2020(5):59-63,71.10胡蕊.基于数据
28、库的古籍保护框架构建研究 J.图书馆学刊,2017(12):116-119.11杨其霖,田思胜,马梅青.中医药古籍文献数据库建设研究与思考 J.中国医药导报,2018(7):119-122.12孙瑾.高校特色数据库的建设和思考以“易薮易学文化数据库”为例 J.河南图书馆学刊,2017(7):55-56,59.13张毅.数字人文视野下西文古籍数据库的研发 J.大学图书馆学报,2023(2):57-64.14张杰.新技术为古籍整理注入活力 N.中国社会科学报,2022-03-17(001).15术语在线.标引 EB/OL.2023-04-12.https:/ EB/OL.2023-04-12.http:/ EB/OL.2023-04-12.http:/ EB/OL.2023-04-12.http:/ M.北京:机械工业出版社,2021.20 NestJS 简 介EB/OL.2023-04-12.https:/ 胡玮(1972),男,副研究馆员,本科,研究方向:数字资源建设、学科分析。收稿日期 2023-05-16(编发:章忠平)信息资源建设胡玮:文天祥研究古籍及民国时期文献平台建设49