收藏 分销(赏)

基于数据分析的档案发展及预测研究_蔡亚琼.pdf

上传人:自信****多点 文档编号:327946 上传时间:2023-08-16 格式:PDF 页数:4 大小:2MB
下载 相关 举报
基于数据分析的档案发展及预测研究_蔡亚琼.pdf_第1页
第1页 / 共4页
基于数据分析的档案发展及预测研究_蔡亚琼.pdf_第2页
第2页 / 共4页
基于数据分析的档案发展及预测研究_蔡亚琼.pdf_第3页
第3页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、档案工作Archives work2023/7(下)总第415期随着国家改革开放的不断深入,国家综合档案馆作为保管党和政府机关档案的管理部门,印记和保存了党和国家在政治、文化、经济、军事、科技等方面发展的历程和变化。20多年来,档案工作不管是在发展规模、建设投入还是管理利用服务方面都取得长足进步。目前,对于档案发展变化情况的探索,大多是围绕某一角度从定性角度进行分析和研究,很少通过数据分析方法进行量化评价分析,利用数据分析对于未来的档案发展预测方面研究更是少之又少。自回归移动平均模型(Autoregressive Integrated Moving Average Model,简称ARIMA)

2、是常见的一种进行时间序列预测的模型,也记作ARIMA(p,d,q),其优点是使用简单,只需要内在变量就可以实现预测的模型,适合于平稳或差分后平稳的时间序列预测,被广泛应用于机电、医疗、经济等领域。笔者根据国家统计局20012020年有关档案的最新统计数据,分析国家综合档案馆档案在规模、专职人员配备、开放利用等方面的变化发展情况,并以20年来的统计数据采用数据分析软件和预测算法,从中分析档案相关工作的发展变化及趋势,预测未来档案工作相关指标数据,以此作为近期档案管理与改革工作的参考依据和借鉴。一、数据来源从国家统计局网站通过“档案”关键词进行检索,按照年份提取20012020年最新有关国家综合档

3、案馆的档案馆数量、专职人员、馆藏档案、档案馆建筑面积、开放档案数量、利用档案数量等指标数据,列于表1。二、分析与预测方法根据20012020年国家有关档案馆数量、专职人员、档案馆藏、档案馆面积、开放利用等统计数据,将表1中相关数据按列的20个数值作为时间序列分析数据,通过绘制对应的折线图,分析相关指标的20年变化发展情况;运用SPSSAU数据分析软件,采用ARIMA模型进行统计与预测分析。其主要过程如下:1.选择相应指标的分析数据;2.绘制折线图,分析相应指标的变化发展情况;3.检验分析数据的平稳性及数据平稳化处理。平稳性数据差分值为0,对非平稳性数据进行d次差分平稳化处理,确定差分次数d;4

4、.根据确定的差分次数d,建立差分时间序列;5.利用自相关差分函数(ACF)和偏自相关方差函数(PACF),确定ARMA模型阶数p和q;6.应用ARIMA模型参数估计和适应性检验;7.根据确定的模型参数p、d、q和预测个数n,利用ARIMA(p,d,q)模型向后预测n个数据。三、发展现状与预测结果分析(一)国家综合档案馆发展规模分析与预测。主要包括“国家综合档案馆数量分析与预测、国家综合档案馆馆藏档案与建筑面积分析与预测”两方面内容:1.国家综合档案馆数量分析与预测。图1分别给出了国家综合档案馆数量变化折线图,以及应用ARIMA模型进行训练和预测结果。可以看出:20012020年国家综合档案馆总

5、体上数量呈现上升趋势,从3100个增加到3341个,增长率达7.77%,其中20122013年上升幅度较大,主要是2013年国家机构改革,与档案管理职能归属变化相关。对国家综合档案馆数量进行训练和预测,数据预测最优模型为ARIMA(0,1,0)模型,五年后国家综合档案馆数量预测将达到3404个,预计将在2020年数量的基础上增加63个,国家综合档案馆建设在量上持续增长。2.国家综合档案馆馆藏档案与建筑面积分析与预测。通过分析综合档案馆数量(如图2)、建设面积变化及预测结果可以看出,20012020年综合档案馆馆藏数量不受国家综合档案馆数量变化的影响,总体上呈现稳步上升趋势,从 13756.64

6、 万卷(件)增加到 91789.8 万卷(件),增长率达567.42%,这表明档案馆藏形成良好的工作持续性,档案管理与收集工作总体上常态化;20年来,国家综合档案馆建筑面积从2001年的342万平方米,到2020年的1268.4万平方米,总体稳步提升,但2010年后提升较为明显。从馆均面积来看,20年来,从1103.35平方米增加3796.47平方米,增加了2.4倍,增加趋势明基于数据分析的档案发展及预测研究文/湄洲湾职业技术学院蔡亚琼【摘要】基于对20012020年统计的有关国家综合档案馆的数量、专职人员、馆藏档案等指标数据,应用数据分析软件和ARIMA预测模型对档案指标数据进行分析与预测,

7、分析20年来档案发展变化情况,预测未来5年档案指标数据及发展趋势,分析预测结果谨供借鉴。【关键词】数据分析;档案;ARIMA模型;预测页第 1702023/7(下)总第415期指标2001年2002年2003年2004年2005年2006年2007年2008年2009年2010年2011年2012年2013年2014年2015年2016年2017年2018年2019年国家综合档案馆数(个)3100311031213127314231543161317031913194319632373325331933223336333333153337国家综合档案馆专职人员(人)23652228252308

8、623401234132268921399214142094919750199851800918106178631838617511167992258434349国家综合档案馆馆藏档案(万卷、万件)13756.614790.715945.917601.518688.721656.523675.325051.028089.232198.635445.540547.742454.553470.358641.765062.565371.175051.182850.7国家综合档案馆开放档案(万卷、万件)4129.74301.14618.44868.35132.35746.35875.56072.266

9、87.47428.67828.48254.68900.59179.79266.39707.910151.711222.113171.6国家综合档案馆利用档案(万卷、万件次)575.4548.9602.6813.9868.01166.41244.91257.41308.01417.31564.51521.11477.81688.81978.32033.72078.01819.12140.0国家综合档案馆建筑面积(万平方米)342.0351.0361.4376.8393.1406.1421.9465.4473.3504.4551.1627.1709.3736.0785.5859.8949.3105

10、0.91164.6国家综合档案馆专职人员(人/馆)7.6307.3397.3977.4847.4527.1946.7706.7556.5656.1836.2535.5635.4455.3825.5355.2495.0406.81310.293开放占比(%)30.029.129.027.727.526.524.824.223.823.122.120.421.017.215.814.915.515.015.9利用率(%)4.23.73.84.64.65.45.35.04.74.44.43.83.53.23.43.13.22.42.6国家综合档案馆建筑面积(万平方米/馆)0.1100.1130.11

11、60.1200.1250.1290.1330.1470.1480.1580.1720.1940.2130.2220.2360.2580.2850.3170.349国家综合档案馆馆藏档案(万卷、万件/馆)4.4384.7565.1095.6295.9486.8667.4907.9038.80310.08111.09112.52612.76816.11017.65319.50319.61322.64024.828表120012020年国家综合档案馆有关档案统计数据图1国家综合档案馆数量变化情况及预测图2国家综合档案馆馆藏变化及预测结果页第 171档案工作Archives work2023/7(下)

12、总第415期显,这表明 20 年来国家综合档案馆的基础建设不断重视,基础设施得到了明显的完善。馆藏及建筑面积数据预测最优模型均为ARIMA(0,2,0)模型,从国家综合档案馆馆藏和建筑面积预测结果可以看出,未来5年这两项数据仍然呈现上升趋势,预计届时馆藏将达到136565万卷(件),相比2020年预计增加48.78%;建筑面积将达到1866万平方米,相比2020年增加47.11%。图3馆藏数量与建筑面积关系散点图图3给出了馆藏档案与建筑面积关系的散点图。通过计算,国家综合档案馆藏与建筑面积两组数据的相关系数为0.993836,国家综合档案馆均馆藏数量与馆均建筑面积两组数据的相关系数为0.992

13、974,结合两者的散点图分析,可以看出馆藏数量与建筑面积间存在很强的正线性相关性,两者的变化是相互促进相互关联的,两者有着一致的发展变化及预测趋势。图4国家综合档案馆专职人员变化及预测图5国家综合档案馆开放档案变化及预测结果(二)国家档案馆专职人员分析与预测。图4分别给出了国家综合档案馆专职人员变化折线图,以及应用ARIMA模型进行训练和预测结果。可以看出:国家综合档案馆专职人员前期稳中有降,2017年后上升明显,国家综合档案馆重视档案专职人员的配置,档案管理专业化发展。从国家综合档案馆的每馆平均配备专职人员数量(如表1所示)可以看出,20年来国家综合档案馆每馆配置专职人员数量变化趋势先减少后

14、增加,这表明总人数变化主要原因是馆均配置人数变化引起的。2018年后,国家综合档案馆强化了专职人员的配置力度,档案管理专业化水平明显提升。应用ARIMA模型对国家综合档案馆专职人员总数预测最优模型均为ARIMA(0,0,2)模型,从预测结果可以看出:按照20年数据推算,5年后国家综合档案馆专职人员预测将达到22430 人,馆均专职人员 7 人左右,两项指标预计将比2020年减少35%以上。实际上,按照近年来档案专业化发展势头来看,档案馆专职人员及馆均专职人员持续增加的可能性较大。(三)国家综合档案开放与利用分析与预测。通过分析国家综合档案馆档案开放数量(见如图5)、开放率变化以及应用ARIMA

15、模型进行训练和预测结果;分析国家综合档案馆档案利用数量(见如图6)及利用率变化以及应用ARIMA模型进行训练和预测结果。从图中可以看出:20012020年档案开放数量从4129.71万卷(件)到14584.5万卷(件),增加2倍多,这表明档案开放量持续增加,但开放档案相对于档案数量占比呈现下降趋势,从 30%下 降 到 15%,2015 年 起 档 案 开 放 占 比 趋 稳。20012020年,国家综合档案利用数量呈现上升稳步趋势,从 575万卷(件)增加到 2064万卷(件),但通过计算综合档案的利用率(如表1所示)可以看出,国家综合档案的利用率先上升后下降,2006年以来呈现下降的趋势。

16、通过ARIMA模型对国家综合档案开放和利用情况数据预测最优模型均为ARIMA(0,1,0)模型,从预测结果可以看出,5年后国家综合档案开放数量预测将达到17498万件(卷);5年后国家专门档案开放数量占比预测将为12%,预计将比2020年占比下降3.9%;5年后国家综合档案利用数量预计将达到2593.62万件(卷)次,比2020年增加21.9%,而档案利用率预计将持续下降至1.67%。档案的开放度和利用率提升问题需要得到关注。四、结论通过 20 年的国家档案统计有关数据分析,建立ARIMA模型向后预测各指标5年的数据,(下转第178页)页第 172档案工作Archives work2023/7

17、(下)总第415期四、口述史料归档管理(一)成果汇编。以一个整理单元为建档单位。整理完毕后,将所有口述史料按照逻辑形成口述史料成果汇编,归档保存,以方便采集者及利用者使用。成果汇编按照封面、目录、采集基本信息表、口述者基本信息表、口述文稿正文、录音录像形成的标注、口述文稿整编稿、现场笔录、口述者捐献资料清单、采集协议书、采集方案(提纲、计划)、采集实施情况、采访信函、工作报告、本次采集工作新闻稿件、采集现场照片、其他搜集的资料(口述者背景资料、相关报道,以及接受其他媒体采访形成的访谈资料等)顺序打印一套纸质材料装订成册。原则上一个整理单元装订一册。应保证纸质材料与电子文件一致。(二)口述史料数

18、据库。口述史料采集视频及其转录文稿是口述史料中最重要的主体。建立系统、完整、格式统一的口述史料数据库,是保存这些音频、视频及其文稿的最好形式。将录音、录像及其口述文稿一同导入数据库,构建其之间的关联,将音视频按照章节分割成不同节点,与文稿相对应,对文稿可进行人物、事件、时间等关键词搜索,搜索文稿反馈结果的同时能够关联到相对应的音视频片段。口述史料数据库能集中管理、维护、有效控制口述史料数据,极大地提高口述史料的使用效率,实现口述史料的信息化、标准化、系统化和规范化。【参考文献】1赵惠.试论图书馆口述历史资源的后期整理J.管理观察,2014(17):55-56.2口述史料采集与管理规范S.北京:

19、国家档案局,2017.3孙涛,袁泽轶.浅谈海洋名人档案及其征集与整理J.海洋信息,2010(02):12-13.4于钊,岳晓峰,王文玫.口述史料录音文稿整理研究J.档案天地,2019(3):30-36.5朱丽梅.口述档案的整理分析及保管利用探讨J.兰台世界,2012(26):76-77.(上接第172页)得出以下结论:图6国家综合档案馆档案利用变化及预测结果1.20年来,国家综合档案在档案馆数量总体上呈现上升趋势,5年后国家综合档案馆数量预测将有不同程度的增幅。2.20年来,国家综合档案馆馆藏及建筑面积增长趋势明显,预测5年后将增加40%以上,两者的变化曲线极为相似,呈现高度线性相关性。3.国

20、家综合档案馆专职人员总数及馆均配备数量前期稳中有降,后期上升明显,按照20年的数据预测,5年后将减少,但从近期发展势头看,持续增加的可能性更大。4.20年来,国家综合档案馆档案开放量和利用量呈现持续上升态势,5年后预计将持续增加,但相对档案总量的开放度和利用率却是持续减少的趋势,开放度和利用率值得关注。【资助项目:福建省中青年教师教育科研项目(社科类),编号:JAS19716】【参考文献】1蒋冠.国家综合档案馆馆藏资源建设策略探析J.档案学研究,2011(05):37-41.2范悦.机构改革后国家综合档案馆功能定位与服务能力建设的若干思考J.办公自动化,2021,26(18):9-11.3于英

21、香.大数据视阈下档案信息化建设新路向J.北京档案,2017(02):9-12.4马海群.档案数据开放的发展路径及政策框架构建研究J.档案学通讯,2017(03):50-56.5李运明,吴凡,郑驰,等.某三甲综合医院门诊量ARIMA预测分析J.中国病案,2014,15(08):53-55.6符青林.基于“全域数据”模型的股票市场收益分配特征分析J.投资与创业,2021,32(24):50-53.7刘媛.大数据时代档案数据化的发展趋向与进路J.黑龙江档案,2021(04):314-315.8孙凯俐,李晖,陈梅.面向区块链节点负载预测的ARIMA 组合预测方法J.电子技术与软件工程,2019(08):180-182.9杨娟,王昌全,曾世勇,等.19872006年成都市经济生态可持续发展分析及ARIMA预测J.四川农业大学学报,2010,28(01):99-104.10薛淳洋.基于ARIMA-LSTM-SAM模型对南极气象数据的预测研究D.太原:山西大学,2021.11张斌,安连新,孙凯.基于ARIMA时间序列预测的人才需求变动研究J.经营者,2019.页第 178

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服