1、档案工作Archives work2023/7(下)总第415期如今,信息技术与社会经济正在逐渐融合渗透,导致档案数据化趋势愈加明显,档案数据总量也呈现指数上升。同时,档案数据作为重要战略资源和无形资产,是档案管理的重要领域,也是大数据时代社会发展的重要信息资源,已经引起档案学界高度重视,成为当前档案学研究的前沿课题与热点问题。随着档案数据化趋势愈加明显,档案数据数量出现爆炸性增长,档案数据管理方式将发生新的变化。但是,档案部门仍然存在重数量、轻质量的管理思想,给档案资源建设的安全合规、开放共享、服务创新等带来很大挑战。为此,亟须开展档案数据质量控制研究,以促进档案数据标准化、规范化管控,从而
2、适应档案事业的发展需求与国家社会的治理要求,推动档案数据朝着善治的方向发展。大数据时代我国档案事业信息化战略转型进程正进一步加速,对档案数据质量的控制提出了更高的要求。本文将立足于档案数据质量控制基本要求,根据其现状,提出具体策略,以期为档案数据管理工作提供一定的理论参考与思路借鉴。一、大数据时代档案数据质量控制的主要障碍由于档案数据质量是档案准确可靠利用的决定性因素,因此提高档案数据质量是大数据时代数字档案资源建设的重点,也是档案信息资源更多被共享和为社会所利用的必然要求。但是,许多档案部门的档案管理思想落后,比较重视档案的数量,却不重视档案的质量,所以容易出现各种数据方面的问题,如数据污染
3、、数据安全、数据异构、数据孤岛等。背后的根本原因是档案数据的质量缺乏把关,导致数据过于庞大,在档案管理中不能被妥当安置和管理。所以,档案数据质量的研究十分必要和迫切。(一)档案数据结构复杂。大数据时代,档案管理工作的数字化转型极为必要。由于文件“单轨制”现象的增加,档案数据体量不断扩大,而且结构也变得更加复杂。现今档案部门的管理工作涉及众多领域,信息时代档案数据总量快速膨胀,因为档案种类众多、体量庞大,产生的档案数据类型自然多种多样,其中包括文档、图纸、照片、录像、录音等。不同类型的档案数据标准规范不同,而不同类型的数据之间又存在一定的相关性,档案数据的繁多将档案管理工作变得复杂,这就容易产生
4、档案数据质量问题。此外,与传统环境下具有单一结构的档案数据相比,大数据时代融合共存了半结构化、结构化、非结构化甚至异构数据,档案数据管理因为不同数据格式不同导致管理方式和标准不同,最终引发的后果就是档案数据质量下降。(二)档案数据整合程度较低。社会各界对档案数据资源的公共服务能力提升呈现出迫切需求,使得档案数据资源的质量管控、有机整合与开放共享等成为业界发展的热点内容。目前,档案数据管理还在起步阶段,相关的档案数据处理技术尚未大规模成熟应用。不同的档案部门之间,彼此档案资源并未统一整合与联合利用,档案数据质量整体不高。一方面,在如今大数据时代,大多数档案部门关注的重点仍旧是档案数据的体量,在这
5、一方面,其档案数字化程度较高,然而档案部门未能对搜集到的档案数据资源进行深度安全维护、数据挖掘与数据审查等操作,对档案数据资源的管理大多停留在简易的组织、检索与利用层面;另一方面,档案部门的相关数据比较零碎、孤立,相关管理同样如此,导致数据容易出现“数据壁垒”“数据孤岛”等问题。(三)档案数据质量控制规范不健全。政策法规制度是维护档案数据质量的重要保障。新档案法第三十五条、第三十七条、第三十九条以及“十四五”全国档案事业发展规划都对档案数据质量管控提出了要求。如第三十五条明确:“保障电子档案、传统载体档案数字化成果等档案数字资源的安全保存和有效利用。”可见,档案数据质量控制在宏观层面已经受到高
6、度关注。然而,目前现有的政策标准主要局限于系统规范与数据存储等方面,对档案数据的形成、传输、保管、利用等各方面的规范存在缺失现象。而针对档案数据生命周期流程中出现的各种数据质量问题,应当指定的微观层面上的规范大数据时代档案数据质量控制策略研究文/西安交通工程学院尹翰【摘要】经过相关分析发现,档案数据质量存在数据结构复杂、数据整合程度较低、数据质量控制规范不健全等主要障碍。本文针对性提出构建档案数据质量控制技术保障机制、建立科学的档案数据质量评估机制以及加强档案数据质量控制顶层设计的档案数据质量控制策略。【关键词】大数据时代;档案数据;质量控制页第 1642023/7(下)总第415期标准是不够
7、完善的,档案数据质量法规保障有所缺失。由于没有制订相应的规章制度或者是操作要求,导致很多工作人员在开展档案数据规范管理的工作过程中,缺乏执行力与自我约束力,容易产生不严格把控质量关的结果,从而导致档案数据资源质量管理工作存在一定的缺失。二、大数据时代档案数据质量控制策略构建在大数据时代,档案数据正成为非常重要的信息资源。档案数据化程度的提高,使得数据管理理念、数据管理技术和数据管理制度都随之更新。但是,我国的档案数据质量控制实践还处在初级阶段,在实际的档案质量管理工作中,存在管理现状混乱、档案数据质量控制不到位、质量问题不断涌现的现象。对档案数据质量控制策略加强研究,是打破现实中“瓶颈”的重要
8、方法,能促进“载体开发”向“内容开发”的转化,使档案数据被充分利用、深入整合和挖掘,最终推动档案管理和服务方式的创新。具体来讲,根据前文所提出的问题,可从以下几方面构建档案数据质量控制策略:(一)构建档案数据质量控制技术保障机制。首先,档案数据的质量中包括了数据本身的质量,也即数据是否可靠、准确与可用;其次,档案数据质量还包括了档案数据传输、存储、运行和利用的质量。所以,可以从元数据的控制和数据的运行过程两个方面进行研究:其一,建立一个有效的元数据控制机制。这是档案数据质量得到保证的关键,在建立上要切实可行,具体涉及对元数据的命名、语义进行标准化管理,并在现有的元数据管理中尽可能遵循现有的标准
9、,同时加深引用、复用的方法。比如,将Dublin Core作为基本的复用元数据标准,结合实际需要,特别是社交媒体数据特点,扩充容纳相关元素,形成完整的社交媒体元数据存储技术,更好地将相关海量数据归档。其二,建立科学的档案运行机制。目前的档案数据处理工作多以手工进行,技术应用不足,易导致档案数据差错,科学数据运行机制的建立,能最大程度避免这些问题,对数据的运行、传输、存储、应用和利用加强控制,避免技术异常、系统漏洞或操作不当等情况带来不利影响,有助于确保整个生命周期内的档案数据质量保持优良状态。首先,要重视档案数据审核技术的运用,强化数据检测和识别,以实现对档案数据质量的全面跟踪。档案数据的收集
10、、整理、移交等过程涉及多个方面,每一个环节都直接影响和制约着下一步的工作,要把档案数据的质量检验工作落实到各个环节,并采取不同的方法来检验档案数据的质量问题。同时,更新档案数据库技术和存储设备,促进档案数据的整合,确保档案数据在存储时相互联系,保证可重复使用。此外,采用信息化技术可以提高档案数据生成的自动化和控制水平,以防止档案数据的质量问题。例如,浙江省档案馆2020年开始进行省级档案数据中心建设,对全省范围内的各种不同类型的档案的收集、管理、开发和利用等数据进行了统筹,从而为档案数据的统筹和数据管理质量的提升做好了准备。(二)建立科学的档案数据质量评估机制。建立一套科学的档案数据质量评价体
11、系,保证档案数据质量的有效性,以达到多方需要,才能更好地利用和共享档案数据资源,实现档案数据服务最佳化。1.建立评价指标并选取切实可行的评价体系。档案数据质量评价机制的科学化运行取决于评价指标的合理设置和分配,评价指标的选取要科学、合理,能体现档案数据的质量需求,选取的指标要考虑档案数据的以下特性:一是可用性,即档案数据是否可以重复利用、机器调取阅读、运行等;二是完整性,档案数据在实体和属性上是否保持完整;三是准确性,档案数据是否足够真实可靠;四是规范性,档案数据的格式、类型是否符合规范;五是一致性,也就是档案数据的变化;六是关联性,档案数据是否保持联系;七是可控性,是指从档案数据产生到流通的
12、各个环节都能有效地监控。同时,在指标的要求和规范上,建立健全增减制度,对评价指标动态进行选取,达到提高评价体系的科学性和合理性的目的。2.建立评价主体的多元化参与。只有建立健全的公民参与通道,建立健全的公民参与机制,才能发挥和利用社会的力量,推动档案数据质量评价机制的顺利实施。要与档案相关部门、大数据管理部门加强协作,对档案数据根据需要和外部实际情况进行客观评价。同时,档案管理部门要开辟和民众互动通道,建立全面的反馈机制,从而对其使用感受及时获知,并依所得意见进行改进,以保证档案数据资源的服务质量。例如,美国国家档案馆与政府、社会资本、社会大众等三方面的协作机制,使档案数据的质量管理得到了很好
13、的推动。(三)加强档案数据质量控制顶层设计。建立健全标准规范是提高档案数据质量的基础。新 档案法 与“十四五”全国档案事业发展规划已经对档案工作的各方面进行了全局性、整体性规划,其中两者都强调了加强档案资源质量管控的任务,这就要求对于档案数据质量监督管控等标准规范的制订应立足于顶层设计,对此,要加强对档案数据质量的管理,要把档案数据的质量管理纳入法律的视野,制订好档案数据质量管理的策略计划,加强顶层设计,为今后的实际工作提供指导。1.推动档案数据质量管理进入法律视野。一方面,要从法律上进一步明确档案管理部门对档案数据的监管和控制,准确界定档案数据的保密、开放共享以及使用者团体在档案数据完整性与
14、安全方面应尽的责任和义务;另一方面,要从法律层面明晰档案数据质量控制应达到的页第 165档案工作Archives work2023/7(下)总第415期效果,以保证档案数据质量和数据安全,真正转变档案工作中“重数量、轻质量”的管理观念,注重数据的生命周期过程及各阶段的价值凸显,让档案数据成为社会运行的决策依据。2.制订档案数据质量管理计划。一方面,档案部门要进一步完善档案数据质量控制的策略,要按照国家、行业的要求,有针对性地制订和修改档案数据管理工作规范和数据标准,并在宏观层面加强档案数据权益维护、档案数据服务平台建设规划等方面的内容,为微观层面标准规范的制订和完善提供方向引导;另一方面,要充
15、分认识各种档案数据资源的特征,确定其发展的方向,制订统一的策略,以保证档案数据的一致性和完整性,充分保障档案数据的质量。更为重要的是,应加强标准的贯彻和执行,在实践中发现问题,并对有关标准进行优化和改进,以达到提高档案数据质量的目的。综上所述,大数据时代,档案数据化趋势愈加明显,档案数据总量指数上升,然而档案数据质量控制实践处于起步阶段,档案数据质量控制工作面临巨大挑战。另外,新档案法与“十四五”全国档案事业发展规划也对新时期的档案资源质量的管控进行了强调。为此,档案数据质量控制亟须展开研究。本文总结了档案数据质量控制面临的主要障碍,在此基础上提出有针对性的解决措施:一是打造技术保障机制,二是
16、构建质量评估机制,三是加强顶层设计。期望能解决相关问题,助推大数据时代档案数据朝着善治方向发展,进一步优化档案资源的社会服务能力。【参考文献】1金波,杨鹏.大数据时代档案数据治理研究J.档案学研究,2020(4):29-37.2管先海.新时代档案事业高质量发展的法治保障J.中国档案研究,2021(1):181-196.3周林兴,林凯.大数据时代档案数据质量控制:现状、机制与优化路径J.档案与建设,2022(2):4-8.4刘越男.数据治理:大数据时代档案管理的新视角和新职能J.档案学研究,2020(5):50-57.5常大伟,潘娜.档案数据治理能力的结构体系与建设路径J.浙江档案,2020(2
17、):27-29.6赵生辉,胡莹.“档案数据化”底层逻辑的解析与启示J.档案学通讯,2021(4):20-27.有这样,档案管理制度才能落地生根,才能开创档案工作新局面。(三)推动档案资源信息化建设问题。档案资源信息化建设问题的整改,“本院”做法是升级现有的档案管理软件,实现在线实时接收电子文件,实现档案管理软件、办公OA系统、收发文系统等数据无缝连接。笔者认为,这种做法只适用近几年通过自动化办公平台产生的档案,而对大量的传统纸质档案信息化起不到作用。且此项工程周期长、耗资巨大,对于多数单位档案员本就不足的现状来说,只能称上是未来的宏伟蓝图;而对档案业务工作从零做起的单位来说,只能说是“对牛弹琴
18、”。笔者认为,真正快速推动各单位信息化建设工作的关键是考虑信息化外包公司的介入,即档案信息化外包公司与单位建立合作关系,根据档案业务实际对室藏全部档案进行数字化、信息化加工,从而降低单位在档案信息化技术、设备上的大额投资成本,同时能让专职档案员集中精力做好档案基础业务工作。(四)抓好档案人才队伍建设问题。档案人才队伍建设问题的整改,各家医院做法一致,即增加了兼职档案员的数量。笔者认为,这种整改不能称上是真正解决了档案人才队伍建设的问题,尤其在科学技术日新月异、新知识层出不穷的今天,档案人才队伍建设不能只求数字上的增加,要重视档案员的知识更新,重视其学习环境的创造,积极引导档案员开展自学、互学活
19、动,采取请进来、走出去的办法参加各种学术交流,全面提升科研能力,让人才队伍建设跟上时代前进的步伐。同时,单位应定期选派专兼职档案人员参加业务培训,引导档案工作人员理论联系实际,在实践中学习,在学习中进步,不断改善知识结构,提升业务技能,方能真正充实档案人才队伍。六、结语档案执法监督检查的整改不是为了应付检查,而是需要我们在实践中不断地探索和完善,只有抓住解决整改问题的关键所在,才能增强档案法律法规的权威性和保障执法监督检查的实效性。【基金项目:本文系2021年度安徽省卫健委重点项目的研究成果之一,批准号为:AHWJ2021a017】【参考文献】1聂云霞,卢丹丹.新 档案法 背景下档案监管的内涵与发展J.档案管理,2022(01):39-44.2林华东.完善档案执法监督检查的思考J.档案与建设,2017(5):35-37.3龚静.档案行政执法的策略探讨J.档案管理,2021(03):33-34.4葛春丽.新 档案法 实施背景下档案执法策略研究J.档案管理,2021(05):59-60.5陈忠海,袁永.论国家治理现代化视角下的档案守法J.档案学通讯,2017(01):4-8.6刘东斌.论档案行政执法的具体化J.档案管理,2013(05):4-6.(上接第160页)页第 166