1、(Library)074 2023 年第 3 期(No.3.2023)工作研究数字统一语境下的流散珍本古籍再生性建设研究:维度、框架与启示李娜娜 朱坤豪 苗含雨(郑州大学信息管理学院 郑州 450001)摘 要 数字统一是“全球数字化”背景下文化遗产领域的新概念。当前不断消亡的流散珍本古籍在资源联合研究、开发与应用上有着种种现实困境,梳理数字统一语境下的古籍建设经验对促进我国古籍保护有着重大意义。文章运用文献调查法和网络调研法对国际数字统一古籍项目展开调研,将其梳理为保护、运行、法律与教育四个维度,归纳出数字统一古籍建设的数字采集、元数据描述、网页浏览、数字展览四大项目框架。研究发现,国际数字
2、统一项目对我国古籍再生性建设具有参考价值,我国应健全数字化标准,建设本土数字统一古籍项目完整保存文化遗产,并创新古籍数字展览传播方式,同时还需要加强文化遗产保护理念、拓展全球化视野。关键词 数字统一 流散古籍 珍本古籍 文化遗产 再生性建设中图法分类号 G255.1引用本文格式 李娜娜,朱坤豪,苗含雨.数字统一语境下的流散珍本古籍再生性建设研究:维度、框架与启示 J.图书馆,2023(3):7483.流散珍本古籍通常指由于文化交流、历史变迁、人群迁徙、冲突掠夺及不法商人的贩卖谋利等原因未保存在原属国或其形成地的较为珍稀并具有特别重要文献价值、文物价值、艺术价值的古籍。世界上有着大量流散珍本古籍
3、如西奈山抄本(Codex Sinaiticus)、希伯来语手稿(Hebrew Manuscripts)、纸莎草纸(Papyrus)、敦煌遗书以及中国善本等在全球流散分布。流散古籍是原属国传统文化的重要组成部分,也是保证文化完整性和延续性的重要一环1,可以弥补原属国内相关资源建设的不足和空白,同时也有助于相关领域学术研究的开展,当属该国不可或缺的文化遗产。促进流散古籍回归是联合国教科文组织的重点项目,已在许多国家和地区达成共识。然而受诸多现实因素的制约,流散古籍回归仍然面临较多困难。其一是国际认知层面的冲突,即古籍原属国“文物民族主义”与古籍所有国“文物国际主义”的冲突;其二是法律、协约条文的冲
4、突,先是签署的公约所适用的时空、成员国范围有限,再是古籍文物受制于所有国国内法的规定2;其三是古籍拍卖市场价格日趋走高,商业购回代价过高,例如 2020 年法国拍卖行售出的两册 永乐大典 最终以 640 万欧元的高价定锤。此外,古籍载体的脆弱性决定了古籍从开始生产传播就面临着不断的消亡,因此对其进行保护与利用也迫在眉睫。针对流散珍本古籍在信息完整性和长期利用方面的缺陷,国际图联(IFLA)于 2017 年首次明确提出了数字统一(digital unification)概念,期望通过技术进步,将各地区公共文化机构中提供数字访问的文化遗产汇集在一起,实现从数字化保存到数字化统一的转化。古籍是文化遗
5、产的重要组成部分,而保存与保护人类文化遗产也是图书馆的核心职能之一,因此推进分散各处的流散珍本古籍的回归与重建是当下国际图书馆界应承担的重要使命之一,也是促使流散珍本古籍焕发新生的必要措施之一。2023 年第 3 期(No.3.2023)0751 数字统一概念解析1.1 “数字统一”的提出“数字统一”理念是随着文化遗产在数字时代日益强化的保护需要发展起来的,具有较为清晰的发展脉络。早在 1992 年,联合国教科文组织就发起了保护和促进文化遗产发展的“世界记忆”方案,提出保护文献遗产和增加获得文献遗产的机会是相辅相成的,如文献材料数字化后可以增加访问量,而访问需求可以进一步刺激保存工作3,并对数
6、字统一的作用作出了最初步的构想;2013 年,教科文组织又与国际档案理事会(ICA)和国际图联(IFLA)联手,第一次打造出文献遗产保护的全球平台,并提出持续性原则4,迈出了数字统一的历史性一步;2014 年,联机计算机图书馆中心(OCLC)开展了各项数字资源长期保存方面的工作,IFLA 以“数字时代的文化遗产”为主题召开“图书馆保管与保存”星城会议5,联合国教科文组织也在次年发布 关于保护和获得包括数字形式在内的文献遗产的建议(Recommendation Concerning the Preservation of,and Access to,Documentary Heritage In
7、cluding in Digital Form)6。这三项内容无不展现出国际上对数字化时代文化遗产保护的进一步关注。随后,IFLA 又先后采取制定战略规划、成立工作小组、出台指南标准等诸多策略,不断明晰数字统一的工作理念和方法,将数字统一推入更广阔的发展空间。1.2 数字统一相关研究回顾数字统一概念下的现有研究主要集中于两大领域:一是对 IFLA 关于数字统一与文化遗产保护系列指南及标准等制度性文件进行解读与借鉴。吴建中在阐述国内外图书馆转型和创新时,率先引介了“数字统一”理念7;程焕文、曾文与之呼应倡导解决当下图书馆(学)领域未能建立统一的文化遗产观、未能深度参与跨学科文化遗产工作的协作等问
8、题8;随后曾文、马杰在解读 保护文化遗产国际图联指南时,进一步补充阐释了数字统一构想及发展状况9;在这些研究的基础上,赵庆香从文化遗产的角度出发解释了数字统一概念,并为我国文化遗产保护提供了拓宽全球化视野、构建文化遗产保护共同体等建议10。二是对流散古籍回归或 IFLA 数字统一项目的个案分析与经验探寻。研究者们或调研了中国流散古籍在国际上的收藏分布11、保存保护状况12,或针对流散古籍回归困境提出了国际古籍数字化合作及再生性古籍数字化回归等策略13-15。具体项目上,莱比锡大学图书馆馆员 Zeki 等说明了西奈山抄本数字统一项目的数字化技术,指出该项目有利于提升用户参观体验并满足当下急需的原
9、本研究16;喻雯虹介绍了数字统一案例国际敦煌项目(IDP)的起源与目标、架构和发展以及主要资源项目17;同时,肖希明、杨蕾也以 IDP 为例分析了国外公共数字文化资源整合的资金保障制度与机构组织管理体系,并据此得出了对我国公共数字文化资源整合的启示18。总体而言,国内关于数字统一的基础理论研究起步较晚,基本处于对国外相关理论与指南的解读、引进阶段,且对文化遗产观念下古籍再生性建设关注较少,未产生数字统一语境下的流散古籍专题研究成果。实践上,现有研究多关注于某个具体项目,分析其项目理念、运用技术、经验分享等,未能从项目整体视角分析其运行维度和项目框架,以及探究其不同因素之间的交互作用。因此,本研
10、究从IFLA 数字统一项目全局视角出发,剖析其微观架构和宏观维度,以期为我国流散珍本古籍资源的再生性建设与文化遗产保护理念的拓展等提供思路和借鉴。2 IFLA 数字统一项目概况2.1 项目愿景世界各地图书馆和档案馆的馆藏都具有重要的文化意义和欣赏价值,它们记录了人类历史之间不可分割的相互联系,尤其是当这些藏品可以同时进行展示时,它们将会发挥出更大的价值。但是在传统观念和现实中,距离和边界无疑是极大的阻碍。IFLA 的数字统一项目便是致力于通过现代信息技术,使文化遗产的收集与共现成为可能,并为世界范围内的所有用户提供数字访问权限,实现馆藏价值的跨距离递加。2.2 项目历程(1)项目萌芽阶段(20
11、142015 年)。在 IFLA 之前,数字统一项目已经经历了一定的区域范围变迁。1998 年,美国成立全国性的数字图书馆;2008 年,欧盟提出欧洲区域范围内的联合倡议;2009 年,美国国会图书馆在联合国教科文组织的支持下,成立世界数字图书馆19。2014 年,IFLA 在法国里昂举办以“数字时代的文化遗产”为主题的世界图书馆与信息大会,从探讨智利国家数字图书馆以及挪威国家图书馆数字化政策的案例出发20,初步为 IFLA李娜娜、朱坤豪、苗含雨:数字统一语境下的流散珍本古籍再生性建设研究:维度、框架与启示(Library)076 2023 年第 3 期(No.3.2023)数字统一项目奠定了
12、基础、设想和开端。(2)蓬勃发展阶段(20162019 年)。IFLA 数字统一项目在这一阶段备受重视与支持。2016 年,IFLA 在 国际图联战略计划 20162021(IFLA Strategic Plan 20162021)中将文化遗产的数字化保护纳入战略方向21,展示了数字统一项目的地位和发展方向。2017 年,IFLA 成立国际图联数字统一重点倡议工作组(Working Group for the IFLA Digital Unification Key Initiative,简称 WGDU)。该工作组包括来自国际图联相关专业单位的成员,联合国教科文组织世界记忆计划、国家档案理事会
13、的代表,国家图书馆馆长会议成员以及其他专家成员22。他们提出建立包括所有相关方在内的庞大国际网络等构想23,以强大的专业素养为数字统一项目的快速发展注入不竭动力。2019 年,法国国家图书馆的国际图联分馆(Isabelle Nyffenegger)与加拿大图书馆和档案馆的国际图联分馆(Guy Berthiaume)联合的专家组发布 开展数字化联合项目指南(第一版)(Guidelines for Setting Up a Digital Unification Project(1st Edition)),为图书馆数字统一项目的规划和实践提供了完整的清单和建议19,成为数字统一项目迈上新台阶与有序
14、发展新阶段的重要节点。(3)稳定运行阶段(2020 年至今)。为保障数字统一项目的平稳、有效运行,IFLA 在国家图书馆发布的20192020 年行动计划(Action Plan 2019-2020)中指出应当继续丰富 IFLA 网站上关于数字统一的案例研究数据库,并继续修改 2019 年发布的 开展数字化联合项目指南(第一版)24。此外,在 IFLA 后续的工作会议上,关于从数字保存到数字统一的讨论,以及对数字统一项目指南的修订、完善问题始终保持较大热度25,有力维持着数字统一项目的稳定运行。截至目前,IFLA数字统一项目已经取得相当的成果,具体内容将在下文重点阐释。2.3 数字统一项目成果
15、IFLA 为推动数字统一建设成立了数字统一重点倡议工作组,该工作组筛选出 19 个“数字统一”项目案例,并于 2019 年 8 月发布了 开展数字化联合项目指南19。该指南将项目分为三类,经过与相关国家或地区古籍定义的对照,筛选出各类项目中所涉文献全部为古籍或包含古籍的项目,如表 1、表 2、表 3 所示。第一类是对单一文献或馆藏的数字化。这些文献曾经被归为单一的收藏,后由于其他原因而分散,项目旨在通过数字化对其进行聚合。表 1 流散孤本古籍数字统一建设项目第一类类别项目古籍/包含古籍项目参与方起止时间单一文献或馆藏的数字化西奈山抄本Codex Sinaiticus400 多片四世纪中叶基督教
16、圣经的手稿,包含基督教新约的最早完整副本及部分旧约英国国家图书馆、德国莱比锡大学图书馆、俄罗斯国家图书馆、埃及西奈山修道院20052011欧洲皇家图书馆European Regia1000 多份中世纪和文艺复兴时期珍稀手稿卡罗来纳图书馆、查尔斯五世和家庭图书馆、那不勒斯阿拉贡国王图书馆20102012第二类是对同一民族、语言、地点、宗教或文化、国家或地区范畴下的文献进行数字化。这些项目文件尽管不一定在历史上的任意特定时间都聚集在同一地点,但对其进行数字化旨在整合并形成完整的文化遗产。表 2 流散孤本古籍数字统一建设项目第二类类别项目古籍/包含古籍项目参与方起止时间同一民族、语言、地点、宗教或文
17、化、国家或地区范畴下的古籍数字化格拉哥里手稿Glagolitic Script40 余份格拉哥里手稿,涉及法律、宗教、商贸克罗地亚萨格勒布国立和大学图书馆、克罗地亚科学与艺术学院及图书馆、老教堂、斯拉夫学院2017朝鲜语善本Korean Rare Books万余份各类朝鲜地区古籍或引进的汉语古籍韩国国家图书馆、哈佛燕京图书馆、英国国家图书馆2006希伯来语手稿Hebrew Manuscripts大约 3000 份公元 10 世纪至 18 世纪犹太民族的习俗、法律、宗教、医学、科技、文学手稿英国国家图书馆、以色列国家图书馆20142018国际希伯来文手稿Ktiv:The Internationa
18、l Collection of Digitized Hebrew Manuscripts公元 12 到 18 世纪犹太民族手稿,类似“Hebrew Manuscript”项目以色列国家图书馆、弗里德堡犹太手稿协会、法国国家图书馆、英国国家图书馆20142018乌拉尔语言Uralic Languages极少量 18 世纪之前的手稿芬兰国家图书馆、俄罗斯国家图书馆、芬兰科恩基金会、瑞典国家图书馆及其他一些大学图书馆20122017加拿大土著文献遗产Library and Archives Canadas Indigenous Documentary Heritage Initiatives一些涉及
19、文学、宗教、报告的文献加拿大图书馆和档案馆及其他2017国际敦煌项目International Dunhuang Project大量流散海外及国内的敦煌遗书(包括伪卷、手卷、印刷品等)英国国家图书馆、中国国家图书馆、法国国家图书馆、俄罗斯圣彼得堡东方研究院、柏林国家图书馆等 22家机构1994 2023 年第 3 期(No.3.2023)077第三类是对多国共同历史阶段的文献进行数字化,项目旨在以文献数字化来连接多国的共同历史,促进各国对共同历史的了解与研究。表 3 流散孤本古籍数字统一建设项目第三类类别项目古籍/包含古籍项目参与方起止时间多国共同历史阶段的古籍数字化法国-波兰数字图书馆Fra
20、nce-Poland Digital Library大量 1618 世纪法国波兰文化、贸易、文学交流文献法国国家图书馆、法国国家视听协会、法国南锡图书馆、法国移民历史博物馆、法国当代国际文献图书馆、波兰国家图书馆20132017中东图书馆Bibliothques dOrient18 世纪及之前的中东地区文献包括文学以及关于犹太教、基督教、伊斯兰教的文献法国国家图书馆、多米尼加东方研究所、亚历山大研究中心、法国近东研究所、彼欧集团、法国安纳托利亚研究学院2015数字法语图书馆Digital Francophone Library少量法国对外交流产生的文献法国国家图书馆、摩洛哥王国国家图书馆、比利
21、时皇家图书馆、加拿大魁北克国家图书馆20153 流散珍本古籍数字统一项目资源建设维度流散珍本古籍的数字统一项目,主要从保护、运行、教育、法律四大维度进行资源建设,并通过这四个维度各自的核心要素以及它们之间的相互作用,保障项目建设者的权益以及项目使用者的有效利用,从而促进文化遗产建设的良性循环。各个维度的核心要素及其相互关系如图 1所示。图 1 项目维度核心要素关系图3.1 数字化保护维度珍贵的流散古籍通常兼具独特的文化价值和文物价值,对其保存和利用都具有重要意义。IFLA 数字统一项目采用数字采集、数字存储、数字处理、数字展示、数字传播等数字化保护技术将其转化为可共享、可再生的数字形态,从数字
22、化过程中的保护规范和数字化之后的非接触式使用两方面拉动了对它们的保护和利用,提高了古籍的可见性与可用性。一方面,由于脆弱的手稿极易在数字化过程中遭到损坏,所以数字统一项目制定了严格的数字化操作指南。指南普遍要求数字化前必须对古籍进行预先性保护审查,判断其是否具备数字化的条件,其次是要求必须由经过培训的扫描操作员进行数字化操作,并且在数字化的过程中要精准监测和控制光线、湿度、温度等环境条件,使用泡沫楔子、棉手套、X 光扫描等特殊保护性设备。由此,合作的多方机构才更有可能在保护原稿的条件下,扫描制作出真实、还原度高的数字化古籍。但物理层面的保护和修复只能在一定程度上延缓古籍的损坏与消亡,数字化保护
23、则能作为补充手段极大地改善这一局面。所以在另一方面,在科学的数字获取和采集后,这些项目利用互联网或多终端平台将古籍文本内容加以演示,使用户在不接触原稿的情况下实现对原本的无差别利用。减少对古籍的碰触与折叠等,能够进一步对原稿起到保护作用。其中,大多数项目会采用虚拟展览以及数字图书馆两种形式供大家在线使用,如加拿大土著文献遗产倡议项目细化出列传、数据库、数字化微型电子收藏、开放数据、虚拟展览、主题指南等多种类型26。此种做法在为相关学术研究提供易得的原始资料的同时,更有助于突破国界限制、互通知识成果,提升古籍传播的广度,在数字化成果的基础上实现保护的最终要义即利用。3.2 项目运行维度IFLA
24、数字统一项目中牵涉多方合作机构,项目的良好运转依赖于一个稳定运行模态的构建,需要项目组对资源供给、技术合作、资金来源、用户服务进行多次的调试与博弈,来推动项目实现高效、可持续的发展:资源供给:将古籍重新统一为整体需要多方密切协作,如欧洲皇室项目由 5 个欧洲图书馆共同提供馆藏27,各馆存在基础设施差异、古籍数量不同等各种状况,需要预先确定资源的分类、版权的转移、数字化次序等计划,来保障各方提交资源;技术合作:由于数字化标准、元数据制定与其他技术细节都需要各方共同商讨,所以部分数字统一项目会通过培训班、讲习班、研讨会、论坛、会议以及联盟等形式,使合作成员能够定期商讨项目进度、技术标准,以及交流经
25、验、知识和技能,从而促进优势互补;项目资金李娜娜、朱坤豪、苗含雨:数字统一语境下的流散珍本古籍再生性建设研究:维度、框架与启示(Library)078 2023 年第 3 期(No.3.2023)来源:除去合作机构提供的资金,这些数字统一网站往往会将基金会作为资金补充的关键一环,如希伯来手稿数字化项目在前两个阶段由 Stavros Niarchos 基金会进行资助,第三阶段由 Stavros Niarchos 基金会、AG Leventis 基金会等进行资助28,助力资源的及时更新以及网站服务的正常开展,但是目前许多数字统一项目的资金支持仍然有待进一步补充,所以这些项目往往还会在网页上专设捐赠
26、页面鼓励人们进行资金或资源支持;用户服务:在用户使用方面主要分为两个部分,首先是保障用户可访问权限,项目的数字化成果一般都可以实现在线自由访问,其次是主动为用户提供项目研究文档,满足用户进一步研究需求,如国际敦煌项目发布了收集和原创的研究报告与会议记录29。3.3 传播教育维度无论古籍如何被束之高阁进行全方位保护,始终无法避免老化,终究会消逝。但数字统一项目将流散古籍原本以数字化形式再现传播,打破了古籍由于需要精心保护而缺乏利用的原生矛盾,从而更利于古籍文化遗产的利用、教育与传承,发挥其学术价值、文化价值与社会价值。流散古籍的统一整理不仅为历史学家或文献学家的相关学术研究完善了史料、提供了便利
27、,同时还通过数字统一项目将这些文化遗产供大众无限制地浏览使用,可在潜移默化中提升广大受众的历史修养、人文素养以及审美情趣30。不少数字统一项目将教育维度列入了项目宗旨,强调通过便利和精心设计的古籍数字化展示,帮助大众接触、了解真实丰富的历史材料,真正发挥出古籍文化遗产的社会价值。如法国-波兰数字图书馆(French-Polish Digital Library)项目公开指出其目的是开展文化、科学和教育活动31;国际敦煌项目也在官网上单列出教育模块,并阐明其宗旨是为任何用户提供正式或非正式的学习方案32。具体行动上,这些数字统一项目往往会采取一些必要的教育支持措施,如采取多语言形式对数字化成果的
28、历史渊源、艺术价值等进行说明和宣传。部分项目还尝试通过发布专题博客、出版文献出版物、合作编写教材、提供项目帮助、开设图书管理员课程等多种形式进行推广,并将课程相关的文章、书籍、讨论组、期刊、视频、在线新闻、网页等资源添加到 Wiki 课程,切实有力地推动科教事业发展,满足更多人的学习参考需求。3.4 版权法律维度出于历史原因,不少流散古籍分散于不同国家地区、机构,甚至个人,对其收集整理牵涉各方权益。尽管流散古籍已经进入公有领域并且不受版权约束,但经过所有权归属方的整理加工如点校、扫描等,相关成果仍受著作权法的保护。所以数字统一项目中涉及版权方面主要解决两个问题,即来源版权的声明和数字化成果的使
29、用权限。由于文化遗产的内容属性和项目参与方图书馆的开放定位使得这些数字化资源并不产生著作权上的经济收益33,所以基于一些合理使用的需求是被允许的。对于版权而言,项目组需要确定版权持有人,向其申请数字化和在线共享相关材料的许可,这可能需要支付一些版权费用。同时,数字统一项目的数据来源于多个国家或机构,所以它们会对资料版权作出声明,如国际敦煌项目标注了流散古籍数据来源,并强调各机构提供的文献资料以及加工数据(图表等)的版权都归提供方所有17。另一方面,项目组还会对取得的资料和数字化成果规定使用权限,即对自身版权进行保护。如国际敦煌项目强调,其他机构之间可以彼此互存资料,但不允许用于复制或其他目的1
30、7;数字法语图书馆项目(Bibliothque Francophone Numrique)则在商业方面进行了明确的宣示,明文禁止使用项目的商标、商号和徽标34。这些都有利于补充传统著作权制度中“合理使用”的不足,也能够平衡版权人与用户之间的利益35。也有部分项目在版权方面尚未统筹专家学者制定专属条款的情况下,会借助已有的大型机构法律如欧盟著作权法作为支撑。4 数字统一珍本古籍项目架构4.1 数字采集:构建与保存数字资源的基础4.1.1 数字化工作流程IFLA 的数字统一项目的工作流程具有相似性,在正式数字化前,通常先对古籍的物理状态进行保护性检查,确保其能够满足数字化工作的要求,避免人为操作加
31、速古籍的老化。一切准备就绪后,首先是根据项目统一的格式标准创建一条古籍电子记录,接着根据项目元数据标准录入描述、结构、管理等元数据形成完整书目数据,并导入数据库以供检索。之后,根据项目预设的统一标准设置好光线、角度、分辨率等进行图像扫描,然后依据色彩方案调整文件并裁剪或旋转图像进行图像处理,完成后形成规范文件进行保存记录。最后一个步骤是质量控制,即对数字化的图像进行审查,将不符合项目质量标准或缺失的图像返回 2023 年第 3 期(No.3.2023)079重新扫描制作,对符合要求的图像进行归类保存,并把古籍返回原单位重新保护。具体流程参考国际敦煌项目流程图,如图 2 所示。创建记录Recor
32、d Creation选择Selection质量控制Quality Checking存储Return to Storage外界委托External Commission图像加工Image Manipulation图像采集Image Capture检查/评估Survey保护修复Conservation归档Archiving古籍目录Catalogue研究使用Research古籍回库Re-Housing图 2 国际敦煌项目数字采集工序(注:源自国际敦煌项目官网的工作流程图,网址:http:/ 数字化采集标准由于流散古籍无法集中进行数字化,数字统一项目组必须制定严格的技术标准,即统一的规范文档来保障该项
33、目从不同地点、由不同人员创建的数据集,能够稳定地利用和交换传输。标准的制定主要包含四个方面:环境标准:如搭建无尘环境的数字化实验室并控制环境的温度、湿度,同时,为了数字化时图像的清晰,还要对灯光的方向、位置、色温、亮度作出细致的要求。摄影标准:为保存更多的细节,数字化时一般使用彩色扫描,如材料的图像甚至风化细节等也存储了一定信息。若古籍质地太薄,还需要在其后加一个颜色相近、纹理相似的背衬,以确保稿本数字化图像的清晰。一些古籍中的水印,还需要借助热成像技术采集,而褪色或破碎的莎草、卷轴甚至要采用多光谱成像技术。清晰度标准:根据古籍纸质、绢帛、羊皮、莎草等不同的物理材质,来预设不同级别的分辨率,且
34、随着原件细节增多,分辨率也需要随之增大以保持图像的清晰。此外,项目组还针对动态范围等系列参数制定了指导标准。后处理标准:数字化后还需要对图像以一个相同的软件设定标准进行加工以保持一致性,如提升图像边缘清晰度、校正颜色、图像降噪、歪斜修正、大小裁剪等。输出时也需要严格按照项目要求,通常采用保存了编码的完整信息的 TIFF 文件格式,并根据规定的文件命名协议,设置能够反映收藏单位、项目、图片类型、名称、标识符等收藏信息的文件名称。4.2 图像描述:以元数据为核心为实现古籍图像的高效可搜索性和可查找性,数字统一项目在古籍数字化后还需要对其添加元数据,以便用户的检索与获取和项目组员对古籍的定位和管理。
35、数字统一项目中的古籍元数据一般以基于 XML 格式,符合 OAI(开放档案协议)的通用的 Web 发布标准为主,包括但不限于 MARCxml、MABxml、EAD、METS/MODS、TEL/P5 等。综合来看,数字统一项目组对古籍数字图像设定元数据主要分为三部分:描述元数据:即描述古籍的内容和形式,用于检索和发现。项目综合复用了都柏林核心元数据集(DC)、视觉资源核心类目(VRA)、Friend-of-a-Friend 词汇表(FOAF)、艺术作品描述类目(CDWA),主要包括古籍标题、物理材质、尺寸、主题词、题跋、来源人(源创作者)、来源地点、源时间、保存状况等;结构元数据:即采用同步多媒
36、体集成语言(SMIL)、可扩展标记语言(XML)与元数据编码和传输标准(METS)等,将各种元数据汇集在一起,并说明古籍图像结构以及各部分之间的关系,如图像地址和标题、编号的链接等,以便导航和呈现;管理元数据:目的在于促进古籍数字图像的短期和长期管理,主要描述图像参数,包括文件大小、文件格式、文件数量、字段访问、采集设备型号、制作者、日期在内的技术元数据,与涉及权限管理、文件ID、DOI(数字对象标识符)、保存机构、版权归属、URL(统一资源定位符)、永久标识符如 PURL(永久统一资源定位符)、URN(统一资源名称)的保存元数据。古籍建设的元数据支持读者二次利用,提供各类原始数据、交互式图片
37、、XML 格式文档以及数据集。如希伯来语手稿采用 TEL XML 格式保存了元数据,读者可以在下载后将其解析为表格,然后在通过相关软件如 OpenRefine 对数据进行清洗后展开任何形式的组织、分析和可视化研究36。4.3 信息组织:增加可访问性和可持续性网页是数字统一项目的呈现方式,为了实现可访问性和长期维护,每个项目都需要创建一个基于 HTML、CSS、JavaScript 和 AJAX 等 Web 标准的独立门户网站。网页汇集了由不同主体根据各种标准在不同地点创建的包括数字图像、用于转录的 XML 文件、用于物理描述的 Excel 电子表格、用于翻译的 XML 文件等数据集,并将其集成
38、到一个统一的用户界面中。利用快速高效的搜索引擎,读者不仅可以使用逻辑词对标题、著者、文件编号进行多语李娜娜、朱坤豪、苗含雨:数字统一语境下的流散珍本古籍再生性建设研究:维度、框架与启示(Library)080 2023 年第 3 期(No.3.2023)言的通用检索,还可根据手稿的物理属性、类型、内容、年代、版权所有人和艺术背景进行垂直检索37。部分项目也将古籍文本数字化整合到网站内,以供浏览和检索。如西奈山抄本手稿由两名转录员根据数字采集的图像对手稿内容进行了两次初步转录,然后使用 Collate 软件自动比较这两个版本,再根据图像检查二者的差异,确定一个最终转录版本。最终,将转录转换为 X
39、ML 格式之后再转换为 HTML 语言,呈现为项目门户网站上可供浏览或检索的电子文本38。但遗憾的是转录并不是一个普遍的现象,大多数项目仅关注到“保真原则”,重现作为历史文物的古籍原貌的功能,以满足版本研究、文物鉴赏、书史研究、文字校勘、原件对照等特殊需要39,但在后续文本深度加工如词频统计、语词分析、情感分析、再出版等研究支持上关注较少。4.4 数字展览:传播、利用与教育的方式美国学者丹尼尔 贝尔曾指出,当代文化正在变成一种视觉文化40。数字展览是通过计算机影像数字技术再现展览,以实现其长久留存和社会传播最大化的网络虚拟形式41。数字技术与艺术展览相交,让读者与原作产生对话。当代策展人、艺术
40、家的努力与匠心展示出了如何利用数字技术进行保护和再创作的思路。(1)原生展览:古籍数字化展示的页面功能健全,如在西奈山抄本的展览中,基本的稿本、章节、放缩、对照尺与色卡等功能一应俱全,还提供了“标准光”“侧光”两种光照版本以适应不同的研究模式。在线展览不仅可以查看原始图像,还提供了转录文本。在选中转录文本后,数字图像中该文本所在位置也会被一个红框所标记,以便读者进行文本与图像的对比,且转录文本下方提供了翻译模块,可供读者将译文与原文进行对照。(2)延伸展览:是在原生展览基础之上对古籍知识进行整合分类后重新排列组织的,采用语义关联、深度挖掘、多层次呈现等方式展示某个主题的一种展览模式。以东方图书
41、馆为例,其网页利用 GIS 技术在地图上标记藏品和事件作为向导以供读者点击浏览查阅,更直观地帮助用户理解42。地图之外,还提供“十字路口”“宗教”“社会”“学科”“政治”“艺术”“人杰”七个独特主题的收藏品分类。类似的还有希伯来手稿项目中“犹太礼仪”“卡巴拉与神秘主义”等特色专题。展览中的专业名词往往会附上 Wiki 百科链接,以便读者在碰到一些不熟悉的专业术语、概念和实体时,能更好地理解,展览下方往往会关联类似展品、故事、策展人等个性化推荐。5 数字统一项目启示5.1 健全数字化标准及保障项目可持续性5.1.1 健全古籍数字化标准从数字统一国际项目中寻找相关经验,以国图或相关协会为中心成立古
42、籍数字化标准主导机构,针对数字化标准不统一、采集信息不全、元数据字段不足等问题建立健全统一的数字采集标准。如为不同介质、不同内容的古籍建立相应规范的数字化方案,对古籍数字化的扫描模式、清晰度、文件大小、色彩格式、图像格式、文件命名、分类标准、主题词、元数据等作出统一要求。同时,由于古籍的物理介质同样包含信息,所以还需当前基础上逐步扩大信息采集范围,不仅是古籍图像的复制,还可以标注古籍历史修复遗存信息,或数字化古籍文本。转录文本需要注意区分古籍版面大小字注、行间注、随文批校等复杂情况,通过有针对性地建立异体字识别与转换表,来保障文本转录的正确率。建立全国古籍文献数字化标准体系,可为我国后期许多数
43、字人文研究提供可交换、可信的基础语料库,也包括为新兴的文化遗产智能计算提供相应的基础设施。5.1.2 保障项目的可持续性古籍数字化项目的建设周期一般较长,需要不断投入,而我国古籍数字化的项目运行缺乏整体规划,合作分工、资金保障都存在一定的问题。相比而言,IFLA 数字统一项目开展多种定期交流的活动,交流项目进展经验及进行技术研讨,并通过基金会、社会资助等获取更多的资金援助来保障项目的可持续性。借鉴此经验,国内也应该倡导建设多方合作的项目架构,通过开展研讨会、论坛、讲习班、组织联盟等方式实现各方优势互补;同时,要结合国内特点和现状,在政府机构、高校的基金项目中增设古籍数字化项目专项基金,并引导社
44、会力量以捐赠的方式参与到古籍遗产传承保护行动中,合力打造多元化、有保障的运行制度,提高我国古籍项目的可持续性。5.2 建设本土数字统一项目关于推进新时代古籍工作的意见43在强调古籍数字化时指出,要积极对接国家文化大数据体系,推进古籍专业数据库开发与利用,加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享。这为汇集散落的古籍,并建立本土数字统一项目提供了契机。2023 年第 3 期(No.3.2023)0815.2.1 具体利用的可实施的浅层融合近年来国内古籍数字化如火如荼地进行,相关成果恰好为数字统一提供了重要助力。中华古籍书目数据库、中华古籍数字资源库、国家珍贵古籍名录数据库等为数字统一
45、建设提供了基础的古籍数字资源,为此后的资源聚合节省了不少精力。同时,我国古籍数量和种类众多,可成立多样的数字统一项目:以某种语言为主体的文献:如满族、纳西族、彝族等少数民族古籍项目;以某种区域为主体的文献:如黄河九省、“一带一路”等古籍项目;以某种信仰或文化为主体的文献:如藏传佛教、佛教、道教、东巴教等古籍项目。显然,类似思路不胜枚举。通过类似项目古籍的聚合,实现古籍数字化标准互通,能够在可预见的时间内实现我国本土数字统一项目的诞生与利用。5.2.2 定向未来的知识深度融合统一尽管 IFLA 数字统一项目实现了古籍的数字聚合,但其浅层融合的设想仍然不能为未来的利用留出足够的潜能。我国已经有相关
46、学者44提出要建设“中华古典知识库”,即突破古籍原本的结构,通过预先设定的主题词表,用计算机提取年代、地点、人物、事件等各种实体,对其关系进行共现来实现深层组织和知识管理。数字统一理念为此增添了新的要素,即建立深度融合的数字统一项目。这不仅包括图文博美等古籍收藏机构的联通共融,还涉及该主题下非文献的物质与非物质文化遗产、网络在线多媒体资源,乃至想象的建构体如口述历史、传说等的聚合。以古籍或古籍里的人物、事件为叙事本体,通过信息抽取、分类、标引、著录等数据化处理,将年代、地域、人物、社团、著述、事件等不同类型的各种实体转化为结构化的主数据和元数据资源,接着经过语义建模、关联标注、集成整合,在遵循
47、文献内容完整和逻辑性的基础上进一步对文化遗产数字资源中蕴含的概念实体、知识单元和文化基因进行细粒度编码表示和跨域链接,并借助知识图谱、关联数据、区块链等技术构建形成可信的、跨模态的、富语义的、可追溯的、可再利用的智慧数据资源集合,最终完成某一本体的文化遗产的数字统一。本文对两个层次的数字统一项目构建思路进行了初步总结,如图 3 所示,以期为数字统一理论与实践的后续发展提供参考。5.3 以数字展览重构古籍文化遗产叙事公共图书馆宣言(1994 版)中列出公共图书馆的使命之一为“加强文化遗产意识,提高艺术鉴赏力,促进科学成就和科技创新”。中国图书馆学会 图书馆服务宣言 也将“实现和保障公民基本阅读权
48、利、缩小社会信息鸿沟”作为其使命和目标之一。但如何将古籍这种文化遗产的内容和文化快捷地生成故事,讲述给大众读者乃至更广泛的受众群体,这中间仍存在一个从简单到复杂、从专家到大众、从探索到叙事的鸿沟。数字展览以一种跨机构的视角将学科、服务与资源集合在一起,深化古籍间的知识关联与传播,揭示文献的历史价值与文化价值,对提升读者文化素养、数据素养及促进学术研究发挥了重要作用。重构叙事即要求既要对其原貌进行再现,还要关注文化遗产背后的内容和故事,对其进行丰富的设计和探索,以期带给用户情感化的个性体验。数字法语图书馆邀请学者设计展览主题并题写主题文章作为概览和引入,如 Samba THIAM 教授策展的“人
49、权:法语国家的价值”专栏中沿革了非洲“人权”概念,以原创的方式收集历史、法学和政治学的相关典籍文献来展示这一主题,刻画了摆脱奴隶制束缚的男女肖像45。当下文化遗产可视化浪潮中,虚拟现实技术通过设置沉浸式建筑及相关的听觉、视觉与特定的算法技术,为利用和展示物质与非物质文化遗产提供了有效的方式。如 人间净土:走进敦煌莫高窟46在对莫高窟 220 窟进行扫描后,将相关数据进行动画和交互设计及数字化演绎,通过一种具身化、沉浸式、表现性和交互式的叙事,让体验者戴上特定 AR 设备后能够看到听到莫高窟壁画上的故事,以赋予洞穴生命的方式来重构数字叙事和进行数字美学教育47。这样的数字展览既能增强古籍文化遗产
50、的体验性与互动性,又促进了公众对文化遗产的理解、想象和阐释。图 3 数字统一项目中浅层融合与深层融合示意图李娜娜、朱坤豪、苗含雨:数字统一语境下的流散珍本古籍再生性建设研究:维度、框架与启示(Library)082 2023 年第 3 期(No.3.2023)6 结语我国图书馆界在古籍保护与数字化研究领域已经取得一些理论与实践成果,但仍未具有统一的文化遗产观和与之相匹配的逻辑自洽的理论体系,并且很少以宏观视野探讨参与文化遗产保护的整体理念与策略路径8,仍需要深化文化遗产保护理念,拓展全球化视野。面对文化遗产保护风潮的涌起,“保存人类社会记忆”的图书馆也萌生出新的学科生长点,可以数字统一等新理念