1、 41 中国科技资源导刊 ISSN 1674-15442023 年 9 月 第 55 卷第 5 期41-52,89CHINA SCIENCE&TECHNOLOGY RESOURCES REVIEWISSN 1674-1544 Vol.55 No.5 41-52,89 Sept.2023开放科学背景下 全球灾害数据共享平台建设与应用的现状分析闵晓冬等1,2 王卷乐2,4 韩保民1 袁月蕾2 段博文2 邵亚婷2,3 李 凯2,3(1.山东理工大学建筑工程学院,山东淄博 255049;2.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101;3.中国矿业大学(北京)地球
2、科学与测绘工程学院,北京 100083;4.江苏省地理信息资源开发与利用协同创新中心,江苏南京 210023)摘要:开放的科技资源是全球应急减灾的重要基础支撑条件。联合国教科文组织(UNESCO)于 2021 年年底向全球公布了开放科学建议,并于 2022 年将防灾减灾领域列为其开放科学实践的重点领域之一。开放数据是开放科学的重要基础,灾害数据开放共享对于促进全球防灾减灾具有深远影响作用。以灾害数据共享为例,对全球 96 个开放的灾害数据共享平台进行调研,分析现有灾害数据的全球分布、数据内容、共享程度、开放水平等总体信息。利用全球开放数据清单指标和DCAT元数据评价方法,对应建立灾害领域数据共
3、享平台评价指标,并对其开放共享程度进行对比评价。基于此,就防灾减灾领域加强开放数据共享等 7 个方面提出启示建议。关键词:开放科学;防灾减灾;数据共享;数据平台;数据评价DOI:10.3772/j.issn.1674-1544.2023.05.005 CSTR:15994.14.issn.1674.1544.2023.05.005中图分类号:P694;TP392 文献标识码:AEvaluation of the International Disaster Database under the Open Science InitiativeMIN Xiaodong1,2,WANG Juanle
4、2,4,HAN Baomin1,YUAN Yuelei2,DUAN Bowen2,SHAO Yating2,3,LI Kai2,3(1.Shandong University of Technology,Zibo 255049;2.State Key Laboratory of Resources and Environmen-tal Information Systems,Institute of Geographic Sciences and Natural Resources Research,Chinese Academy of Sciences,Beijing 100101;3.Co
5、llege of Geoscience and Surveying Engineering,China University of Min-ing&Technology(Beijing),Beijing 100083;4.Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application,Nanjing 210023)Abstract:Open scientific and technological resources are an impor
6、tant basic supporting condition for global emergency and disaster reduction.The United Nations Educational,Scientific and Cultural Organization 作者简介:闵晓冬(1998),女,山东理工大学硕士生,研究方向为地理信息系统理论与方法;王卷乐(1976),男,中国科学院地理科学与资源研究所研究员,博士生导师,研究方向为资源环境科学数据集成与共享(通信作者);韩保民(1969),男,山东理工大学建筑工程学院教授,研究方向为GNSS 精密定位理论研究;袁月蕾(
7、1987),女,中国科学院地理科学与资源研究所科研助理,研究方向为防灾减灾知识服务、地质构造;段博文(1996),女,中国科学院地理科学与资源研究所科研助理,研究方向为环境科学;邵亚婷(1995),女,中国矿业大学(北京)博士生,研究方向为测绘工程;李凯(1998),男,中国矿业大学(北京)硕士生,研究方向为大地测量学与测量工程。基金项目:国家重点研发计划项目“地球表层系统科学数据挖掘与知识发现关键技术与应用”(2022YFF0711600);中国工程科技知识中心建设项目“防灾减灾知识服务系统”(CKCEST-2021-2-18)。收稿时间:2023 年 3 月 16 日。中国科技资源导刊第5
8、5卷第5期2023年9月 42 0 引言促 进 开 放 的 科 学 研 究 逐 渐 成 为 全 球 共识。2021 年 11 月 23 日,联 合 国 教 科 文 组 织(UNESCO)1提出的开放科学建议书由全部 193 个成员国通过。开放科学建议书概述了开放科学的 4 个核心价值观和 6 项指导原则,标志着开放科学迈入全球共识新阶段2。开放科学内涵丰富,包括开放科学知识、开放科学基础设施、社会各方的开放性参与,以及与其他知识体系的开放对话。在这些开放科学的内容中,开放数据是其重要且根本的一环。数据是科学的血液,加强数据的开放共享,将直接促进开放科学建议的落地。为了加强开放科学建议的实施,U
9、NESCO明确指出要在生物多样性、水、防灾减灾、地球科学、海洋科学、气候变化等领域优先推进开放科学3。近年来,在气候变化和不断增加的极端天气事件的影响下,各类灾害事件频发且损害巨大,迫切需要加强防灾减灾领域的合作,尤其是灾害数据开放共享。灾害数据共享是灾前预防、灾情预警、救灾应对、灾后重建各环节中必不可少的部分4。相较于发达国家已经形成完整的防灾减灾体系,广大发展中国家的防灾减灾能力薄弱,在单一重大灾害或复合灾害面前难以协调应对。全球防灾减灾能力上的不平衡,突出体现在灾害数据开放共享方面。一是灾害监测数据,如地震、滑坡、泥石流等自然灾害的监测网络,需要长期的投入和密集的联网数据,并及时开放这些
10、数据增强灾害预警能力。二是风险评估数据,灾害风险评估涉及的要素和指标众多,若缺少足够的开放数据支持,将增加风险评估的不确定性。三是灾害应对数据,当灾害发生时,各类紧急防灾减灾措施需要充足的数据支持,尤其是特定灾区地理环境、气象条件、工程建设方面的详实数据,否则再好的救灾预案可能都无法落地。四是在灾后重建阶段,也需要受灾区域人口、社会、经济、地理、地质、水文、植被、气候等各方面的资料支撑,完成其资源环境承载力评估等规划编制,为重建方案制定提供决策支持。因此,如何充分利用开放科学的政策和工具、促进防灾减灾领域的开放数据共享是一个值得深入研究的课题。本文在UNESCO提出开放科学建议和推荐防灾减灾为
11、优先开放数据领域的背景下,拟通过对全球灾害数据共享平台进行调研,分析防灾减灾领域开放数据的现状,并定量评价其开放共享程度,以期为开放科学实践提供领域参考,对在防灾减灾领域的开放数据提出启示建议。1 原理与方法1.1 调研数据平台本文通过网络搜索和文献跟踪两种方式共获得全球可在线访问的灾害数据共享平台 124个。其中,18 个灾害数据共享平台直接来源于UNESCO开放基础设施推荐的平台5;26 个数据(UNESCO)published its Open Science recommendations to the world at the end of 2021,and made disaste
12、r prevention and mitigation one of its key areas of open science practice in 2022.Open data is an important basis for open science,and open sharing of disaster data has a far-reaching impact on global disaster prevention and reduction.Taking disaster data sharing as an example,this paper conducted a
13、 survey on 96 open disaster data sharing platforms around the world,and analyzed the global distribution,data content,sharing degree,openness level and other general information of existing disaster data.Based on the global open data inventory index and DCAT metadata evaluation method,the correspond
14、ing evaluation index of disaster data sharing platform should be established,and their openness and sharing degree were compared and evaluated.Finally,seven suggestions on strengthening open data sharing in disaster prevention and reduction are put forward.Keywords:open science;disaster risk reducti
15、on;data sharing;data platforms;data evaluation科技资源服务与利用闵晓冬等:开放科学背景下全球灾害数据共享平台建设与应用的现状分析 43 平台来源于文献Exposure Elements in Disaster Databases and Availability for Local Scale Applica-tion:Case Study of Kuala Lumpur,Malaysia6中引用的数据库;25 个灾害数据平台引自国内外灾害数据信息共享现状研究7一文中的平台资源;21 个灾害数据平台来源于“全球灾害研究机构联盟”(GADRI)8中的
16、成员机构;其余 34 个灾害数据平台直接来自于互联网灾害数据搜索查询。对以上数据平台进行网络在线访问后,发现部分文献和网络搜寻中获取的灾害数据平台由于网络或自身平台问题无法访问。对这类平台进行了剔除,最终确定了 96 个主要灾害数据平台作为调研对象(见附表 1)。1.2 调研方法采用统一调查指标对以上数据平台开展调研。调研指标包括 19 个,主要为平台名称、访问网址、数据尺度、所在地区、数据展现形式、灾害类型、时间跨度、空间范围、数据是否可获取、灾害数据主要字段、灾害数据收录标准、数据平台最后更新时间、数据平台使用语言、网站是否需要注册等。按照这个调研指标在线访问各平台,获取各类网站和平台信息
17、,并分门别类进行信息汇总。在汇总过程中,进一步对部分指标进行细化统一。如对于灾害数据尺度,具体细分为全球(Global)、区域(Regional)、国家(National)和地方(Local)4 个尺度;数据展现形态主要包括数据平台表、文字和地图等 3 种格式。通过对汇总的各类信息进行属性和空间分析,得到灾害数据共享平台的各类特征。1.3 评估方法国际上通用的数据评价工具主要包括开放数据晴雨表、全球开放数据指数、欧盟开放数据成熟度仪表盘等9。但这些开放数据评价工具偏重于政府数据的评估,并且数据评估指标固定,无法结合不同领域的现实情况参考调整。因此,通过对多种开放数据评价指标调研,选出针对防灾减
18、灾领域适用的指标对现有的灾害数据平台进行评价。调研选出的第一个评价工具是“开放数据清单”10。其主要包括覆盖范围和开放性两个评价维度。覆盖范围(表 1)主要包括 3 个部分:一是时间覆盖细分为最近 5 年的可用数据和过去 10年的数据;二是地域范围,包括国家范围和全球范围;三是分类信息11,主要包括地震、滑坡、泥石流等主要灾害。在对数据共享平台评价时,考虑过去 5 年的覆盖率时,如果获得了过去5 年中 3 年或更长时间的数据,那么会被给予 1分;如果过去 5 年中有 1 或 2 年的数据可用,那么会被给出 0.5 分;如果最近 10 年中有 6 年的数据,那么将获得 1 分;如果过去 10 年
19、中有 3 到5 年的数据可用,则得分为 0.5 分。如果最近 10年的数据都不可用,则不得分。如果数据范围属于全球范围则得 1 分,如果是其他范围则得 0.5分。自然灾害分类存在一定局限性,根据GB/T 28921-2012自然灾害分类规范及危害定义与分类评审技术报告12中的自然灾害分类。如果数据平台包括 20 个及以上的灾种,则得 1 分;如果数量在 3 个到 20 个之间,则得 0.5 分;如果少于 3 个或单一灾种,其覆盖范围较低,则不得分。开放性(表 2)包括 4 个要素。第一个要素是机器可读或开放格式,如Excel、pdf等易于被机器可读;csv格式不仅机器可读,而且更易于共享。第二
20、个要素是用户选择或批量下载。第三表 1 覆盖范围时间覆盖地域范围分类信息最近 5 年的可用数据过去 10 年的数据全球范围或其他范围自然灾害分类达成:1部分:0.5无:0达成:1部分:0.5无:0其他范围:0.5全球范围:1无:0全部:1部分:0.5无:0中国科技资源导刊第55卷第5期2023年9月 44 个要素是可用元数据,存在提供有关指标定义或数据收集和汇总方法的特定详细信息的元数据。第四个要素是许可条款,用以说明数据可以面向商业或非商业使用的情况,许可证可以保证数据不被滥用或误解。在对数据共享平台评价时,如果数据是机读可读格式,得 0.5 分;如果数据还满足开放格式,则得 1 分;如果平
21、台界面有数据搜索选择,则得 0.5 分;如果还可轻松获取下载,则得 1 分。如果对数据有特定详细信息,则得 1分;如果只有简单描述,则得 0.5 分。如果有相关许可证书或者免责声明,则获得 1 分。调研选出的第二种评估方法是DCAT13元数据质量评价。评价指标(表 3)一级指标包括存在性、一致性和开放性。存在性分为可获取性、可发现性、可反馈性、使用许可、描述信息、时间信息。一致性包括访问链接有效性、联系人有效性、日期格式规范性、许可证有效性、文件格式规范性。开放性分为开放格式和开放许可。各二级指标又包括详细的三级指标,在此不再赘述。评分标准:一级指标对应的二级指标个数均为 1 个、2 个、3
22、个或 4 个,故设立 0.00 分(未提供任何元数据属性)、0.25 分(3 个或 4 个元数据属性中,仅提供 1 个)、0.50 分(2 个元数据属性中,仅提供 1 个;4 个元数据属性中,仅提供 2 个)、0.75 分(3 个元数据属性中,仅提供 2个;4 个元数据属性中,仅提供 3 个)和 1.00 分(提供全部元数据属性且有效、规范)5 个分值,每项指标的满分为 1.00 分14。2 结果与分析调研获得的实际可在线访问的灾害数据共享平台共 96 个,在各大洲均有分布。由于语言搜索的限制(中文和英文),导致美国和中国数据库居多。数据平台分布最多的是亚洲(拥有42 个),其次是北美洲(拥有
23、 19 个),再次是欧洲(拥有 17 个)。数据平台数量最少的是非洲和南美洲。根据调研结果可明显看出,调研得到的灾害数据平台在全球分布中存在南北不均、发达地区和欠发达地区不均的现象。非洲共有 56 个国家和地区,但目前只统计到 2 个数据平台。非洲的地理位置独特,大部分国家防灾减灾能力薄表 2 开放性下载格式数据描述许可条款机读可读或开放格式用户选择/API或批量下载可用元数据使用条款或声明机读可读:0.5开放格式:0.5用户选择:0.5加API选择:0.5特定于指标/数据集:1非特异性:0.5CC BY 4.0 或类似术语:1 无:0表 3 DCAT评价指标一级指标二级指标三级指标存在性可获
24、取性访问链接、下载链接可发现性标题、描述、关键词、主题可反馈性联系方式、发布机构使用许可数据下载限制、使用许可描述信息格式、字节大小、数据量、语言时间信息发布日期、更改日期、更新周期一致性访问链接有效性访问链接、下载链接联系人有效性联系方式、发布机构日期格式规范性发布日期、更新日期许可证有效性数据下载限制、使用许可文件格式规范性格式、字节大小开放性开放格式格式、字节大小开放许可下载限制、使用许可科技资源服务与利用闵晓冬等:开放科学背景下全球灾害数据共享平台建设与应用的现状分析 45 弱,这与当地经济发展状况相关。由于资金、技术、设施等多方面原因,非洲地区灾害记录不全,缺少防灾减灾应用服务能力。
25、调查结果显示,南美洲国家的灾害数据平台建设也非常单薄,而这个区域地震和厄尔尼诺现象频发。因此,应注重非洲和南美洲灾害数据平台和防灾减灾应用能力建设,鼓励加强南北合作,秉承全球命运共同体的理念,在合作的基础上加强国际援助,提高区域灾害数据平台能力。从国别来看,拥有数据平台最多、排名第一的国家是美国,共有 27 个。其次是日本,有 25个。第三名是中国,有 10 个。这 3 个国家都位于北半球,且处于板块运动较为强烈的地区,自然灾害发生较多。这反映出灾害频发的国家更重视灾害数据平台的建设。从共享平台分布看,一共有 50 个城市建立了灾害数据平台。其中,美国华盛顿和日本筑波并列第一,有 11 个数据
26、平台;其次是日本东京,有 10 个。由此可以看出,美日等发达国家对于防灾减灾的认识以及重视程度非常高。数据平台涉及的灾害种类主要分为 7 种,分别是气象水文灾害、地质灾害、海洋灾害、生物灾害、人造灾害、生态环境类灾害及其他自然灾害。其中,气象水文灾害占总数的 39%,地质地震灾害占总数的 30%,海洋灾害和生物灾害各占总数的 10%和 9%,人为灾害占总数的 7%,生态环境灾害和其他自然灾害各占 3%和 2%。气象水文灾害的数量较多,与近年来气候变化和极端天气事件的增加有很大关系。如 2021 年 7 月 20日中国河南特大暴雨,全省共有 1 478.6 万人受灾,因灾死亡失踪 398 人,直
27、接经济损失 1 200.6亿元,给国家和社会造成巨大财产损失15;2022年 2 月至 4 月,受澳大利亚昆士兰南部海岸上空的低气压影响,创纪录的强降雨袭击了昆士兰州东南部、宽湾伯内特和新南威尔士州沿海地,引发了严重的洪水和城市内涝,多地发布疏散令16;2022 年 6 月中旬以来,受南亚季风异常活动影响,巴基斯坦多个地区遭遇多轮暴雨侵袭,引发多重灾害,造成超 3 304 万人受灾17。地质灾害多发于特殊地质条件地区,如板块交界处,这些地区易发生地震、火山爆发等灾害,而处于这些地区的国家更多地关注到地质灾害18。灾害数据平台的语言是多样的,目前所调研得到的平台涉及的语言种类有英语、汉语、日语、
28、俄语、法语、土耳其语、西班牙语、阿拉伯语、印尼语和匈牙利语。英语在线平台通用性最强,许多使用本地语言的数据平台支持将本地语言转换成英文。在目前所搜集到的灾害数据平台中涉及的语言有 10 多种。由于受语言搜索的限制,主要是以汉语和英语进行搜索。但就发展趋势而言,多语言问题是数据平台发展的一大难题。许多数据平台只使用了本土国家语言,这对数据使用者来说是一个阅读障碍。虽然现在翻译软件能进行页面的机器翻译,但对于专业信息却难以准确识别。将多语言技术应用于灾害数据平台是开放科学当中紧迫的问题。总体而言,美欧日等发达国家和地区对数据平台的建设投入较多,发展中国家和地区对多语言的数据平台建设能力不足。灾害数
29、据平台的主要灾害数据字段和灾害类型反映在图 4 中。主要灾害字段包括:时间、地点、日期、面积、伤亡人数、受影响地区、损失金额等。具体灾害类型有干旱、地震、火灾、洪水、滑坡、海啸等。根据词云分析(图 1a),突出的灾害种类是地震、洪水、暴风雪、风暴、干旱、台风等词。调研得到的数据平台中频率较高的是地震灾害。灾害主要字段中比较突出的是时间、事件、位置、地区等词(图 1b)。其他灾害字段,如影响人数、损失金额、伤亡人数等,在许多平台中有缺失。主要原因可能和获取信息的难易程度相关,通常这类信息的获取需要资金和人力的支持。全球和国家尺度数据平台的占比是 47%和42%,全球尺度平台占主导地位。区域尺度和
30、地方尺度平台占比相对较少,分别是 10%和 1%。美国建立的灾害共享平台数量处于第一位,大多与全球对接,关注全球气候变化和受灾情况。比利时鲁汶大学建立了全球最大、收录信息较全的中国科技资源导刊第55卷第5期2023年9月 46 EM-DT数据平台19-20。在所有建立灾害数据平台的国家中,发达国家的占比远超发展中国家。不同灾害数据平台中的时间跨度不同。时间跨度分为 7 个阶段,最少是以年为单位,最长的有 200 年以上的历史。时间跨度少于 1 年的和1 5 年的占比分别是 19%和 26%;5 10 年的占比是 9%;10 20 年的占比是 12%;20 50年的占比是 23%;50 200
31、年和大于 200 年的占比分别是 10%和 1%。由此可见,时间跨度过长的数据平台占比很少。这些平台少也反映了灾害研究的数据支撑能力薄弱,有研究价值的长时序数据和应急响应及时更新的数据较少。时间跨度在 1 5 年的收集数据较多,在这个时间段的数字数据或其他保存信息较为齐全。各类数据的收录标准差异很大。EM-DT19数据平台的收录标准是明确的。其收录的范围是:死亡人数为 10 人或更多;100 人或更多人受影响/受伤/无家可归;声明或国际呼吁的国家宣布紧急状态/或呼吁国际援助。慕尼黑再保险公司21自然灾害数据库对于人口要求较为宽泛,只要有人口伤亡,这个平台就收录。瑞士再保险公司22灾害数据库要求
32、伤亡人口大于 10人,因此瑞再保灾害数据平台的收录数量相对少一些23。然而,大部分平台对于收录标准不明确,这也是后期数据共享的一个潜在挑战。灾害数据平台中收录标准不明确,在搜集到的数据平台中有近半缺少收录标准。收录数据对人员伤亡人数、建筑损毁程度等多数没有明确的标准。如DesInventar24中的收录标准是中小型灾害发生的系统资料。但中度影响灾害和小型自然灾害如何界定?重大影响的灾害的标准又是什么?这在数据平台中没有明确界限。对于缺乏收录标准的数据平台,应加强基础标准建设,这是全球开放数据能够相互共享和流通的基本条件。在开放数据清单评价表(表 4)中,列出了排名前 25 位的灾害数据库。北美
33、洲有 10 个数据平台,欧洲和亚洲都有 7 个数据平台,而大洋洲只有 1 个数据平台。北美洲中 8 个数据平台在美国,2 个平台在加拿大。发达国家能够提供足够的资金支持,数据建设和平台开发力量投入较大,数据服务也更规范。但目前调研到的数据平台的开放性和覆盖范围普遍不足,因此需要加强这两方面的建设。和开放数据清单相比,DCAT评价指标偏重于元数据质量评估,更加注重数据本身质量。根据DCAT评价指标评分,列出了排名前 25 位的灾害数据平台(表 5)。如图 2 所示,亚洲有 8 个数据平台,北美洲有 7 个数据平台,欧洲有 6 个a.灾害类型 b.灾害字段图 1 灾害词云科技资源服务与利用闵晓冬等
34、:开放科学背景下全球灾害数据共享平台建设与应用的现状分析 47 表 4 开放数据清单评价表序号名称数据平台尺度大洲网站隶属国家网站所在城市1EM-DAT国际欧洲比利时布鲁塞尔2GEM国际欧洲意大利帕维亚3CEMHS国家北美洲美国南卡罗来纳州哥伦比亚4Natural hazards image Database国际北美洲美国华盛顿5HMA区域北美洲美国华盛顿6DRRKS国际亚洲中国北京7GEOSS国际欧洲瑞士日内瓦8CDD国家北美洲加拿大渥太华9ReliefWeb国际北美洲美国纽约10The NGCD natural hazard data国际北美洲美国银泉,马里兰州11BGS国家欧洲英国诺丁汉
35、12Risk Data Hub欧洲欧洲法国斯特拉斯堡13Copernicus EMS区域欧洲比利时布鲁塞尔14MSC GeoMet国家北美洲加拿大多伦多旧约克堡15PreventionWeb国际北美洲美国纽约16IDMC国际欧洲挪威奥斯陆17Disaster information list国家亚洲日本筑波18Global Disaster Data Platform国际亚洲中国北京19National Meteorological Science Data Center国家亚洲中国北京20Disaster Prevention Cross View国家亚洲日本东京21Headquarters
36、 for Earthquake Research Promotion国家亚洲日本东京22Sentinel Asia区域亚洲日本北九州23DisasterAWARE国际北美洲美国夏威夷24Australian Disasters国际大洋洲澳大利亚堪培拉25IBTrACS国际北美洲美国银泉,马里兰州表 5 DCAT评价表序号名称数据平台尺度大洲网站隶属国家网站所在城市1CDD国家北美洲加拿大渥太华2BGS国家欧洲英国诺丁汉3IDMC国际欧洲挪威奥斯陆4AHA Centre区域亚洲印度尼西亚东雅加达5The Aqueduct Global Flood Analyzer国际北美洲美国华盛顿6CEMHS
37、国家北美洲美国南卡罗来纳州哥伦比亚7VicEmergency地方大洋洲澳大利亚维多利亚8J-SHIS国家亚洲日本筑波9GEOSS国际欧洲瑞士日内瓦10HMA区域北美洲美国华盛顿11Copernicus EMS区域欧洲比利时布鲁塞尔12EM-DAT国际欧洲比利时布鲁塞尔13Climatewatch国际北美洲美国华盛顿14Australian Disasters国际大洋洲澳大利亚堪培拉15NDMA国家亚洲巴基斯坦伊斯兰堡16ComCat国际北美洲美国华盛顿中国科技资源导刊第55卷第5期2023年9月 48 数据平台,而大洋洲有 2 个灾害数据平台,非洲和拉丁美洲也各有 1 个数据平台。在DCAT评
38、价指标中,数据平台在各大洲均有涉及,处于各大洲的国家对于元数据的质量建设都相对重视。各个国家对于数据平台内元数据建设投入较大,支持开发者对数据质量进行建设优化。元数据对于数据本身而言,是发现数据的第一步,让数据使用者可以更方便快捷地找到数据,是数据的重要组成部分。目前,大多数据平台的元数据质量层次不齐,在数据开发过程中,应加强数据平台的元数据建设。元数据建设离不开资金的投入。因此,元数据质量较好的数据平台主要集中在发达国家和发展较好的发展中国家。3 开放科学在防灾减灾和数据共享领域的应用建议(1)开放灾害数据需要更多实践。开放科学对于防灾减灾领域非常重要,鼓励各方人员积极参与到开放科学中。在防
39、灾减灾领域,需要好的示范(案例),鼓励和引导更多机构参与。目前,灾害数据共享程度高的平台能够发挥积极引领作用,如EM-DAT19、USGS25、IDMC26、IKCEST-DRR27。(2)开放灾害数据的联盟机制。灾害数据具序号名称数据平台尺度大洲网站隶属国家网站所在城市17Munich Re国际欧洲德国慕尼黑18Active Fault Data国家亚洲日本筑波19DesInventar国际拉丁美洲哥斯达黎加加勒比地区利蒙市20MASDAP全球非洲马拉维利隆圭21China Maritime Disaster Bulletin国家亚洲中国天津22DRRKS国际亚洲中国北京23Global D
40、isaster Data Platform国际亚洲中国北京24Disaster Prevention and Disaster Management国家亚洲日本筑波25The NGCD natural hazard data国际北美洲美国银泉,马里兰州表 5 DCAT评价表(续表)图 2 DCAT评价分布科技资源服务与利用闵晓冬等:开放科学背景下全球灾害数据共享平台建设与应用的现状分析 49 有典型的长尾数据特点。加强灾害领域数据的开放服务可以借鉴其他领域的开放共享策略。如针对数据互联互通,提出的FAIR原则28强调科学数据的开放服务,TRUST原则29强调促进数据中心之间的沟通,DDE30强
41、调建立一个链接世界的固体地球数据网络。CoreTrustSeal认证强调科学数据可信管理与服务,并形成全球数据中心论证体系31。GCMD32建立了气候领域的数据主目录体系,促进气候变化领域数据共享。灾害领域建立有GADRI联盟33等。这些不同领域和区域的数据共享实践,可以为灾害数据共享提供借鉴。(3)更多利益相关方的参与。开放科学需要更多的参与人和利益相关方参与,如高等院校、研究机构、出版社、学者、公众等。同时,各方在开放科学交流中也一定会涉及文化、版权以及技术方面的问题,这些都是新的挑战。因此,需要研究出更好的合作机制。(4)优先领域先行。开放科学首先应该关注由国家政府出资的开放数据或成果。
42、但缺少数据安全和伦理等政策约束下的开放,可能会导致一些问题。如具有不确定因素的灾害风险信息公布,将会直接影响资产评估、土地规划等;跨境地区的信息公布,可能会涉及一个国家的敏感信息,甚至危及国家安全。但总体而言,在全球洪水、地震、空气污染、疫情、疾病等这些灾害跨境的问题上,需要开展坦诚开放的对话。(5)灾害知识共享。开放灾害数据不仅仅是数据本身,也可扩展到丰富的知识资源,如文献、案例、报告、政策、工具、人才等。如以IKCEST-DRR27为范例,提供开放的数据、地图、文献、专家、机构、报告等共享资源。IKECST34提供了 51 个在线知识应用,向用户开放使用。(6)提高数据互联的技术。大部分的
43、数据库是通过软件系统来管理和使用的,但并不是所有的系统都是开放的。这导致很多灾害数据库不允许机器访问,无法做到机器可读信息的互通。这也涉及灾害数据共享生态系统中的各类问题,包括数据的可发现、可访问、可互操作、可重用等。(7)建立灾害数据主目录。针对灾害数据平台的全球分散性,建议建立全球灾害数据主目录,促进防灾减灾数据库共享互通。主目录系统可以在开放标准的指导框架下(如OGC标准34),通过各种开放技术建立主目录系统接口,允许更多灾害数据按统一标准进入主目录系统。4 结语在开放科学的倡议下,本文对全球在线的灾害数据库开展调研。对灾害数据库的开放程度、灾害类型、地域分布、时间尺度以及数据标准等信息
44、进行采集,并通过空间和属性统计分析。研究发现当前灾害数据库在全球地区分布、数据标准统一、多语言互通等方面存在巨大挑战。借助开放数据清单指标和DCAT元数据,建立相应的数据库评价指标,并对评价结果进行对比分析。结合开放科学倡议,提出关于促进防灾减灾和数据共享的 7 个方面的启示建议。预期通过本次调研能够为开放科学与灾害数据开放共享建立联系,促进全球防灾减灾能力和开放共享水平。致谢:感谢UNESCO-IKCEST第五届防灾减灾知识服务国际研讨会的所有参与专家讨论指导。感谢防灾减灾知识服务团队(IKCEST-DRR)参与调研。感谢中国-巴基斯坦地球科学研究中心提供科研条件完成此项研究。参考文献1 U
45、NESCO.Recommendation on Open ScienceEB/OL.2021-11-26.https:/unesdoc.unesco.org/ark:/48223/pf0000379949.locale=en.2 郑思聪.联合国教科文组织通过开放科学建议书J.科技中国,2022(5):102-104.3 Implementation of the UNESCO recommendation on open science first meeting of the working group on open science capacity buildingEB/OL.2021-
46、11-26.https:/www.unesco.org/sites/default/files/medias/fich-iers/2022/08/Report_1st_meeting_of_UNESCO_OS_WG_Capacity-Building.pdf.中国科技资源导刊第55卷第5期2023年9月 50 4 张萍.气象灾害数据互联共享的国外经验及其启示J.农村经济与科技,2021,32(21):15-18.5 Working Group on Open Science InfrastructuresEB/OL.2022-03-24.https:/unesdoc.unesco.org/ar
47、k:/48223/pf0000383808.6 NURFASHAREENA M HASNIZA M A,JOY J P,et al.Exposure elements in disaster databases and availability for local scale application:case study of Kuala Lum-pur,MalaysiaJ.Frontiers in Earth science,2021(10):2296-6463.7 刘耀龙,许世远,王军,等.国内外灾害数据信息共享现状研究J.灾害学,2008(3):109-113,118.8 Event,G
48、ADRIEB/OL.2022-03-24.https:/ 盛小平,焦凤枝.国内外开放数据评价研究综述J.情报杂志,2022,41(8):131-137.10 Assessing the coverage and openness of official sta-tistics EB/OL.2021-03-16.https:/ 梁乙凯,陈美.国外开放政府数据评估项目的比较与分析J.情报资料工作,2022,43(3):94-103.12 中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.自然灾害分类与代码:GB/T 28921-2012 S.北京:中国标准出版社,2012.13 W
49、3C.Data Catalog Vocabulary(DCAT)EB/OL.2020-02-04.http:/www.w3.org/TR/vocab-dcat/.14 张晓娟,谭婧.我国省级政府数据开放平台元数据质量评估研究J.电子政务,2019(3):58-71.15 百 度 百 科.2021年,720郑 州 特 大 暴 雨EB/OL.2022-10-03.https:/ ABC News,2022.Massive falls recorded in south-east Queensland,more rain aheadEB/OL.2022-09-27.https:/.au/news/2
50、022-02-23/massive-falls-recorded-in-south-east-queensland/13767082.17 Floodlist,2022.Pakistans floods are a disaster:but they didn t have to beEB/OL.2022-09-27.https:/ ANGELIKA W,WOLFGANG K,PETRA L,et al.The need for data:natural disasters and the challenges of database managementJ.Natural hazards,2