1、国内外古生物化石数据库建设现状与趋势孙 超1,2,李 明1,姚建新1,甘益瑞3(1.中国地质科学院地质研究所,北京100037;2.中国地质大学(武汉),湖北武汉430074;3.北京中地时空数码科技有限公司,北京100089)摘 要:从 20 世纪 80 年代开始,国内外古生物学者开始利用数据库管理系统(DBMS)存储、管理古生物化石数据,并对外提供开放共享服务。依托数据库存储的数据建立了地理可视化、生物多样性分析、定量地层比对等功能应用。本文选取国内外有代表性的古生物化石数据库,对其提供的数据共享、数据可视化、数据分析等功能进行了详细描述,并列举了以古生物化石数据库驱动的科学研究实例,提出
2、了古生物化石数据库的建设发展趋势。关键词:古生物化石数据库;数据共享与可视化;数据分析;化石分类识别;知识图谱;三维重建中图分类号:TP311.13;Q911.2 文献标志码:A 文章编号:2097-1001(2023)05-0008-080 引言自 20 世纪 80 年代以来,地层古生物学研究逐渐由定性研究方法转为定量研究方法。国外学者纷纷开展古生物化石数据库建设工作,古生物 学 数 据 库(Paleobiology Database,PBDB)、尼托马古生物学数据库(Neotoma Paleobiology Database,NeotomaDB)1、南诺塔克斯(Nannotax)超微浮游生
3、物数据库等具有代表性。21 世纪初,随着计算机在国内的普及应用,国内古生物科学家开始探索利用数据库技术管理大量的古生物化石数据,典型代表有中国科学院南京地质古生物研究所的地球生物多样性数据库(Geobiodiversity Database,GBDB)、南京大学的地层古生物学数据库(OneStratigraphy,OneS)、中国地质大学(北京)的国家岩矿化石标本资源共享平台、中国地质科学院地质研究所的古生物标准化石数据库等。数据库的建立对数据共享、数据分析及化石智能识别、学科知识图谱构建、古生物三维重建等具有重要影响。1 国外代表性数据库介绍1.1 化石工厂1998 年,澳大利亚麦考瑞大学建
4、立了名为化石工厂(Fossilworks)的古生物学化石数据库(http:/fossilworks.org/)。该数据库收录了 27 个国家、146个机构、233 位科学家贡献的古生物化石数据。数据来自 72 851 篇文献,包含化石产出记录 1 477 100条、生物属种 423 885 种。数据库中的化石产出记录主要为具有地质年代的陆地和海洋动物、植物化收稿日期:2022-05-25;修回日期:2023-03-12基金项目:云平台地质调查地质所节点运行维护与网络安全保障(DD20230714);中国大陆三维构造格架建模和数据库建设(DD20221647)第一作者:孙超(1979),男,高级
5、工程师,主要从事地质信息化、地质数据库建设和地质大数据研究。E-mail:第 5 期2023 年 10 月自然资源信息化Natural Resources Informatization No.5Oct.,2023 9孙 超,等:国内外古生物化石数据库建设现状与趋势第 5 期石和微体生物化石。Fossilworks 可以将化石数据加入基于算法合成的全球地质年代尺度(geological time scale,GTS),可以按地质年代进行数据查询与分析,并基于此提供生物多样性曲线绘制、化石首次出现时间计算、生物丰度等在线分析 功能。1.2 古生物学数据库PBDB(https:/paleobiod
6、b.org)是 由 约 翰 阿尔罗伊(John Alroy)与查尔斯马歇尔(Charles Marshall)创立的全球化石产出记录数据库,整合了 Fossilworks 与美国史密森学会的陆地生态系统数据库、芝加哥大学的古地理图集数据库等多个数据库。目前,系统拥有超过 159 万条化石产出记录,提供互联网端在线应用和开放的数据服务接口。PBDB 数据可视化基于 D3.js+leaflet 前端框架开发,可在当今地理图和古地理底图上展示化石。用户可以通过地质时代、化石种类、参考文献等信息对化石数据进行查询、检索和下载。在数据分析功能上,PBDB 可以在线绘制不同时期的生物多样性曲线,根据地质年
7、代的纪、世、期和生物分类的目、科、属 6 个维度进行生物多样性分析。1.3 海王星沙盒柏林海王星沙盒柏林(Neptune Sandbox Berlin,NSB)微体古生物化石数据库(https:/nsb.mfn-berlin.de)是一个基于 Python Web 框架 Django 和PostgreSQL 数据库开发的海洋浮游生物微体化石数据库,包含深海钻探计划(deep sea drilling program,DSDP)、大洋钻探计划(ocean drilling project,ODP)、综合大洋钻探计划(integrated ocean drilling program,IODP)所
8、建立的数百个深海海洋钻探站点钻探取芯获取的数千种海洋生物化石记录。数据库包括海洋浮游生物的微体化石记录、生物分类列表和年龄模型以及用于创建这些年龄模型的年代学数据。数据库包含样本数据62 018 条、化石分类数据 19 121 条。系统提供了网页查询、直接访问数据库和基于数据库软件程序的数据获取 3 种数据访问方式。数据库发布了NSBcompanion 程序包,提供了 9 个数据库应用程序接口的调用方法。该 数 据 库 还 基 于 Python 语 言 开 发 了 软 件NSB_ADP_wx,该软件可以调取数据库中钻探区的深海化石记录数据,将其投到年龄-深度图并可视化展示,将用户手中具有年龄-
9、深度的化石数据投至钻探站点的年龄-深度图并与该站点化石数据进行比对。1.4 尼托马古生物学数据库NeotomaDB(https:/www.neotomadb.org/)包含上新世至第四纪的化石数据,旨在研究生物多样性和地球生态环境演变,包括1 120万余条观测数据,33 万余个数据集、2 万余个采集地1。数据库架构由最早的微软 Access 更新为 SQL Server,最终演变为目前使用的 PostgresSQL。用户可通过浏览器选择年龄范围和生物分类查询,查看年代物种丰度曲线。数据库提供了快照、数据公开访问接口、R 语言程序包等多种数据获取方式,便于科研人员或机构能够通过计算机程序自动获取
10、数据并开发自己的可视化与数据分析应用程序。NeotomaDB 提供了客户端工具软件 Tilia,古生物学者可使用该软件管理化石数据、地层学数据和元数据,绘制物种丰度图谱、丰度对比图、深度-年代曲线,进行聚类分析计算。该工具特别适用于绘制花粉(pollen)、介形类(ostracodes)和 硅 藻(diatoms)等 微 体 化 石 数 据 的 丰 度 图谱,理论上可用于绘制几乎任何类型的地层 数据。1.5 南诺塔克斯 3 超微浮游生物数据库南 诺 塔 克 斯 3(Nannotax 3)(http:/www.mikrotax.org/Nannotax3/index.html)是 专 为 超 微
11、浮游生物分类学建立的数据库,包括 2 500 个球 10自然资源信息化2023 年 10 月石藻分类和 2 万张电镜图片。该网站提供分类浏览、文本搜索和基于地层年代表的过滤功能,可以将化石投点在古地理图,并通过时标生成器(TimeScale Creator,TS Creator)软件展示微体化石存在的地质时间。Nannotax 3 还可以在线生成不同门类深海微化石的点状分布图和海洋微体古生物物种丰度波动柱状图。1.6 化石记录电子数据库化石记录电子数据库(Fossil Record Electronic Database,FRED)(https:/fred.org.nz)是由新西兰国家地球科学
12、委员会维护的国家古生物学数据库,涵盖浮游生物、放射虫、有孔虫、棘皮动物、节肢动物、鱼化石等 41 个物种分类数据 103 796 条。该数据库为每个化石制作了化石记录卡片(FOSSIL Record File),提供了化石数据查询、化石记录地图展示等应用功能。2 国内代表性数据库介绍2.1 古生物多样性数据库中国科学院南京地质古生物研究所在 2007 年建立了地球生物多样性数据库(Geobiodiversity Database,GBDB)(http:/ 708条、群组数据 59 120 条、化石数据集 125 757 个,化石产出记录 582 548 条、文献数据 94 168 条、图像数据
13、 929 件2-4。提供了网页端和移动端的数据库查询软件,同时嵌入古纬度转换、化石图像识别等多种软件;提供数据检索服务功能,用户可将检索数据导出 Excel 和多种古生物地层专业分析软件适配的文件格式。GBDB 自 2019 年起补充更多陆地生物化石数据,重新设计了数据库和网站4。数据库中的笔石、有孔虫、腕足、三叶虫、珊瑚虫等化石种类产出记录较多,其中,多巴拉达尔、黄花场、双家沟、红花园、眉山等地的地层剖面包含较多的化石产出记录。GBDB 提供了丰富的可视化应用,包括剖面数据和化石产出记录的地理分布、古地理分布、野外露头和剖面的全景可视化、生物地层比对图。还提供了在线应用分析工具和基于桌面端的
14、定量地层对比软件 2 类数据分析工具。在网页端利用 TS Creator 软件开发了化石在地层位置的分布图5。在桌面端提供了基于图形的定量地层对比软件 SinoCor4 和 CONOP9,2 个软件分别利用图形对比方法和模拟退火算法实现约束最优化法,通过物种共存关系的限制对物种延伸量进行最小延伸约束,可极大提高地层比对准确度,对输入数据质量要求较高。CONOP9 软件在原有Fortran 语言基础上利用 C#语言进行改写,支持并行处理从而极大提高了计算效率。CONOP 数据文件包含化石名称编号、化石首现和未现事件标识、物种在剖面的层位位置、事件位置模拟移动参数等数据。2.2 地层古生物学数据库
15、OneS(http:/onestratigraphy.ddeworld.org/)是一个专门为共享和使用地层古生物数据而设计的数据库平台。连接现有的数据库和资源并创建一个地层“大数据”网络。支持人工智能、虚拟现实、增强现实、并行计算等功能,其目标定位是一个用于研究、教育和科学普及的强大工具。2019年初,樊隽轩博士在南京大学地球科学与工程学院发起了 OneS 项目。该数据库以剖面、化石记录等地层学数据为主体,共享了全球陆地化石和海洋微体生物化石产出记录 1 489 549 条、剖面数据 17 610条及相关的岩相学数据、年代地层学数据。OneS集成了 TSCreator 生物地层可视化软件、古
16、地理重构软件 Gplates,实现生物地层和古地理图的可视化,开发了生物演化树的可视化功能,用户可创建和管理演化树并生成生物演化树图。该数据库目前已被纳入深时数字大科学计划平台(Deep-time 11孙 超,等:国内外古生物化石数据库建设现状与趋势第 5 期Digital Earth Platform,DDE)数据节点。2.3 国家岩矿化石标本资源共享平台国家岩矿化石标本资源共享平台(http:/)创建于 2003 年,是国家科技基础条件平台的重要组成部分及成果之一,由中国地质大学(北京)牵头,中国地质博物馆、中国科学院古脊椎动物与古人类研究所、中国科学院南京地质古生物研究所、中国地质科学院
17、矿产资源研究所、中国地质大学(武汉)、吉林大学等多家单位共同完成。保存了 14.57 万条模式化石及典型化石群标本数据,数据来自中国 40 多个重要化石群和重点地区的古生物化石标本以及国外典型地层的古生物标本。该平台为化石标本建立了“数字护照”,包括化石标本产地、采集用途、特征描述、地质产状与层位、含水印的化石图片等信息。此外,还为典型的古生物化石群建立了专题信息服务,涵盖了生物群概况、地质地貌背景、研究意义及成果、典型化石标本、化石和生态复原图等相关信息与图片资料6。2.4中国地质科学院地质研究所古生物标准化石数据库中国地质科学院地质研究所古生物标准化石数据库(http:/8.140.107
18、.20:8080/)依托中国地质调查局古生物标准化石数据库建设项目,并集成于中国地质调查局主持研发的地质云平台。包含了 23 种不同类别的古生物化石数据,提供了化石在线查询和可视化功能,为广大地质工作者和古生物爱好者及相关领域从业人员提供科学有效的数据服务。采用MySQL数据库管理系统存储数据,可以通过在地图上点击、框选等方式查询化石数据信息及化石图版,如图 1 所示。同时提供了逗号分隔值(comma-separated values,CSV)、制表符分隔值(tab-separated values,TSV)、杰森(JSON)3种格式的数据下载功能及科普模块,发布了恐龙、笔石、苔藓、三维化石模
19、型等古生物学的科普视频和科普文章。图 1 中国地质科学院地质研究所古生物标准化石数据库 12自然资源信息化2023 年 10 月表 1 国内外主要古生物化石数据库功能比较数据库名称化石基本信息空间分布可视化基于地图展示地质年代 可视化古地理可 视化化石特征描述基于三维 底图展示数据全量 下载数据获取 API数据统计分析FossilworksPBDBGBDBNannotax3OneSNeotomaDB国家岩矿化石标本资源共享平台中国地质科学院地质研究所古生物标准化石数据库4 古生物化石数据库建设趋势4.1 基于化石影像的分类识别研究随着人工智能的普遍应用,古生物科学家开始利用深度学习技术和海量化
20、石影像数据对古生物化石影像进行自动分类识别。文献 9 应用最大投影(maximum projection,MPM)、多层(multislice,MSM)和融合(fused,FM)3 种卷积神经网络(convolutional neural networks,CNN)分类模型对豆科植物苋菜科(Amherstieae)16 个属的花粉数据进行训练,利用这些模型约束来自西非和南美北部的48个古新世、始新世和中新世的化石标本。所有模型现存属的自动分类识别平均准确度范围为83%90%。文献 10 开发了用于花粉数据采集的自动识2.5 其他小型数据库示范文献 7 通过 PBDB 数据和美国地质调查局(Un
21、ited States Geological Survey,USGS)地 质图服务开发了基于本体驱动的原型系统(http:/www2.cs.uidaho.edu/max/gts/),具有基于本体实现区域地质年代、化石记录和基础地质学信息的交互式检索、地质时间尺度的建模与可视化、不同区域的地质时代比对等功能。文献 8 建立了二叠纪罗德-沃德(Roadian-Wordian)期全球 381 个腕足动物化石数据库,研究温度、古地理屏障和洋流对腕足动物分布的影响。3 国内外数据库功能综合比较综上所述,为促进数据持续增长,绝大多数古生物化石数据库采用基于“社区驱动贡献数据”的模式。数据库提供数据查询、下
22、载等共享服务功能,大部分数据库提供化石点或剖面的地理可视化功能。GBDB、PBDB、Nannotax3、Neotoma、OneS、ChinaIndexFossilDB 等 提 供 古地理图的可视化功能,PBDB、Neotoma 提供基于数据库数据的生物多样性在线统计分析功能,GBDB提供古生物定量生物地层学分析专业软件,Neotoma、Nannotax3 提供在线丰度计算功能,Neotoma 提供在线聚类分析功能和地质年龄建模工具,GBDB、国家岩矿化石标本资源共享平台和ChinaIndexFossilDB 提供化石三维模型在线展示功能。功能对比分析如表 1 所示。13孙 超,等:国内外古生物
23、化石数据库建设现状与趋势第 5 期定模型难以产生。目前,已有的开放图片识别数据集,如计算机视觉数据集(imageNet)、卡格尔(Kaggle)图像分类、西法尔 10(CIFAR-10)数据集等图像,均基于通用物体的标签数据集,缺少古生物化石的专业图像数据集。中国地质科学院地质研究所古生物化石数据库已对笔石和类 2个种类化石的形态特征进行了结构化和定量梳理,包括笔石化石的基盘直径、基盘高、笔石体高度、笔石体宽度、根长度、根宽度等 29 个结构化特征,类化石的旋壁结构、长度、宽度、轴率、圈数、初房形态等 10 个结构化形态特征。这种“形态参数+图像”的数据集将有效地提升化石图像识别的准确率。(2
24、)目前,机器学习样本数据都基于已标注的化石图像数据。某种古生物化石个例可能非常具有研究价值,但因为样本数量稀少,无法被模型识别,因此模型、算法的构建和参数的调整就显得非常重要。未来古生物化石数据库建设将在已有化石信息及图像可检索、可展示的基础功能上逐步引入并构建可供机器学习与使用的开放数据集,为古化石自动分类识别工作提供已训练的网络 模型。4.2 古生物化石知识图谱数据库知识图谱概念由谷歌(Google)公司于 2012年提出,其初衷是用于 Google 的搜索引擎,使得搜索结果不仅是简单的字符串,而是用户查询背后的语义信息,如今已应用于智能搜索、智能问答、推荐系统等多个领域。深时数字地球(D
25、eep-time Digital Earth)国际大科学计划建立了地球科学知识体系编辑平台14,各工作组精细梳理地球科学各学科知识体系并形成知识树,再将知识树转为信息学领域机器可理解的知识图谱。文献 7 开发了一个本体驱动的数据集成和可视化原型系统,用于建立区域地质年代、化石记别软件,对苋科(Amaranthaceae)属 6 个种、禾本科(Poaceae)属 1 个种、莎草科(Cyperaceae)属 1 个种 1 102 个完整花粉粒的训练数据集进行训练,训练期间在堆叠的光学图像上运用图像增强处理提高分类准确性。通过对包含完整花粉粒(276粒),缺损花粉粒(223 粒)和花粉化石(97 粒
26、)的验证数据集进行测试,花粉化石识别正确率为99.3%。文献 11 采用 CNN 对硅化石有孔放射虫(Cycladophora davisiana)的显微镜下照片进行检测识别,其准确度与人工识别结果基本一致,而识别速度大概为人工识别速度的 3 倍。文献 12 使用 CNN 模型鉴定 6 种现存的浮游有孔虫,准确率达 80%以上,超过人工鉴定准确度(53%)。文献 13 使用了 2 个化石图像数据集训练分类模型,1 个数据集包含 9 个化石大类的 8 416 张图片,另 1 个数据集包含 2 个牙形刺种的 450 张图片。通过尝试多种神经网络模型发现,含有 3层卷积层的模型在牙形刺种级分类上表现
27、较好,平均准确率达 64%以上;而视觉几何组 16(visual geometry group,VGG 16)模型在化石大类分类上表现较好,平均准确率达 70%以上。同时,考虑VGG 16 模型给出的可能性前三分类结果,化石大类数据集中每张图像的准确率超过 87%。综上所述,化石图片分类识别法普遍基于监督学习方法,采用 VGG CNN 模型对有标记的图像化石数据进行训练。目前,主要进展集中在化石的基本分类和某个特定分类的化石识别与分类鉴定,缺少通用的化石种级分类,基于图片增强方式生成小样本新图像更有助于提高图像分类的准确性。目前,基于人工智能的化石图片识别难点主要体现在以下 2 个方面。(1)
28、不同类别的化石照片鉴定规则不同,例如牙形石化石、笔石主要通过形态鉴别,有孔虫、蜓类化石主要通过纹理鉴别,精细分类的通用鉴 14自然资源信息化2023 年 10 月录数据和基础地质学信息的关联关系。该原型将化石的地质年代信息与 USGS 提供的地质图服务中的地层、地质年代信息进行比对,实现区域地质年代比对功能。该系统为基于知识图谱的智能地球科学数据服务提供示例。文 献 15 采 用 人 机 回 圈(human in the loop,HITL)框架建立多模态地球科学学术知识 图 谱(geoscience academic knowledge graph,GAKG),将机器阅读和信息检索技术与地球
29、科学家的手动注释相结合,从 112 万篇论文及论文中的插图、表格挖掘知识实体和时空属性,并基于图谱开发实现语言搜索、知识导航、智能对话机器人等线上应用。目前,古生物化石数据库均建立在关系型数据库上,大量的自然语言描述信息通过文本存储。这些非结构化、半结构化数据处理后被存入NoSQL 数据库,研究人员可以更好地挖掘古生物学知识,实现基于语义的数据查询。古生物学化石数据库架构未来将逐渐由存储结构化数据的单一关系型数据库架构转为存储化石结构化数据的关系型数据库和存储地层古生物学科本体及其关系的非结构化数据库混合架构。4.3 基于三维建模技术的灭绝物种古生物重建随着计算机视觉技术的进步,化石的 3D
30、表征和细节更加清晰,这使得古生物学家能够在不完整的遗骸中更客观地重建化石生物的外观形状和软组织,使用数字重建进行功能分析并严格测试已灭绝生物在古生物学上的长期假设。这些方法正在改变长期研究的化石群体理解,以及建立在它们之上的有机体和生态进化叙事的理解。文献 16 通过 X 射线技术对化石颅骨进行扫描并与近代生物中耳进行比对,揭示了四足哺乳类动物听觉链的发育进化过程。文献 17 利用 3D 成像与 3D 打印技术,通过打印硬食性生物体牙齿对如何粉碎蜗牛等有壳生物进行研究。随着技术成本下降和存储技术提升,越来越多的化石数字模型和生物复原 3D 电子模型将存储在数据库。3D化石模型将成为古生物学科学
31、研究和科普工作的重要工具,也是未来古生物化石数据库建设的新 方向。参考文献1WILLIAMSJW,GRIMMEC,BLOISJL,etal.TheNeotomaPaleoecologyDatabase,amultiproxy,international,community-curateddataresourceJ.QuaternaryResearch,2018,89(1):156-177.2樊隽轩,侯旭东,陈中阳,等.基于 GBDB 数据库的地层学研究与应用 J.地层学杂志,2013,37(4):400-409.3FANJX,CHENQ,HOUXD,etal.GeobiodiversityDa
32、tabase:acomprehensivesection-basedintegrationofstratigraphicandpaleontologicaldataJ.NewslettersonStratigraphy,2013,46(2):111-136.4XUHH,NIUZB,CHENYS.Astatusreportonasection-basedstratigraphicandpalaeontologicaldatabase:theGeobiodiversityDatabaseJ.EarthSystemScienceData,2020,12(4):3443-3452.5GRADSTEIN
33、F,OGGJ.TS-Creator-ChronostratigraphicDataBaseandVisualisation:Cenozoic-Mesozoic-Paleozoicintegratedstratigraphyanduser-generatedtimescalegraphicsandchartsJ.Geoarabia,2006,11(3):181-184.6何明跃,杨眉,吴志远.国家岩矿化石标本资源共享平台的构建 J.科研信息化技术与应用,2017,8(4):24-31.7WANGC,MAX,CHENJ.Ontology-drivendataintegrationandvisual
34、izationforexploringregionalgeologictimeandpaleontologicalinformationJ.Computers&Geosciences,2018,115:12-19.8谢俊芳,张华,沈树忠.腕足动物数据库及定量古生物地理学研究:以全球二叠纪 Roadian-Wordian 期为例 J.古生物学报,2007,46(4):420-429.9ROMEROIC,KONGS,FOWLKESCC,etal.Improvingthetaxonomyoffossilpollenusingconvolutionalneuralnetworksandsuperres
35、olutionmicroscopyJ.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2020,117(45):28496-28505.10 BOURELB,MARCHANTR,DEGARIDEL-THORONT,etal.Automatedrecognitionbymultipleconvolutionalneuralnetworksofmodern,fossil,intactanddamagedpollengrainsJ.Computers&Geosciences.2020,140:104498.11
36、ITAKIT,TAIRAY,KUWAMORIN,etal.Innovativemicrofossil(radiolarian)analysisusingasystemfor 15孙 超,等:国内外古生物化石数据库建设现状与趋势第 5 期automatedimagecollectionandAI-basedclassificationofspeciesJ.ScientificReports,2020,10(1):21136.12 MITRAR.Automatedspecies-levelidentificationofplankticforaminiferausingconvolutionaln
37、euralnetworks,withcomparisontohumanperformanceJ.MarineMicropaleontology,2019,147:16-24.13 徐卉清,樊隽轩,杨娇,等.应用卷积神经网络进行化石图像分类 C/中国古生物学会.中国古生物学会第十二次全国会员代表大会暨第 29 届学术年会论文摘要集.2018:178-179.14 石顺中,闾海荣,董少春,等.地球科学知识体系编辑平台 J.高校地质学报,2020,26(4):384-394.15 DENGC,JIAY,XUH,etal.GAKG:amultimodalgeoscienceacademicknowle
38、dgegraphEB/OL.2023-01-06.https:/ ROWET.CoevolutionofthemammalianmiddleearandneocortexJ.Science,1996,273(5275):651-654.17 CROFTSSB,SUMMERSAP.Howtobestsmashasnail:theeffectoftoothshapeoncrushingloadJ.JournaloftheRoyalSocietyInterface,2014,11(92):20131053.Current situation and tendencies of paleontolog
39、y fossil database construction at home and abroadSUNChao1,2,LIMing1,YAOJianxin1,GANYirui3(1.InstituteofGeology,ChineseAcademyofGeologicalSciences,Beijing100037,China;2.ChinaUniversityGeoscience,Wuhan430074,Hubei,China;3.BeijingZhongdiSpacetimeDigitalTechnologyCo.,Ltd.,Beijing100089,China)Abstract:Si
40、nce1980s,paleontologistsbothdomesticallyandinternationallyhavebeenusingDatabaseManagementSystems(DBMS)tostoreandmanagepaleontologicalfossildata,whilealsoprovidingopensharingservices.Byleveragingthedatastoredindatabases,variousfunctionalapplicationshavebeendeveloped,includinggeographicvisualization,b
41、iodiversityanalysis,andquantitativestratigraphiccorrelation.Thisarticleconductsacomparativeanalysisofdatasharing,datavisualization,anddataanalysisservicesprovidedbypaleontologicalfossildatabases.Itprovidesbestpracticesofscientificresearchdrivenbypaleontologicalfossildatabasesandproposesthedevelopmenttendenciesfortheconstructionofpaleontologicalfossildatabases.Keywords:paleontologyfossildatabase;datasharingandvisualization;dataanalysis;classificationandidentification;knowledgegraph;three-dimensionmodeling