1、生物多样性数据论文发表趋势分析 生物多样性数据论文发表趋势分析 关键词:生物多样性,趋势,发表,分析,数据 生物多样性数据论文发表趋势分析 介绍:大科学时代的降临以及人类所面临的环境征询题对生物多样性和生态学提出了新的要求,科学家不但要通过大尺度研究来理解众多全球性征询题(如多样性丧失、气候变化、粮食平安),而且要基于科学证据提出相应的对策(MichenerJones,2012;Hamptonetal,2013)。然而,如何有效地共享及整合生物 生物多样性数据论文发表趋势分析 详情: 大科学时代的降临以及人类所面临的环境征询题对生物多样性和生态学提出了新的要求, 科学家不但要
2、通过大尺度研究来理解众多全球性征询题(如多样性丧失、气候变化、粮食平安), 而且要基于科学证据提出相应的对策(Michener Jones, 2012;Hampton et al, 2013)。然而, 如何有效地共享及整合生物多样性数据成为处理这些重要生物多样性和生态学征询题所面临的重要挑战(黄晓磊和乔格侠,2014)。生物多样性数据共享不但是提升生物多样性研究的深度和广度、开展整合性研究的需要(Reichman et al, 2011; Hampton et al, 2013), 而且是检验生态学研究可重复性(Cassey Blackburn,2006; Ryan, 2011; Shap
3、iro Baacute;ldi, 2012)和科学制定生物多样性和环境政策的重要根底(Pullin Salafsky, 2010; Haddaway Pullin, 2013)。 作为最主要的数据消费者、分享者和使用者,科学家群体的态度和行为在特别大程度上决定了数据共享的效果。Vines等(2014)调查了1991ndash;2011年间发表的516篇生态学, 结果觉察这些论文数据的可获得性遭到文章已发表时长的严峻阻碍, 且以每年17%的速度递减。这项研究表达了科学数据共享的重要性, 也说明科学数据的长期保存需要公共数据库和数据政策的支持。Huang等(2012)开展的一项国际调研
4、觉察, 生物多样性领域的数据分享文化并不兴隆, 科学家面临一些技术和认知上的障碍(比方同行竞争、不熟悉数据保存机构、缺少时间和经费来治理数据等), 而且科学家希望能从数据共享中获得相应的报答。最近由Digital Science、Springer Nature和Figshare结合发布的一份有关科学数据共享的也反映了研究者面临的技术和认知障碍, 而且近70%的研究者认为数据援用和论文援用应该具有同等价值(Fane et al, 2016)。 推进生物多样性数据共享仅仅靠加强生物多样性数据所有利益方(科研工作者、研究和赞助机构、期刊等)关于数据共享价值的认识是远远不够的, 同时也需要所有
5、利益方积极采取有效的共享策略。近年来新出现了几种数据共享策略, 包括Dryad)和Figshare等数据保存机构集中保存论文数据、生物多样性数据论文和数据期刊(Chavan Penev, 2011; Costelloet al, 2013)、期刊和数据保存机构间的结合数据保存政策(Huang Qiao, 2011; De Wever et al, 2012)等。这些数据共享策略大多从增加数据共享者的收益(如数据集的所有权和可援用性)出发, 获得了一定的效果。这其中, 生物多样性数据论文采纳科研工作者熟知的学术出版方式, 与科研工作的关系亲切, 是本文关注的对象。 生物多样性数据论文
6、由全球生物多样性信息网络(Global Biodiversity Information Facility, GBIF)和学术出版商Pensoft在2011年结合提出, 主要目的是用于网络共享的数据集的元数据文件能够采纳学术论文的方式发表“, 从而为数据共享、数据质量操纵和改善科研评价提供一个有效的方法。2013年9月, Pensoft创办了数据期刊Biodiversity Data Jour-nal , 专门用于发表生物多样性数据论文, 论文的数据集那么能够无缝分享到GBIF.近两三年在生物医学、地球科学、基因组学等领域也出现了专门发表数据论文的数据期刊。最为突出的是, 自然出版集团(Nat
7、ure PublishingGroup)也于2014年3月开场正式出版综合性数据期 刊 Scientific Data 。 作为较新的数据共享方式, 生物多样性数据论文被研究者接受的程度如何?数据期刊发表论文的数量有什么趋势?数据论文被使用或援用的情况如何?答复这些征询题有助于增进研究者对数据论文的认识和理解。为此, 本文选择了两本代表性数 据 期 刊 (Biodiversity Data Journal 和 ScientificData), 分析了它们创刊以来的发文数量、涉及生物类群、文章阅读量和被援用次数等指标, 以期基于实证数据提示数据论文的发表趋势。 1 材料来源与研究
8、方法。 1.1 研究对象。 本研究主要关注发表生物多样性相关数据论文的两本代表性数据期刊Biodiversity Data Journal(BDJ)和Scientific Data (SD)。BDJ自2013年9月16日开场出版, 旨在基于同行评审的学术出版方式, 快速发表生物多样性数据。BDJ发表的文章类型主要包括Data Paper (数据论文)、Taxonomic Paper (分类论文)、General Article (综合论文)、Software De-scription (软件描绘)、Species Inventory (物种目录)、Interactive Key
9、 (交互式检索表)等。BDJ要求所有基于原始数据的论文以符合标准的方式共享数据, 因而尽管有文章类型的人为划分, 它们(除SoftwareDescription外)的区别更多的只是所共享数据的类型和多少, 实际上都属于数据论文的范畴。BDJ发表的文章涉及物种分类和标本信息、生物区系数据库、植被组成、形态特征、鸣声记录、DNA条形码等多种生物多样性数据类型。SD自2014年3月11日开场出版, 作为自然出版集团力推的综合性数据期刊, 主要发表具有重要科学价值、数据量大的原始数据集及其分析(Data Descriptor), 面向众多科学领域。 本研究期望基于对BDJ的分析提示生物多样性数
10、据论文的发表和使用趋势, 对SD的分析那么能够从更广泛的角度提示数据论文的发表情况, 因而未单独提取生物多样性相关领域文章。 1.2 数据搜集。 BDJ和SD均为在线出版期刊, 本研究的数据主要基于两本期刊网站提供的文献计量指标, 搜集了两本期刊自创刊截止到2016年6月17日的文献信息。BDJ文章信息包括每篇文章的出版时间、文章类型、涉及生物类群、作者国别、文章内容、阅读量等6个方面; SD文章信息包括每篇文章的出版时间、文章类型、阅读量、援用量等4个指标。使用微软Excel软件对以上信息进展分类整理及校正,最终获得的BDJ原始数据集包含313条文献、1,878个数据项, S
11、D数据集包含174条文献、696个数据项。 1.3 数据分析。 基于所获得的原始数据集, 主要开展了4个方面的分析: (1) BDJ和SD两本数据期刊在时间序列上的发文量趋势。为更好地提示发文趋势, 最初比拟分析了按每月“和每2月“绘制的折线图, 觉察以每2月为划分标准能更好地反映发文量趋势。由于BDJ有些文章类型的发文数量极少, 最终反映发文趋势的折线图中主要呈现Taxonomic Paper、Data Paper、General Article、Software Description 4种文章类型以及它们的总和。关于SD来说, Data Descriptor是其主
12、要发文类型(占93.7%), 因而发文趋势对Data De-scriptor文章进展了分析。另外值得指出的是, 按照本文对两本期刊统计的时间范围, 趋势图中最后一个时间段仅约为1个月。 (2) BDJ发表论文所涉及生物类群的多样性。BDJ发文数量前三位的Taxonomic Paper、Data Pa-per、General Article均报道生物多样性原始数据, 因而对这些文章进展了生物类群多样性分析。依次提取每篇文章提及的生物类群, 并确定其所属的纲。由于昆虫纲所占比例较大, 进而将昆虫类群详细到目开展分析。 (3) BDJ发表论文的作者国别。作者国别的统计有助于理解不同地
13、区研究者关于数据论文及数据共享的态度, 以论文作者单位地址为数据源统计了BDJ文章作者国别信息, 并按发文数量进展排序。 (4) BDJ和SD发表论文的被使用情况。考虑到BDJ和SD网站均提供了文章阅读量信息, SD网站还提供了文章被援用数据, 本文主要分析了两本期刊文章的阅读量和SD文章的被引次数, 以此来理解数据论文被使用的情况。采纳网站提供的唯一身份阅读量(unique view)对不同类型文章的阅读量进展了分析, 该指标比总访征询量(total view)更能客观提示论文被使用的情况。结果中主要呈现BDJ发文量较多的4种文章类型(Taxonomic Paper, Data Pa
14、per,General Article, Software Description)。SD网站提供了分别来自CrossRef和Scopus的文章援用数据, 由于这两个数据库覆盖的期刊范围有所差异, 引文数据也略有差异, 但总体援用量常根本一致。我们比拟分析了每篇Data Descriptor来自这两个数据库的援用情况。 2 结果。 2.1 BDJ和SD在时间序列上的发文趋势。 在本文统计的时间范围内 , BDJ 共发表Taxonomic Paper 218篇、Data Paper 38篇、GeneralArticle 36篇、Software Description 1
15、1篇、SpeciesInventory 3篇、Corrigendum 3篇、Editorial 3篇、Interactive Key 1篇。由图1a能够看出, 自创刊以来,BDJ不同类型文章数量虽有波动, 但总体发文量(红线)呈上升趋势, 2014、2015、2016年(截至6月中旬)每2月平均发文数量分别为13.3篇、18.6篇、25.5篇。 统计时间内, SD共发表Data Descriptor 163篇, 发文数量总体呈稳步增加趋势(图1b), 2014、2015、2016年(截至6月中旬)每2月平均发文数量分别为10篇、12.3篇、15篇。 2.2 BDJ论文涵盖的生物
16、类群。 BDJ所发表的报道生物多样性原始数据的文章(Taxonomic Paper、Data Paper、General Article)共涉及动物界的26纲、植物界的3纲、真菌界的2纲(图2a)。其中报道昆虫纲的文章远多于其他类群, 达185篇; 其次为蛛形纲14篇, 双子叶植物纲10篇。基于目级单元对昆虫纲185篇文章进一步分析觉察(图2b), 报道膜翅目和双翅目的文章占一半以上, 有关鞘翅目和半翅目的文章也较多。按文章数量多少排序依次为: 膜翅目63篇, 双翅目47篇, 鞘翅目24篇,半翅目18篇, 鳞翅目10篇, 脉翅目4篇, 直翅目和螳螂目各3篇, 蜻蜓目、蜉蝣目和毛翅目各2
17、篇, 缨翅目、石蛃目、广翅目、革翅目、蜚蠊目、纺足目、弹尾目(本文仍将弹尾目归于广义昆虫纲)各1篇。 2.3 BDJ论文作者国别。 经统计, BDJ文章的作者来自69个国家或地区。发文量前10位依次是美国64篇、英国48篇、德国40篇、印度29篇、巴西29篇、荷兰23篇、加拿大23篇、芬兰23篇、意大利22篇、瑞典22篇(图3)。另外法国、保加利亚、瑞士、俄罗斯、新西兰、比利时、捷克、澳大利亚、葡萄牙、丹麦等国家的发文数量均在10篇以上。这些国家中, 经济和科技兴隆国家占大多数。涉及中国研究者的论文共5篇, 其中中国研究者为主要作者的2篇, 为合作作者的3篇; 从内容来看,一篇
18、报道石蜈蚣科1新种, 一篇报道蝶角蛉科2新记录种, 3篇涉及膜翅目部分类群的物种名录和物种鉴定。 2.4 BDJ和SD论文阅读量和被援用次数。 两本期刊文章阅读量的分布如图4所示。BDJ发文数量较多的4类文章(Taxonomic Paper, DataPaper, General Article, Software Description)阅读量平均为1,189次。分别来看, Taxonomic Paper阅读量平均1,065次; Data Paper平均1,177次; General Arti-cle平均1,221次; Software Description平均2,912次
19、 总体而言, 涉及生物多样性和生态学科学征询题讨论的General Article和涉及生物多样性信息学软件的Software Description阅读量普遍较高, 其中一篇软件类文章的阅读量到达近10,000次, 反映出读者关于软件的关注度较高。相较而言, SD文章平均阅读量较BDJ高, 所发表的163篇Data Descriptor的阅读量平均为5,741次, 其中23篇文章阅读量大于10,000次, 更有5篇文章大于20,000次。对阅读量突出的SD论文内容进展分析觉察, 这些论文均报道了数据量大的全球性数据集, 比方全球综合干旱监测和预测系统、埃博拉病毒在人类传播迸发的地理
20、综合数据库、湖面温度全球数据集、病原体ndash;宿主物种关系全球分布数据集、全球城市化历史数据集等。相关性检验显示, 关于这两本创刊时间并不长的数据期刊来说, 其文章阅读量与发表时长总体上具有一定的正相关关系, 即发表时间越长, 阅读量可能越大。 SD所发表的163篇Data Descriptor文章中, 有103篇(63.2%)被援用, 来自CrossRef和Scopus的援用量分布如表1所示, CrossRef和Scopus数据反映的趋势总体一致。据统计, 103篇文章共被援用515次,篇均被引5次; 援用排名前30%的文章奉献了约70%的援用次数。总体来说, 论文援用数和论文数
21、量呈指数分布关系, 符合期刊论文援用分布的一般性规律(Chatterjee et al, 2016)。比照分析SD文章的阅读数和被引次数, 尽管觉察部分被引次数高的论文往往也有较大的阅读量, 但两者之间并无明显的关联。 3 讨论。 尽管科学数据共享包括生物多样性数据共享在近几年被广泛关注和推进, 但不同领域、不同地区研究者的数据共享认识和意愿仍特别不平衡且有待提高(Alsheikh-Ali et al, 2011; Tenopir et al, 2011;Huang et al, 2012; Fane et al, 2016)。生物多样性数据论文之因而被提出, 核心目的是让研究
22、者能够采纳熟悉的、基于同行评审的学术出版方式, 一方面能够促进生物多样性数据共享, 另一方面能够应对现行的以论文为主的科研评价方式。我们对BDJ和SD的分析觉察, 这两本数据期刊自创刊以来的发文量都呈增长趋势, 说明数据论文这种较新的数据共享方式正在被越来越多的研究者所接受。除了BDJ和SD等专门发表数据论文的数据期刊, 数据论文这种方式也越来越被更多学术期刊认可。比方, Fac-ulty of 1000旗下的F1000 Research, BioMed Central旗下的BMC Research Notes、GigaScience等发表Data Note“, Frontiers旗下期刊Fr
23、ontiers in Ecologyand Evolution和Frontiers in Plant Science等发表Data Report“. 国内一些相关领域期刊也开设了重在数据发表的栏目, 比方《生物多样性》的生物编目“栏目, 《植物生态学报》的材料论文“栏目。但总体来看, 国内期刊在数据论文发表数量、数据共享方式等方面需要提高。 研究觉察, 数据论文(基于BDJ的分析)所报道的生物多样性数据已经覆盖了众多生物类群, 包括动物界26纲、植物界3纲、真菌界2纲, 暗示不同领域、不同类群的研究者均开场尝试这种新的发表方式。然而, 类群的总体覆盖度和均匀度仍需要提高,比方目前植物和
24、微生物类群数据报告偏少, 不同昆虫类群的数据发表也不平衡。基于文章内容的分析也觉察, BDJ所发表的部分文章存在数据量过少的征询题。相较而言, SD所发表的文章都为较大数据集。 Huang等(2013)曾讨论过生物多样性数据论文应当报道多少数据量的征询题, 认为尽管数据论文是否值得发表取决于对数据量、类群的重要性、研究地区等不同要素的综合推断, 但一篇数据论文仍然应当到达一定的数据量才更有价值,同时发挥鼓舞研究者共享的作用。 阅读量和被引次数分析说明, 数据论文能够获得足够的关注和使用。BDJ文章的平均阅读量与同为Pensoft出版的SCI期刊ZooKeys和PhytoKeys
25、相当甚至更高。SD文章平均阅读量较高, 可能与该刊为综合性数据期刊, 以及由知名度高的自然出版集团出版有关。截至本文数据采集时间, SD文章的平均被引次数为5次, 已高于特别多生物多样性和生态学领域期刊同时期发表的研究论文。阅读量和被引数据均说明数据论文有足够的价值以获得相当数量的使用, 近期的一项调研也说明了研究者关于数据援用价值的认可(Fane et al, 2016)。对阅读量和被引次数都特别突出的论文数据集进展分析觉察, 具有较广泛意义、数据量大的综合数据集更能引起关注,这对科学家基于数据论文的数据共享实践有重要的启示。 数据论文的数量能够在某种程度上反映出不同国家或地区的研究
26、者对生物多样性数据共享的态度。分析BDJ文章作者的国别觉察, 经济和科技都较为兴隆的北美和欧洲地区的研究者更倾向于共享生物多样性数据。尽管中国是生物多样性大国,但有中国作者署名的BDJ文章仅为5篇, 而同为生物多样性大国、经济开展水平处于类似阶段的巴西和印度的研究者在生物多样性数据论文发表方面多于中国研究者。这一方面反映了中国研究者对生物多样性数据论文这种新的数据共享方式尚不理解, 相关领域的中国期刊能够做些推进工作; 另一方面反映出中国相关领域的数据共享文化有待普及。之前有关生物多样性领域科学家对数据共享态度的一项国际调研(Huang et al, 2012), 以及最近一份有关科学数据共享
27、的报告(Fane et al, 2016), 均显示亚洲地区研究者的数据共享意愿较低, 这也可能与部分亚洲国家普遍采纳以SCI论文作为科研评价的主要指标有关。 对BDJ和SD两本数据期刊的分析, 为理解生物多样性数据论文的发表趋势提供了实证数据, 也说明了数据论文关于生物多样性领域的研究和数据共享实践具有重要价值。近期, Ecology Letters等期刊结合发表社论, 呼吁生态进化领域的科学家应该通过数据共享等增加研究的透明性和可靠性, 并称将开场施行有关数据共享等的新举措(Parker et al,2016)。我们建议中国生物多样性领域的研究者和期刊关注生物多样性论文和生态进化领域期刊有关数据共享政策的进展, 并更多地践行生物多样性数据共享。






