1、20232023年第年第5 5期期第 53 卷 第 5 期 总 第 237 期2023 年 9 月基于文献计量与知识图谱的我国科研数据开放研究*刘鹏(阜新高等专科学校,辽宁阜新123000)摘要 文章以中国知网的期刊数据库为数据统计源,采用文献计量和知识图谱分析方法,从发文趋势、核心研究力量、学科分布等方面对我国科研数据开放领域的研究现状进行全面分析,并利用Citespace软件探查我国科研数据开放领域的研究主题,包括基本理论与方法、国际经验借鉴、政策与安全、应用与平台等。最后从数据重用、出版、伦理和知识产权等方面探讨我国科研数据开放的研究趋势。关键词 知识图谱;文献计量;科研数据开放;研究主
2、题;研究趋势中图分类号G644文献标识码A文章编号2095-5197(2023)05-0077-11Research on Scientific Research Data Opening in China Based on Bibliometricsand Nowledge MapLIU Peng(Fuxin Higher Vocational College,Fuxin 123000,China)Abstract:This paper takes the journal databases of CNKI as the data statistical source,adopts the
3、bibliometrics andknowledge mapping analysis methods,and takes the opening of scientific research data in China as theresearch object.It comprehensively analyzes the research status from the aspects of the trend of papersissued,core research forces,journal distribution,discipline distribution,etc.It
4、also uses the keywordsclustering function of Citespace to analyze the hot research topics of scientific research data opening inChina,including basic theories and methods,international experience,policies and security,applicationsand platforms.Finally,it analyzes the research trend of scientific res
5、earch data opening in China is analyzedfrom the aspects of data reuse,data publishing,data ethics and intellectual property rights.Keywords:knowledge map;bibliometrics;scientific research data opening;research topics;research trendsCLC number:G644随着数据密集型科研范式的兴起与迅猛发展,科研人员在研究过程中产生了大量数据,这些数据被称为科学数据或科研数
6、据,这些数据除了在初始研究目标中产生了重要的价值外,本身还具备很高的再利用价值。因此,关于科研数据的开放问题在国内外均得到广泛关注。我国从2002年以后开始关注科研数据开放问题,现在已经走过20多年的研究历程,并积累了丰富的研究成果。本文将对与数据开放研究主题相关的研究成果进行全面梳理,分析数据开放研究的现状、总结研究热点,并对其研究趋势进行预测,从而为相关研究人员在研究内容上提供一些借鉴,在研究方向的选择上提供一定的指导。1数据统计源与分析工具本研究以中国知网的期刊数据库作为统计源,并以“(TI=(科研数据+科学数据+科学研*本文系2022年度辽宁省社会科学规划基金重点项目“文化数字化战略背
7、景下图书馆数字化转型与发展进路”(课题编号:L22ATQ001)研究成果。文献考论与计量 图书馆研究(Library Research)77第 53 卷 第 5 期 总 第 237 期2023 年 9 月20232023年第年第5 5期期图书馆研究究数据)and TI=(开放+共享+公开+复用+重用+再利用)or(KY=(科研数据+科学数据+科研人员+科研机构+科学研究数据)and KY%(开放科学+数据开放+数据共享+开放数据+共享数据+数据公开+公开数据+开放获取+开放存取+共享)orKY%(科研数据共享+科研数据开放+开放科研数据+共享科研数据+科学数据共享+科学数据开放+共享科学数据+
8、开放科学数据)”作为检索式进行检索,期刊类型设定为全部期刊,时间限定为不限至2022年12月31日,对检索结果进行手动清洗后,得到符合条件的结果968 条。检索结果数量适中,能够满足分析需求。本文对于现状分析部分,将采用文献计量法,主要利用EXCEL的数据统计、制图及回归分析功能来进行分析;对于研究热点和研究趋势分析 部 分 将 采 用 可 视 化 分 析 法,主 要 利 用CITESPACE的聚类、时区图等功能进行分析。2我国科研数据开放研究现状分析2.1发文量统计分析图1我国科研数据开放研究年发文量统计图一个研究主题的相关发文量可以反映此主题的受关注程度,不同年份相关发文量的差异也可以在一
9、定程度上反映出此研究主题的发展趋势。我国科研数据开放研究的年发文量统计结果如图1所示。从图1中可以看出,我国关于科研数据开放最早的论文的发表于1999年,但是此主题并没有引起研究人员的关注,直到2002年以后,此主题再次走进研究者的视野,2003年以后此主题发文数量开始迅速增长,2009年发文量达到49篇,达到第一个阶段性峰值后此研究主题进入一个较短的低迷期,年发文数量开减少。直到2013年,此主题再一次成为热门研究主题,发文量再次呈现迅速增长迹象,于2020年发文量达到峰值,已经达到80篇。再从20202022年这3年的发文量数据来看,这三年每年的发文量均超过70篇,这表明,我国科研数据开放
10、研究仍然是一个热门研究主题。2.2核心研究作者分析根据普赖斯定律,半数的相关论文为一群高产作者所撰写。而高产作者发文最少篇数的计文献考论与计量 7820232023年第年第5 5期期第 53 卷 第 5 期 总 第 237 期2023 年 9 月算公式为:M=0.749Nmax,其中Nmax是指此研究领域内发文量最高作者的发文篇数。1在我国科研数据开放研究领域,Nmax=17,因此,M4。即高产作者的发文数量最少为4篇。根据统计可知,发文量超过4篇的作者共有59位,这59位高产作者的发文总量为419篇,这一数据与相关论文总量的一半441篇较为接近,表明我国科研数据开放研究领域的高产作者群体已经
11、基本形成。本研究采用综合指数法来判定数据开放研究领域的核心研究作者。综合指数法是指将与研究主题相关性较强的因素赋予相应的分值和权重,并转换成特定指数,最后汇总成综合指数并排序,利用排序结果来对判定对象进行判定的方法。笔者通过专家访谈法得出,与核心研究作者判定相关性较强的因素分别是相关发文总量(A)、以第一作者身份发表相关论文的数量(B)、相关发文的总被引次数(C),作者在此研究领域的H指数(D)、发表的相关论文被核心期刊收录的数量(E),其权重分别为:25%、20%、25%、20%和10%。核心研究作者(H)的判定公式为:Hi=(Ai/A均*25%+Bi/B均*20%+Ci/C均*25%+Di
12、/D均*20%+Ei/E均*10%)*100,其中i=(1,2,3,,59),A均、B均、C均、D均、E均分别是相应因素得分的均值,根据计算可知:A均=7.34、B均=3.91、C均=131.50、D均=5.24、E均=4.96,利用判定公式可到核心研究作者列表,如表1。核心研究作者判定的阈值一般采用将平均值代入公式,得到的数值作为阈值,此数值为100。因此,综合指数大于100的高产作者可以被认定为此领域的核心研究作者。表1我国科研数据开放领域核心研究作者综合指数表(前10位)作者司莉邢文明顾立平盛小平刘桂锋王卷乐孙九林刘润达朱星明诸云强A1715181514181318109B1387138
13、84764C517448334202322301386248203288D12101081199787E1713141513127778A指数3.322.051.793.322.052.051.021.791.531.02B指数2.322.042.452.041.912.451.772.451.361.23C指数3.933.412.541.542.452.292.941.891.542.19D指数2.291.911.911.532.101.721.721.341.531.34E指数3.432.622.823.022.622.421.411.411.411.61综合指数307.81241.572
14、23.70223.17218.71215.97182.85181.78148.85147.70根据统计结果可知,我国科研数据开放研究领域的核心研究作者共有23位,考虑到人数较多,因此笔者只针对前十位核心作者进行重点分析。根据综合指数排名,可将核心研究作者分为三个梯队,排在第一梯队的作者是司莉,她是唯一一位综合指数超过 300 的作者,且五项指标均排在第一位,表明其是此研究领域的标杆式领军人物。排在第二梯队的核心研究作者分别是邢文明、顾立平、盛小平、刘桂锋和王卷乐,他们的综合指数都达到了200以上,他们在五项评价指标中,虽然没有像司莉一样各项指标都达到优秀,但是综合表现也非常突出,这些核心研究作
15、者的研究成果值得重点关注。排在第三梯队的核心研究作者是综合指数在100文献考论与计量 刘鹏:基于文献计量与知识图谱的我国科研数据开放研究79第 53 卷 第 5 期 总 第 237 期2023 年 9 月20232023年第年第5 5期期图书馆研究以上的作者,共有 17 位,他们在某一项或几项指标中表现较好,在科研数据开放研究领域中的某个研究方向上有突出贡献,他们更专注于某一研究方向或主题,相关研究者可以根据自身的研究兴趣选择相应核心研究作者的成果进行深入研究和学习。2.3核心研究机构分析很多研究机构因为地域、资源、经济、人才等因素,在某些研究领域具有明显的优势,从而在科研产出上要优于其他机构
16、。因此,对于核心研究机构的确定同样值得研究。本文对核心研究机构的判定同样采用综合指数判定法。具体判定流程与核心研究作者的判定过程相似。判定核心研究机构的重要指标分别是发文总量X、总被引次数Y和发文被核心期刊收录量Z。其权重分别为40%、40%和20%。核心研究机构综合指数 W 的计算公式为:Wi=(Xi/X均*40%+Yi/Y均*40%+Zi/Z均*20%)*100,其中i=(1,2,3,31)。根据综合指数排序,可知入围核心研究机构的单位共有6个,如表2所示。表2我国科研数据开放核心研究机构综合指数排序表排序123456/机构中国科学院大学武汉大学中国科学院地理科学与资源研究所中国科学技术信
17、息研究所中国农业科学院农业信息研究所上海大学阈值X72635239392218.16Y139214581132437326227288.39Z59612321192112.00X指数3.963.472.862.152.151.211.00Y指数4.835.063.931.521.130.791.00Z指数4.925.081.921.751.581.751.00综合指数450.00442.66309.88181.52162.79114.94100.00从表中可以看出,我国科研数据开放研究领域的核心研究机构一共有6个。其中排的第一梯队的分别是中国科学院大学(含文献情报中心)和武汉大学,二者综合指数
18、都超过400,遥遥领先于其他机构,表明这两个机构在我国科研数据开放研究领域有较高的权威性。排在第二梯队的是中国科学院地理科学与资源研究所,其围绕地理科学数据开放的政策、平台、服务与评价等内容进行深入的研究,这种针对某一主题进行专深研究的方式,更容易形成高价值的研究成果,同时也是更值得借鉴的研究方式。排在第三梯队的是中国科学技术信息研究所、中国农业科学院农业信息研究所和上海大学,这三个机构虽然在综合指数上得分并不高,但是他们在科研数据开放研究领域同样表现非常突出,分别针对特定领域的科研数据展开深入研究,对于特定研究方向的研究者来说,是非常重要的借鉴对象。2.4学科分布分析根据期刊分布分析可以看出
19、,我国科研数据开放研究具有明显的多学科交叉性,其具体的学科分布亦需要明确。笔者对于每一年发表的论文进行学科统计,学科分类采用的是中国知网提供的学科分类体系,分类级别采用二级学科。据统计,相关论文所属的学科共有65个,再一次证明科研数据开放研究的交叉主题属性。对每个学科的相关发文量进行统计后,将相关发文量超过10篇的学科进行降序排列,得到表3。从表3中可以看出,图书情报与数字图书馆、计算机软文献考论与计量 8020232023年第年第5 5期期第 53 卷 第 5 期 总 第 237 期2023 年 9 月件与计算机应用、科学研究管理这三个学科的发文量最多,均超过了150篇,表明这三个学科是科研
20、数据开放的主力研究学科。新闻与传媒、医学教育与医学边缘学科两个学科的发文量也超过了50篇,表明这两个学科对于科研数据开放研究也较为重视。在统计过程中发现,新闻与传媒学科关于科研数据开放研究的发文量也在逐年增加,且发展势头较好。未来,该学科有可能成为此领域的主力研究学科。另外,从表3中呈现的其他学科也可以看出,高等教育和出版学科的相关发文量也都超过了30篇,表明其有可能是此研究领域的潜在主力学科。表3我国科研数据开放研究相关学科统计表(部分)排序12345学科图书情报与数字图书馆计算机软件与计算机应用科学研究管理新闻与传媒医学教育与医学边缘学科发文量2892051547156排序678910学科
21、高等教育出版地球物理学自然地理学和测绘学互联网技术发文量3330292821排序1112131415学科农业基础科学气象学地质学医药卫生方针政策与法规农业经济发文量1716161212图2我国科研数据开放领域累计学科统计及趋势图文献考论与计量 刘鹏:基于文献计量与知识图谱的我国科研数据开放研究81第 53 卷 第 5 期 总 第 237 期2023 年 9 月20232023年第年第5 5期期图书馆研究为了更清晰的展示我国科研数据开放领域的学科分布与增长趋势,笔者对于每年的累计学科数量进行统计,并对统计结果进行曲线拟合,具体结果如图2所示。从累计学科数量结果可以看出,相关的研究学科数量几乎每年
22、都在增加,而且从曲线拟合的结果可以看出,其与三次曲线的拟合结果较好,R2=0.994。从拟合曲线的趋势可以看出,在未来五年内会有更多的学科加入科研数据开放研究领域,而且学科数量的增速会加快,到2027年,相关学科有可能会超过90个。3我国科研数据开放研究主题分析Citespace的关键词聚类功能可以很好地展示特定研究领域的研究主题。笔者将与科研数据开放相关的955篇论文的关键词进行聚类分析,聚类节点采用g-index(k=20)方式,聚类算法采用LLR法,结果如图3所示。从图3中可以看出,核心聚类簇共有10个,每个聚类簇对应不同的颜色,标签和大小。颜色反映的是相关聚类的活跃时间段;标签代表聚类
23、簇中最核心的关键词,同时也能大致反映聚类簇的主题内容;大小代表聚类簇中关键词数量多少等信息,聚类簇详细信息可通过软件中的“Cluster Explore”功能获取,具体信息如表4所示,其中聚类规模数值越大,代表此主题研究越活跃。平均轮廓值代表聚类簇的有效性,一般认为,当数值大于0.5时,说明此聚类合理,大于0.7时,说明聚类令人信服。核心关键词后的数值,LLR代表对数最大似然率,该数值越大,表明其与聚类标签关系越紧密,p-level代表显著性,该值0.05,即为合理。综合分析图3和表4,并结合相关文献进行分析,可以得到我国科研数据开放的研究主题如下:图3我国科研数据开放相关论文关键词聚类图文献
24、考论与计量 8220232023年第年第5 5期期第 53 卷 第 5 期 总 第 237 期2023 年 9 月表4我国科研数据开放相关论文关键词聚类详情统计表ID0123456789聚类规模7460483733292723238平均轮廓值0.8980.550.7510.8190.7960.8450.9040.8380.8970.984聚类标签数据共享科学数据科研数据数据政策数据评价共享平台开放获取安全策略开放共享美国核心关键词(LLR,p-level)数据共享(60.03,1.0E-4);元数据(54.84,1.0E-4);公共卫生(15.04,0.001);关联数据(15.04,0.00
25、1);webgis(15.04,0.001)科学数据(76.44,1.0E-4);共享(40.93,1.0E-4);数据政策(10.14,0.005);开放获取(7.42,0.01);科技创新(7.15,0.01)科研数据(69.49,1.0E-4);数据管理(52.72,1.0E-4);开放数据(48.55,1.0E-4);科研人员(32.42,1.0E-4);开放存取(28.62,1.0E-4)数据政策(31.85,1.0E-4);数据库(21.97,1.0E-4);数据集(15.51,1.0E-4);政策(15.51,1.0E-4);科学数据资源(10.91,0.001)数据评价(63.
26、51,1.0E-4);数据管理办法(12.5,0.001);评价方法(12.5,0.001);冲突(12.5,0.001);地球信息(12.5,0.001)共享平台(37.34,1.0E-4);共享模式(15.8,1.0E-4);数据共享(15.52,1.0E-4);共享服务(14.38,0.001);技术标准(12.5,0.001)开放获取(66.62,1.0E-4);开放科学(26.63,1.0E-4);数据重用(12.39,0.001);数字学术(11.15,0.001);s计划(11.15,0.001)安全策略(31.99,1.0E-4);隐私保护(18.71,1.0E-4);数据安全
27、(15.7,1.0E-4);数据资源(14.31,0.001);共享机制(12.45,0.001)开放共享(41.82,1.0E-4);个人数据(23.88,1.0E-4);政策协同(18.15,1.0E-4);文本分析(14.76,0.001);数据共享(14.54,0.001)美国(21.16,1.0E-4);国外(9.67,0.005);加拿大(9.67,0.005);分类体系(9.67,0.005);数据编码(9.67,0.005)活跃年份2002-20202010-20212004-20222003-20212006-20222004-20152007-20212003-202220
28、09-20222000-20093.1科研数据开放理论与方法研究想要对某一个研究领域进行深入研究,其相关的基本理论研究一般在研究起步阶段会非常受重视,同时随着研究的不断深入,相在的理论研究也会不断丰富。此主题的典型聚类为#0、#1、#2、#6和#8,从活跃时间跨度来看,该研究主题从研究起步阶段到现在,一直都是一个备受关注的主题。而且研究范畴较广,相关理论的研究既包括对于科研数据的定义、范围、分类和描述等,也包括科研数据开放的运行模式、保障机制、实现路径、影响因素、开放机理等内容3。同时,利益相关者理论、博弈论、系统动力学等理论与模型4,以及质性文本分析、层次分析法、元人种志分析、合作网络分析、
29、可视化分析等5多种研究方法都被应用到我国科研数据开放的研究当中。由于国内对于科研数据开放研究起步较晚,所以文献考论与计量 刘鹏:基于文献计量与知识图谱的我国科研数据开放研究83第 53 卷 第 5 期 总 第 237 期2023 年 9 月20232023年第年第5 5期期图书馆研究未来很长一段时间内,科研数据开放的基本理论及其分析方法研究将会是一个长久性的研究主题。3.2科研数据开放政策研究严谨规范的政策法规体系可以为各项事务的持续健康发展提供指导和保障,我国的科研数据开放研究领域也非常重视相关政策的研究。该主题的典型聚类是#3。从研究的活跃时间跨度看,此研究主题有较强的研究生命力,从研究早
30、期到现在一直备受关注。相关学者特别重视对国外科研数据开放政策的借鉴与推广研究,利用多种分析方法对于国外相关政策文本和案例进行多维度分析,包括相关要素、主体责任、框架设计等10,为我国科研数据开放政策的制定提供大量可借鉴的素材。同时,对于国内的科研数据开放政策研究,既包括热点趋势、动向研判、环境建设、体系构建等11宏观性问题的分析,也包括个人数据保护、政策量化评价、利益平衡机制、政策议程设置等12微观性问题探讨。国内科研数据开放的相关政策法规较少,而科研数据开放的发展又亟须完善的政策体系的支持,因此对于科研数据开放政策的相关研究将会是一个热门研究主题。3.3科研数据开放评价研究为了促进研究领域的
31、健康可持续发展,对其进行相应评价是非常必要的。我国科研数据开放研究领域也十分注重对领域内不同主题和整体的评价。该主题的典型聚类为#4。从研究的活跃时间跨度看,此研究主题在此研究领域的前期开始受到重视,并且持续受关注到现在。盛小平13等对于我国科研数据开放的整体性评价进行综合性阐述,刘桂峰14等对领域内的数据质量的评价对象、体系、方法、技术及其进展开展深入分析。部分学者也分别针对科研数据开放的政策、平台、影响力等15构建相应的评价指标体系。同时,相关学者也针对用户注册协议的合规性、新型研发机构的运行绩效、共享政策量化等16细节性问题的评价进行分析。另外,不同学科的学者分别从数据引证、替代计量、层
32、次分析等多重视角下,对特定领域数据开放中的元数据质量、利用效率等17内容进行评估分析。这些评估与评价研究对于我国科研数据开放的理论与实践起到了重要的修正与指导作用。3.4科研数据开放技术与平台研究科研数据得以有效开放的重要载体是数据开放平台。该主题的典型聚类是#5,从活跃时间跨度来看,此研究方向在科研数据开放研究的早期和中期更受重视。农业科学、海洋科学、环境与生态、交通运输等多个领域已经构建相应的数据开放共享平台。平台建设的好坏直接关系到科研数据开放的范围、质量和效率,因此,科研人员非常重视科研数据开放平台的研究,包括对于平台的系统选型、功能定位、优化策略、综合评价、典型案例等6内容的理论性探
33、讨,也包括虚拟化、元数据、GIS、中间件等7技术在平台构建中的应 用 研 究。同 时,相 关 研 究 人 员 也 对 包 括DSPACE、CKAN、P-CUBE,Hadoop等8在内的常用科研数据开放平台的基础软件或系统架构进行深入分析,包括其优缺点及其适用范畴等。另外,相关研究人员也对于我国科研数据开放平台建设过程中所面临的问题进行深入的分析,并积极地寻求相应的对策9。随着技术的进步与需求的改变,科研数据开放平台也会随之不断升级,因此,围绕科研数据开放平台的相关研究也将成为持续性较强的研究主题。3.5科研数据开放安全问题研究科研数据开放面临的最大问题,就是开放数据及平台的安全问题。很多科研人
34、员或机构不愿意将科研数据进行开放共享的重要原因是担心数据能否被安全存储和合理利用,同时也担心个人隐私泄露和知识产权受到侵害。该主题的典型聚类为#7。从研究的活跃时间跨度看,此研究主题在此研究领域一直备受关注。相关人员对于科研数据开放安全的相关基础问题进行全文献考论与计量 8420232023年第年第5 5期期第 53 卷 第 5 期 总 第 237 期2023 年 9 月面分析,包括科研数据开放安全的边界概念、影响因素、责任承担、内容框架、保障路径等18,并着重对于科研数据开放安全的相关政策和行为19进行深入探讨。在借鉴国外先进经验的基础上,提出基于区块链、智能合约、可信云计算等20方案的科研
35、数据开放安全解决策略,构建相应的监管平台。在个人隐私防范方面,研究人员对于国内外相关隐私防范政策进行对比,并制定符合我国国情的科研数据开放隐私治理路径21。另外,也有部分学者对于科研数据开放过程中的知识产权保护和许可机制进行探讨22。3.6科研数据开放国际经验借鉴由于我国科研数据开放研究起步晚于国外,因此相关学者非常重视对国外科研数据开放相关研究的推广与借鉴,该主题的典型聚类为#9。从活跃时间跨度看,此研究主题在研究起步阶段更受关注。相关学者从整体视角对于国外科研数据开放共享的现状和研究进展进行全面分析。也有部分学者从更加深入细致的角度对国外科研数据开放研究进行推介,例如,从国别的角度分别对美
36、国、英国、澳大利亚、欧盟等国家和地区的科研数据开放进行了分析;从研究主题角度分别对国外科研数据开放的原则、方案、隐私、政策等23内容进行了分析;从开放主体的角度分别对世界一流大学、相关国际组织、典型开放机构24等的科研数据开放实践进行了深入探讨。科研数据开放问题已经引起了世界各国的足够重视,因此,对于国外科研数据开放相关成果的推介研究将会是一个非常热门的研究主题。4我国科研数据开放研究趋势分析笔者利用Citespace的Timezone功能对于近5年内科研数据开放相关论文的关键词进行分析,得到图4,结合我国科研数据开放的实际情况,对于图4中的重点关键词进行逐词分析,可以得到一些出现近几年较为活
37、跃且具有较高研究价值的核心关键词,如图4中的方框所示。再对这些关键词对应的相关文献进行综合分析,可以得到我国科研数据开放的研究趋势如下。图4我国科研数据开放研究相关文献近5年Timezone趋势图4.1科研数据出版由理论转向实践,政策与创新研究热度较高科研数据出版工作是推动科研数据开放、实现科研数据价值最大化的重要方式之一,虽然国文献考论与计量 刘鹏:基于文献计量与知识图谱的我国科研数据开放研究85第 53 卷 第 5 期 总 第 237 期2023 年 9 月20232023年第年第5 5期期图书馆研究内对于科研数据出版的研究起步不晚,但是相关研究成果在早期并不太多,相关研究内容主要集中在障
38、碍因素分析、出版模式探讨、实现路径规划、体系框架构建等25理论研究层面,近几年相关发文量开始大幅增加,研究内容也不断深入,相关的实践也取得突破性进展,Nature出版集团已经推出同行评议期刊 科学数据,主要描述价值较高的科研数据集,并提供开放获取26。国内的 图书馆杂志 也依托其所收录的论文原始数据,自建科研数据管理平台,并构建全新的数据出版模式,为我国科研数据出版创新提供借鉴依据。另外,关于科研数据出版的政策研究也开始受到关注。从目前的研究趋势来看,关于科研数据出版相关研究,将是会是此研究领域的重点研究方向。4.2科研数据引用研究日益深入,数据重用方式有待拓展科研数据开放的最直接目的就是促进
39、数据的重复利用,发挥更大的价值。但是在科研数据开放研究的早期,相关研究人员将重点放在如何推动数据开放上面,而忽视数据利用这一原始目的。随着科研数据开放研究与实践的不断发展,对于开放的科研数据如何重复利用,也开始受到关注,相关学者分别从数据复用的研究演化、知识体系、方法工具、过程模型等27多个方面进行分析。在科研数据重复利用的众多研究分支中,研究人员最关注的是数据引用这一主题,他们对于数据引用行为的影响因素28、作用机理、识别方法、实现路径、评价体系等29内容进行深入的分析。但事实上,除了被引用外,开放的科研数据还有很多被再利用的方式值得开发,如对科研数据的计量、影响力评价、深层价值挖掘等。4.
40、3开放性与产权专有性冲突明显,科研数据权益问题备受关注数据作为一种新型的生产要素,已经成为一种重要的资产,科研数据一旦开放,就会面临着数据的知识产权问题,知识产权的专有性与科研数据的开放共享性之间便会产生较大的冲突,如何将这种冲突进行化解是一个非常值得讨论的问题,相关学者从明晰产权界定、健全法规体系、规范产权交易、重视利益协调、加强政府引导等多个角度提出解决策略30。同时也有学者提出从科学数据本身出发来化解这一矛盾,如建立数据唯一标识体系等。除了科研数据所产生的知识产权问题外,数据开放后所形成的数据衍生成果的产权归属、利益分配等问题也是非常有研究价值的主题,而且从图4中的关键词分布可知,产权、
41、所有权、知识产权等关键词都集中于2022年,因此可以看出,我国科研数据开放研究中的产权问题在最近一段时间更受关注,从长远来看,科研数据的产权问题也具有较强的研究生命力。4.4科研数据开放衍生问题凸显,数据伦理问题存在探讨空间随着科研数据开放研究与实践的不断深入,相应的数据垄断、数据滥用、数据造假、数据隐私、数据权益等问题也相继出现,这些问题都涉及同一个领域,即数据伦理问题。相关学者从法理学视角对科研数据开放共享是否符合伦理进行探讨,并对科研数据开放伦理的内涵和外延、基本原则及研究框架进行阐述。也有研究者将科研数据开放的伦理困境、关键性问题、发展方向等内容进行分析,并从隐私变迁、知情同意、伦理审
42、核、隐私分类、通用准备等方面制定相应的伦理要求和管理规范。31关于科研数据开放伦理的相关研究虽然已经出现,但是整体来看,数量较少且主题零散,然而近几年在研究数量上确有明显的上升趋势,因此,关于此主题的研究很有可能会成为我国科研数据开放研究的下一个热门研究方向。参考文献1邱均平.文献计量学 M.北京科学技术文献出版社,1988:188-189.2王贵海,朱学芳.我国替代计量学研究:现状、演进、热点与趋势 J.图书馆论坛,2020(8):43-53.文献考论与计量 8620232023年第年第5 5期期第 53 卷 第 5 期 总 第 237 期2023 年 9 月3王晴.论科学数据开放共享的运行
43、模式、保障机制及优化策略 J.国家图书馆学刊,2014(1):3-9.4是沁,储节旺.基于系统动力学的科学数据开放共享保障机制研究 J.情报杂志,2018(11):143-149.5孙俐丽,赵乃瑄.基于元人种志的科学数据共享关键影响因素识别 J.情报理论与实践,2020(3):91-97,52.6殷沈琴,张计龙,张莹,等.社会科学数据管理服务平台系统选型研究 J.图书情报工作,2013(19):92-96.7朱倩,王华丽.基于中间件的新疆农业科学数据共享平台的体系构建 J.天津农业科学,2016(1):47-51.8洪正国,项英.基于Dspace构建高校科学数据管理平台 J.图书情报工作,20
44、13(6):39-42,84.9刘润达,褚文博,诸云强.国家科技基础条件平台运行服务阶段关键问题探析 J.现代情报,2012(11):51-53,57.10董坤,顾立平.若干国家科研数据开放政策框架研究J.中国科技资源导刊,2016(3):51-57.11马海群,蒲攀.国内外开放数据政策研究现状分析及我国研究动向研判 J.中国图书馆学报,2015(5):76-86.12白锐,吕跃.基于修正多源流模型视角的政策议程分析以 科学数据管理办法 为例 J.图书馆理论与实践,2019(10):50-55.13盛小平,焦凤枝.国内外开放数据评价研究综述 J.情报杂志,2022(8):131-137.14刘
45、桂锋,聂云贝,刘琼.数据质量评价对象、体系、方法与技术研究进展 J.情报科学,2021(11):13-20.15程铭,潘云涛,马峥,等.开放科学视角下期刊影响力评价指标体系研究 J.中国科技期刊研究,2022(3):391-398.16文禹衡,金铭.科学数据中心用户注册协议的合规性评估研究 J.图书情报知识,2022(1):119-129.17王博.林业开放政府数据元数据质量评估研究 D.北京林业大学,2020.18李洋,温亮明.我国科学数据安全保障路径研究 J.图书馆,2021(3):99-105.19阮建海,杨燕.科学数据安全行为研究综述 J.现代情报,2019(9):151-159.20
46、魏银珍,邓仲华,关玉蓉,等.一种基于区块链与智能合约的科学数据安全溯源方法 J.现代情报,2021,(1):32-38.21黄国彬,刘馨然,张莎莎.英澳科学数据共享过程中个人隐私保护政策研究 J.图书情报知识,2017(6):105-113.22王舒,王红,宋晓丹.科研数据的知识产权保护与许可机制研究 J.图书馆论坛,2016(4):65-71.23温芳芳.国外科学数据开放共享政策研究 J.图书馆学研究,2017(9):91-101.24唐源,吴丹.国外医学科学数据共享政策调查及对我国的启示 J.图书情报工作,2015(18):6-13.25吴立宗,王亮绪,南卓铜,等.科学数据出版现状及其体系
47、框架 J.遥感技术与应用,2013(3):383-390.26韦博洋.Nature出版 科学数据 期刊 J.地球科学进展,2014(6):711.27宋秀芬,周茜,李立睿,等.科研数据再利用过程模型研究 J.情报理论与实践,2021(6):61-68.28黄国彬,刘馨然,姜颖.影响科学数据引用的外部因素分析 J.数字图书馆论坛,2017(6):2-8.29丁楠,黎娇,李文雨泽,等.基于引用的科学数据评价研究 J.图书与情报,2014(5):95-99.30朱雪忠,徐先东.浅析我国科学数据共享与知识产权保护的冲突与协调 J.管理学报,2007(4):477-482,487.31岳素芳.科学数据共享的合伦理性探究 J.郑州大学学报(哲学社会科学版),2021(6):34-38.作者简介 刘鹏(1982),男,馆员,本科,研究方向:图书馆管理、文献计量。收稿日期 2023-2-1(编发:刘艳)文献考论与计量 刘鹏:基于文献计量与知识图谱的我国科研数据开放研究87