2026科研分类与结构化数据的价值研究报告.pdf

资源描述

科研分类与结构化数据的价值2026 年 3 月Jonathan Adams,Dmytro Filchenko作者简介传承基石，引领未来关于科学信息研究所（ISI）科睿唯安旗下的科学信息研究所（ISI）半个多世纪以来始终致力于科研信息组织工作的开创与推进。如今，ISI继续致力于提升科研诚信，并改进科关于 ISI 报告ISI 报告借助科睿唯安值得信赖的出版物和引文数据与分析，针对前沿研究趋势提供简明而深刻的洞察。Jonathan Adams 博士是科学信息研究所（ISI）首席科学家，兼任伦敦国王学院政策研究所客座教授。2017年，埃克塞特大学因其在高等教育与研究政策方面的贡献授予其荣誉理学博士学位。ORCiD：0000-0002-0325-4431。Web of Science ResearcherID：A5224-2009。学信息的获取、解读与利用。ISI 维护着 Web of Science 索引及其相关分析内容与服务所依托的核心知识库。ISI 通过各类活动、会议和出版物传播相关知识，并开展原创研究以持续巩固、拓展和完善这一知识体系。本报告是科学信息研究所（ISI）文献计量学方法与分析系列报告之一，阐述了科睿唯安对科研活动数据进行结构化处理的方式与原因，以确保全球DOI:10.14322/isi.research.categorization.and.the.value.of.structured.data如需了解更多信息，欢迎访问科研生态系统中的知识发现、评估与决策，均建立在可靠、可比且具备情境感知的信息基础之上。Dmytro Filchenko 博士于 2024 年加入科睿唯安，担任科学信息研究所研究与分析高级总监。他取得了乌克兰数学建模与计算专业博士学位，在学术界和商界均拥有超过15年的经验。其多元化领导背景包括曾任苏梅国立大学副教授兼副校长、基准测试主管和技术总监。他还曾是一位企业创始人。加入科睿唯安之前，他曾就职于 QS（Quacquarelli Symonds），责主导 QS 世界大学排名系列及一系列其他教育科技和研究情报产品的开发。概览执行摘要科研分类的定义与重要性科研文化与研究文献科研分类对引文分析的重要性引文网络如何识别学科分类跨内容的学科分类将数据类别映射至国家评估体系将科研元数据映射至发展目标国际合作的分类结论：结构化科研活动数据的重要性执行摘要无论是在自然科学、工程技术，还是经济与社会科学领域，高质量的科研分析均依赖经过验证且结构化的数据。一个管理得当的数据库，如果同时具备全面的元数据，能够与其他数据源实现互操作，其用途将更加广泛。科研本身如此，科研信息与分析亦然。本报告聚焦科睿唯安及其科学信息研究所（ISI）所采用的一系列方法与流程，旨在确保数据、分类结构及相关元数据等关键要素，始终处于 Web of Science 文献计量数据库及其相关产品的核心位置。ISI 的学术期刊分类体系可追溯至 1956 年 Current Contents 的创刊。这是一份定期发布的刊物，用于向研究人员通报最新的期刊出版信息。最初主要覆盖生物学与医学领域，随后迅速扩展至包括社会科学、人文艺术在内的全部研究领域。每期均按学科分组设立子栏目，并通过关键元数据进行索引，例如作者、机构所在地、关键词等。随着技术进步和出版形式的多样化发展，ISI 及在其基础上诞生的科睿唯安相关部门不断识别并应对围绕出版数据结构的一系列挑战。本报告围绕方法的演变过程，重点探讨以下问题：科研文化：不同学科之间不仅研究内容各异，其科研文化亦各不相同，包括研究组织方式、规划管理模式以及成果发表形式等。其中一个重要变量在于期刊论文、会议论文或学术专著在不同领域所占的主导地位。为了实现可比性分析，必须将这些差异考虑在内。第 2 节列出了 Web of Science 核心合集中的主要文献类型，并展示其在不同学科领域的使用差异（图 1）。第 3 节举例说明了不同学科类别之间的其他文化差异，以及这些差异对文献计量分析的影响（图 2、图 3）。自上而下的分类与自下而上的主题：分类工作通常从宏观视角出发，自上而下逐步细化，系统长期保持稳定，便于用户以熟悉的方式检索信息。另一种路径则从最细粒度的层面出发，根据共同特征向上聚类，形成更具时效性和主题性的结构。第 4 节回顾了 Web of Science 数据所采用的粗粒度与细粒度结构，并介绍了 ISI 与莱顿大学科学技术研究中心（CWTS）合作开发的一种基于引文数据的主题分类体系。第 5 节进一步探讨跨内容的自下而上分类方法，展示了如何通过关联互补数据库，为关键研究主题提供更深入的洞察。将研究映射至发展目标与成效：分类体系必须具备全面性，对于 Web of Science 而言，这不仅意味着覆盖全面，还需适用于多样化的研究目的。科研评估体系通常围绕管理与政策需求构建，科研政策目标往往由国家需求或社会目标所驱动，例如研究活动对经济社会产生的影响。那么，这些体系之间应如何建立关联？第 6 节将全球期刊类别与国家层面的评估分类体系进行关联，并展示了 ISI 在 1996 年Research Assessment Exercise（RAE）中的映射实践（图 4）。第 7 节介绍了将 Web of Science 数据映射至联合国可持续发展目标（SDG）所采用的方法。合作的影响：ISI 早在 20 世纪 90 年代就已经明确了研究学科分类的必要性，而其近期研究进一步表明，国际合作能够提升论文的被引频次与科研影响力。第 8 节展示了科研评估工具 InCites Benchmarking&Analytics 如何对国内与国际合作进行分类，以识别在同类型文献中引用表现突出的研究成果（图 5、表 1）。结构化科研活动数据的重要性：结构化、经过验证且具备互操作性的科研活动数据，并非只是便利工具，而是实现可信检索、发现与评估的前提条件。结论部分总结了本报告中的若干关键可行见解，供科研人员及科研分析人员（包括科研管理部门、基金资助机构及政策制定者）参考。1.科研分类的定义与重要性经过筛选、验证并结构化的数据，是开展可信科研分析的基础。当数据库通过全面的元数据具备多功能性，并与相关、互补的数据资源实现互联互通时，这一基础将更加坚实。这一原则不仅适用于科研本身，亦适用于科研成果发表与绩效数据。依托源自科学信息研究所（ISI）数十年的方法论积累，科睿唯安打造了 Web of Science一个由共享元数据与清晰的分类结构连接而成的数据库体系，帮助科研人员、机构及政策制定者应对日益复杂且高度互联的科研环境i。对于科研读者而言，对学术出版物进行索引与分类的需求由来已久。1945 年之后，随着科研期刊数量的激增，这一需求愈发迫切。Eugene Garfield博士意识到，研究人员需要“路标”来追踪海量的最新信息。这一洞察促成了科学信息研究所（ISI）的成立（现为科睿唯安核心组成部分），以及周报 Current Contents 的推出。目前，科睿唯安已收录超过 22,000 种经编辑遴选的期刊，每种期刊均归入 Web of Science 核心合集的 254 个学科类别中，并实现整本完整收录，该持续扩展的数据集合中已包含 9,900 万条元数据记录和 26 亿条引文链接。科研分析同样依赖结构化数据。一篇高被引论文或许代表具有影响力的研究成果，但仅靠被引次数这一个指标，如何将其与其他论文进行比较？哪些“其他论文”才具有可比性，是否应限定为同一学科、同一年份、同一国家或地区？如果忽视这些变量，分析结果可能产生多大偏差？一个典型错误是在初步分析论文与引文数据时，直接计算每篇论文的平均被引次数，这种平均值往往既缺乏意义，也具有误导性。因此，合理的分类是关键。科研分类可以基于学科、领域、研究方向、研究活动类型或文献类型。科研工作的每一条信息都附有一系列特征属性，即元数据，它们揭示了科研活动的特定信息：研究内容、发生地点、完成时间、研究主体与合作者，以及资助方。这些特征不仅会影响研究项目的进程与成果，也有助于揭示其与其他类型数据标签（如专利、科研项目及政策目标）之间的关联。因此，这些信息必须得到妥善记录、清晰呈现，并便于读者、研究人员和分析人员获取。当元数据出现不完整、不一致或结构混乱时，研究发现与分析可能产生严重偏差。研究人员与分析人员面临的主要挑战包括：非结构化的时间元数据，可能导致误导性的趋势判断，而数据覆盖不完整则会造成分析缺口；学科分类不严谨或缺乏一致性，会削弱可比性，并可能导致错误结论；文献类型元数据缺乏一致性，会使比较分析失去有效性；对非传统科研成果的结构化收录不足，会限制跨数据源的发现与分析；机构归属数据不完整，会导致合作分析失真，而忽视不同合作模式则可能得出误导性结论。2.科研文化与研究文献科研文化会影响研究人员发表研究成果及参考已有文献的方式。不同类型的科研活动逐渐形成了各具特征的论文与引文模式。例如，在生物医学领域，研究团队通常发表频率较高，论文篇幅相对较短，并且常引用标准方法论。而在工程学领域，研究成果往往先通过会议论文发表，随后再整理为期刊文章，因此论文产出频率较低，但成果更为凝练综合。由此，也导致生物医学领域的引文总体规模显著大于工程学领域，两者的引文分布特征自然存在差异。研究文献的主要类型及其特征包括：研究论文与综述论文：是自然科学领域原创性研究的主要成果形式。引用是科研文化的核心组成部分，较高的引文影响力与学术声誉之间的正相关关系已得到广泛认可。会议论文：是工程与技术领域将研究成果快速传达给科研用户的重要渠道，更贴近实际应用，但其引文模式与期刊论文存在明显差异。图书、图书章节与专著：是人文与艺术领域的重要成果形式。在这些领域中，即便一部专著具有重要影响，也可能需要较长时间才能形成引文影响力。灰色文献（Grey Literature）：包括研究团队、公共部门、智库、政府机构等基于学术研究撰写的各类报告。这类文献具有重要价值，但结构化程度较低，直到近年才开始纳入索引。其与所依据的先前研究之间的关联往往不一致，且较难验证。任何文献对于信息检索与知识发现都可能具有重要意义，因此科睿唯安在 Web of Science中对上述所有文献类型按照统一标准与结构进行分类处理，以支持全面、完整的检索与发现。然而，在科研评估中，经过同行评议的研究论文与综述论文通常仍是引文数据的核心来源。引文分析一般局限于期刊文献所构成的引文索引体系，这一体系形成了跨学科的通用衡量标准。然而，若在评估人文学科研究时忽视图书成果，或在评估研究影响（尤其是更广泛的社会影响力）时忽视灰色文献，都是不恰当的。但简单计算得出的被引次数，目前尚无法为科研管理与评估提供有效信息，因此需要谨慎、负责任地加以使用与解读ii。ISI 曾与英国周期性科研评估体系Research Assessment Exercise（RAE）及科研卓越框架（Research Excellence Framework，简称 REF）的管理机构合作，对学者在同行评审中所选择提交的文献构成比例进行了详细分析。由于评估结果影响科研经费的分配，这些文献理应反映研究人员自认为最具代表性的重要成果。研究发现，尽管不同学科领域之间的文献类型构成差异基本符合预期，但各学科内部的文献类型构成却在不同时间阶段呈现出令人意外的变化。图 1.1996 年至 2021 年英国科研评估周期中，学者所选择提交的研究文献构成比例。图中展示了按大类学科领域归类的评估单元（Units of Assessment，UOA）在四种主要文献类型上的分布。“其他提交成果”包括专利、灰色文献、展览与表演记录，以及其他未发表资料iii。其他提交成果著作与著作章节艺术与人文社会与经济科学工程与技术科学与医学会议论文期刊论文1996200120082014202125 年间，研究成果类型的构成比例发生了变化：社会科学领域逐渐从专著转向期刊论文，工程学领域则从会议论文转向期刊论文。自然科学领域始终专注于期刊论文，而艺术与人文学科仍然保持以图书为主要发表形式的传统。像 Web of Science 这样结构完善的数据库，能够对各类科研成果进行全面覆盖并清晰标注。理解不同文献类型及其发表工作的差异，不仅对研究发现至关重要，也会对科研绩效的分析方式产生重要影响。下一节将探讨发表行为对引用行为的影响，从而说明严谨分类对于有效评估的必要性。3.科研分类对引文分析的重要性研究文献体系的一个关键特征是，引文会随着时间不断累积。长期以来的研究表明，期刊论文的引文通常在发表后的最初几年迅速增长，随后年增量逐渐下降，并在大约十年后趋于稳定。鉴于这一引文增长规律，近期发表的论文平均被引次数通常低于较早期发表的论文。如果基于当前数据，对某一国家或地区从过去某一时间点到现在的“篇均被引次数”进行简单计算并绘制趋势图，通常会发现：越接近当下，论文的平均被引次数越低。这反映的是较早发表的论文拥有更长的被引时间窗口。因此，为使引文分析中的数据更具同类可比性，我们需要按照发表年份对所有论文（无论是全球还是国家层面）进行分类，再将每篇论文的被引表现与相应年份的全球平均水平进行比较，从而重新计算其引文影响力。然而，仅考虑时间维度仍然不够。如前文所举示例，生物学、工程学等不同学科的科研文化及发表方式存在差异，因此要实现真正的同类可比，研究数据不仅需要按年份分类，还必须按学科分类，从而计算出“学科规范化的引文影响力”（CNCI）。在 CNCI 指标中，每篇论文的被引次数会根据其文献类型、发表年份以及所属 Web of Science 学科类别下的全球平均水平进行规范化处理，以比值的形式呈现（图 2）。图 2.英国（蓝色）与德国（红色）年度引文影响力计算结果。虚线表示对各年度发表论文迄今累积被引次数进行简单平均计算的结果。实线表示将这些被引次数，根据期刊所属 Web of Science 学科类别及发表年份的全球平均水平进行规范化处理后的结果。（数据来源：Web of Science 核心合集。）篇均被引次数学科规范化的引文影响力简单引文影响力与相对（学科规范化）引文影响力之间的差异，是我们解读科研绩效的核心。在上述德国与英国的示例中，可以观察到：第一，与简单的全球平均水平相比，相对影响力实际上是保持稳定的；第二，2000 年至 2014 年间，两国的相对影响力均呈现上升趋势。在国家或地区层面使用“简单引文影响力”所导致的信息偏差，在机构层面会因学科布局的专业化而进一步放大。例如，在一所技术型机构与一所医学机构之间，任何比较都缺乏同类可比性。由于生物医学论文的引文增长速度更快，原始引文数据容易失真，从而影响机构内部的规划，还会造成外部认知的偏差。新的时间变量：在线发表日期在分析每一篇文献时，还需要考虑一个新的变量其实际发表日期，这可能与期刊封面所标示的正式出版日期并不一致。这里的差异在于：（1）出版商将文献分配至特定期刊卷期的日期；（2）文献实际在公共数据库中可在线获取的起始日期。正因如此，Web of Science 引入了“在线发表”（Early Access）这一文献类型。当一篇在线发表的论文被正式编入某一期刊并获得卷号、期号和页码后，“在线发表”标签将被移除，但其在线发表时间与最终发表时间均纳入索引，供研究发现与分析使用。从科研人员的角度来看，尽早获取最新研究成果至关重要，因此“在线发表”的引入显然是有益的。Web of Science 对此类论文的收录，也有助于实现快速检索发现。然而，从分析人员以及使用文献计量报告的科研管理者角度来看，“在线发表”也带来了潜在复杂性。因为针对不同学科类别或国家/地区，论文在正式编入期刊之前的在线发布情况并不一致。甚至在同一期刊的同一卷期中，不同论文的在线发布时间也可能存在差异，因而部分论文更早获得被引用的机会，这也将对可比性造成一定影响。学科分类：宏观概览与微观细分20 世纪 80 年代的研究表明，不同学科领域的引文随时间增长的速度存在差异。因此，有必要采用一种分类体系，将在科研文化上相近的学科归为一类，对期刊进行系统划分。最初由 ISI 建立的期刊分类体系，现已发展为 Web of Science（254 个细分类别）和“基本科学指标”（Essential Science Indicators，简称 ESI，22 个宽泛类别）中的学科分类框架。可以观察到，任何学科中较早期发表的论文，其平均被引次数均高于近期发表的论文。如前所述，生物医学期刊的论文通常在发表后不久便开始获得引用，而工程学领域的论文则往往需要更长时间才能得到引用，且增长速度也低于生物医学领域。由于引文行为以及可引用资源总量的差异，生物学论文的平均被引次数达到平台期时的数值高于工程学论文。在大类学科内部，也存在其他差异，例如分子生物学的被引频率高于整体生物科学（见图3）。本报告来源于三个皮匠报告站（）,由用户Id:1181721下载,文档Id:1210935,下载日期:2026-04-28需注意的是，图 3 中的数据并不表示生物化学与分子生物学的研究影响力高于机械工程或电信学。电信学无疑属于关键的创新技术领域，但其重要性并不能仅通过其基础研究成果的引用率来体现。这种差异的产生，可能是因为生物医学研究人员撰写的生物医学论文数量较多，且每篇论文引用文献数量也较高，从而形成了比工程学领域更大的引文来源。不同研究领域在研究目标、研究周期、实验方法及研究发现模式上均存在差异，其发表与引文模式亦各不相同。随着科研文化持续发展，这些差异具有动态性，ISI 也在积极监测此类变化。科睿唯安对所有科研出版物（包括期刊论文、会议论文及图书等）按学科与领域进行分类。所有相关数据均可通过 InCites 研究分析平台用于成果与引文分析。Web of Science 的 254 个学科类别，构成了稳定、精细的基础性分类体系，每个类别汇聚了一组具有紧密关联和大量互引关系的期刊，对应跨越数十年保持稳定的研究领域。ESI 的 22 个学科类别，则提供了管理层面的宏观概览。由于艺术与人文学科主要依赖图书成果，该体系未包含这两大学科门类。其包含 21 个宽泛的学科类别（如物理学、经济学），外加一个多学科期刊类别。每篇期刊论文的平均累计被引次数生物化学与分子生物学植物科学经济学应用物理学机械工程电信学较早期论文，被引次数更高较近期论文，被引次数更低图 3.每篇期刊论文的平均累计被引次数随时间的推移而增长，并且在不同学科中呈现不同的增长速度。例如，一篇生物化学与分子生物学论文在 2024 年的平均被引次数为 5 次，而 1999 年发表的论文在 25 年间平均被引次数已增长至 60 次。本分析选取了 Web of Science 中 254 个学科类别中的 5个作为示例。这些类别能够反映不同学科之间细微的科研文化差异，并为科研管理提供支持性信息。总体而言，这两套分类体系为绘制概念性“图谱”提供了绝佳起点，为研究人员的信息检索或文献计量分析提供指引。ESI 提供宏观概览，有助于科研分析人员或管理者把握科研格局的全貌。在此基础上，Web of Science 则支持进一步深入探索具体研究领域，同时帮助用户透过全局视野，精准把握关键方向。4.引文网络如何识别学科分类科学、稳定的学科分类体系，是开展有意义的引文分析与长期科研管理的基础。接下来的问题是，在快速变化的科研环境中，如何识别并维护这些分类体系。Web of Science与ESI的分类体系主要采用“自上而下”的方式构建，依据期刊之间的关联性、内容相似性以及交叉署名关系等因素。体系会不时引入新的学科类别；既有类别也会随着期刊的创立、发展与衰退而持续演变。但总体而言，其核心类别保持相对稳定，确保用户在每次使用时仍能借助熟悉的分类框架进行检索与分析。一种更具时效性的方法，是基于论文之间的引文关联，“自下而上”构建分类体系，而不考虑其发表的具体期刊。这种方法同样具有利弊两面：需要设定相似性/差异性的边界阈值：这意味着必须处理数百万篇研究论文之间的引文关联，统计其两两之间的互引关系，并据此确定合理的通用阈值。这一过程既可以生成粗粒度分类，也可细化至更精细的层级。分类体系具有动态性：随着新论文不断发表并引用既有文献，新的引文持续增加。这样一个动态结构，一方面可能因不断变化而被视为不稳定，需要用户不断更新认知，但另一方面，这种变化恰恰揭示了科研创新的演进。2019 年，荷兰莱顿大学科学技术研究中心（CWTS）研究团队与 ISI 合作，开发了首个此类动态分类体系，名为“引文主题”（Citation Topics）iv。这一体系分为三个层级：宏观（macro）层级，设有十个固定主题群组；中观（Meso）层级，在宏观主题下进一步细分；微观（Micro）层级，包含更为细致、数量庞大的主题。例如：引文主题 2 为“化学”，其下包括2.39 高分子科学2.76 二维材料2.74 光催化，其下包括 2.74.16 氧化锌纳米结构 2.74.1306 电致变色5.跨内容学科分类尽管基于引文网络的方法能够揭示研究主题如何在学术引用模式中逐步显现，但在整个研究成果范围内尤其是那些引文网络可能缺失或薄弱的成果类型，仍需要进一步的结构化体系，以实现知识的统一组织。科睿唯安全新推出的“Research Topics”（研究主题）分类体系，已在 Web of Science Research Intelligence 平台中得到应用，旨在提升研究发现与分析的准确性、相关性与可解释性。通过打通不同内容类型与平台，该体系为复杂科研生态中的知识组织建立了典范。“研究主题”分类体系的设计，旨在应对科研数据组织中的一个长期挑战：实现跨平台、跨内容的数据整合。传统分类体系（如基于期刊的学科分类）通常按来源或出版类型对研究进行划分。这种分类方式在处理单一类型数据时效果良好，但在整合多元数据资产或探索出版物、专利与基金项目之间的关联时，则存在明显局限。“研究主题”通过构建统一的分类架构，能够一致地应用于不同类型的研究成果，从而克服了上述局限。其三层级结构（宏观、中观及微观主题）源于“引文主题”体系所采用的成熟分类框架。但与基于引文网络的方法不同，“研究主题”是基于文本内容的语义相似尽管如此细致的分类结构难以从整体上把握，但在分析近期研究进展或分析跨学科联系时，专家通常可以先基于 Web of Science 的期刊分类进行宏观探索，再借助“引文主题”体系开展更具针对性的深入探究。这一基本引文识别研究主题的方法，得到了进一步优化：通过聚焦过去几年中被引次数异常突出的论文，识别出“新兴主题”（Emerging Topics）即在近期出版物中迅速引发广泛关注的创新研究方向。这些新兴主题在 Web of Science Research Intelligence 平台以及 InCites 平台内置的 Research Horizon Navigator 工具中进行整合展示。与前述分类结构类似，该工具引导用户从稳定、熟悉的层级出发，逐步深入到不断变化的研究领域。例如：研究人员可下载主题层级的详细文献列表，再进行深入阅读与专业评估。文学与语言-在 14 个类别中包含 132 个新兴主题例如：美国文学（2 个主题），包括全球不平等、身份认同与社会政治变革农业科学-在 7 个类别中包含 120 个新兴主题例如：农业工程（4 个主题），包括可持续环境修复材料性进行划分，其分析对象包括标题、摘要与关键词等。这种以内容为驱动的方法，令每项科研成果可被赋予多个主题标签，从而将分类范围从学术出版物扩展至专利、基金项目以及其他科研投入与产出。该体系通过以下方式满足跨平台分类的关键需求：整合异构研究成果：将不同类型的研究成果纳入统一框架，实现学术文献、科研资助数据与知识产权等信息的统一标引。支持跨内容发现与分析：采用同一套层级化主题体系，支持对不同来源内容的检索、筛选与报告生成。促进跨学科分析：通过多主题分配机制，反映现代科研领域固有的复杂性与交叉融合特征。该分类体系具有动态性，因为基于内容的分类框架会随着研究格局的发展而不断演化。科研机构可借此分析自身科研成果组合，使其与实际科研活动相匹配，而非局限于传统学科边界。“研究主题”分类体系在国家层面的科研评估工作中具有创新性的应用前景。在此类评估中，机构通常需要提交多样化的科研成果。以英国的科研卓越框架（REF）为例，高校可提交期刊论文、专著、数据集、软件、政策报告以及其他非传统类型的成果。过去，由于不同类型的内容收录于不同数据库，且采用互不兼容的分类体系，要在一套统一的学科框架下评估此类异构材料颇具挑战。而现在，一所高校在准备REF申报时，可通过“研究主题”为其参评成果生成一份整体画像，展示期刊论文、专著以及产业白皮书，如何围绕同一高活跃度研究主题，协同产生影响。这种方式能够为评审专家提供切实的证据，证明其开展的是一个持续推进、形式多样的科研项目，而非一系列彼此孤立的成果。由此可见，跨内容分类实践不仅能够提升研究发现与分析能力，还能为将科研信息与外部社会目标对接奠定基础。下一节将对此作进一步阐述。6.将数据类别映射至国家评估体系当科研评估从分析模型走向现实中的评估实践时，面临的挑战在于如何将国际通用的数据库类别，与各国特定的评估体系有效对接。本节的分析表明，不同分类体系下的出版数据能够形成相关、且具有可解释性的聚类，并可实现相互关联。这说明，我们所采用的分类体系在科研生态中具有真实意义，能够反映研究人员报告其科研工作的方式。在澳大利亚，用于澳大利亚卓越科研评估（ERA）的学科分类体系，基于澳大利亚与新西兰标准科研分类（ANZSRC）框架下的“研究领域”（FoR），采用两位数与四位数编码。例如：第 31 类为生物科学，其中包括第 3103 组生态学自 2010年评估周期起，澳大利亚研究理事会（ARC）针对每个FoR 整理了对应的期刊列表。由于各 FoR 类别均对应明确的期刊列表，并已在 InCites Benchmarking&Analytics 工具中完成映射，因此无论是梳理各 FoR 的内容，还是将澳大利亚高校的科研活动与其他国家或地区进行比较，都变得直接明了。而 FoR 分类体系仅是 InCites 中所支持的一系列国家与国际分类体系之一，此外还包括经合组织（OECD）学科分类等。所有经映射的体系均覆盖Web of Science 中的全部文献，因此不同国家或地区的科研分析人员可基于各自熟悉的学科类别，在机构间进行比较分析。相比之下，英国的 Research Assessment Exercise（简称 RAE，后演变为前文所述的 REF）体系并未明确规定各学科对应的期刊。因此，需要建立一种“映射对照关系”（Mapping Concordance），将国家层面的分类体系与全球分类体系对接，以便进行比较分析，为研究政策与管理提供洞察。1996 年，英国首席科学顾问委托 ISI 与利兹大学教育政策研究中心合作，构建 Web of Science 期刊类别与 RAE 评估单元（UoA）之间的映射关系，以评估英国科研工作是否能够进行国际对标。RAE 出版物数据库收录了约 19.5 万项各类科研成果（见图 1）。在 1996 年的 RAE 评估中，有 131,091 篇期刊论文与综述，分布于 Web of Science 收录的 6,146 种期刊中。其中，2,158种期刊仅对应 1 篇提交论文，而有 3 种期刊的提交记录超过 1,000 篇。约三分之二的期刊（3,988 种）被提交至一个以上的评估单元。由此可见，期刊在不同评估单元之间存在重叠使用，这一点并不令人意外。其中部分重叠程度相当显著。例如，在化学评估单元中，总计 525 种期刊中的 151 种贡献了 56%的提交论文；但在这 151 种高频期刊中，有 57 种同时出现在物理学评估中，68 种出现在化学工程评估中。在这种情况下，建立一对一的映射对照关系是不现实的，因此需要构建一种更具“模糊性”的映射关系。以物理学评估单元为例，此映射过程可概括为：第一步 ISI 首先确定了与物理学评估单元核心研究领域对应的三种 Web of Science 学科类别，并统计了 RAE 提交论文中，发表于上述类别期刊的论文数量。这一部分占总计 5,976 篇提交论文中的 59%。第二步考察与物理学评估单元密切相关、且在物理专家组评审范围内的另外三个学科类别，纳入发表于上述类别期刊的论文，令覆盖比例提升 23%（总计达到 82%）。第三步评估是否需要纳入其他学科类别。例如，加入数学类别将引入 180 种期刊，但仅额外增加5篇相关论文，因此数学类别被排除在外，以避免稀释核心领域的代表性。Web of Science 中固定的期刊列表，虽有利于检索与分析，但难以反映现实科研活动中的重叠情况。RAE 所采用的灵活期刊映射方法能够更好地呈现这种拼图式格局，但无法直接用于国际比较。而“交叉映射”（Cross-Mapping）则有效解决了这一问题。以物理学为例，通过将Web of Science中“三个核心类别”与“三个相邻边缘类别”相结合，可在尽量减少“非RAE 期刊”引入的同时，高比例覆盖英国物理学界认定为本领域代表性的研究成果。由于不同评估单元之间的期刊并非互斥，我们还可以基于 RAE 期刊使用情况开展相似性分析，即比较各评估单元在不同期刊上的论文提交数量。通过这一分析，我们可将学科按相似度从高到低聚类，绘制出树状图。由此可以揭示物理科学、工程学与数学之间的发表关联。例如，化学工程评估单元的论文在聚类中更接近化学与物理，而非其他工程学科；而采矿工程则完全不在该聚类中（而是更接近地球科学）。这些新颖的洞察对于理解“同类可比”的聚类方式具有重要价值：无论名称如何，化学工程研究实质上更接近化学而非工程学（见图 4）。其他科学化学工程冶金学化学物理学通用工程机械工程电气工程计算机科学土木工程理论数学应用数学统计学期刊使用相似度递增图 4.基于英国 1996 年 RAE 数据，按期刊使用相似度对物理科学、工程学与数学评估单元进行递进聚类的结果。该分析显示，化学工程领域研究人员提交的核心出版物，在聚类结构上更接近物理科学类学科，而非工程类学科v。7.将科研元数据映射至发展目标联合国可持续发展目标（SDG）是一个全球认可的框架，由 17 个相互关联的目标组成，旨在于2030年前应对最紧迫的社会、经济与环境挑战。这些目标涵盖消除贫困、优质教育、性别平等、气候行动以及可持续城市等多个领域。科睿唯安已将 SDG 引入其高级科研分析解决方案（如 InCites 与 Web of Science Research Intelligence 平台），作为一种分类体系，用于对与全球发展重点相关的研究成果开展系统性计量与对比分析。将 SDG 融入科研数据框架，回应了当下日益迫切的需求即以询证方式揭示知识创新如何为社会影响力与全球转型做出贡献。SDG 分类体系通过系统化的映射过程构建而成：将 17 个目标分别与前述的“引文主题”和“研究主题”（微观层级）进行匹配，覆盖 Web of Science 及 Web of Science Research Intelligence 平台中的全部内容。这种映射将特定文献集合与对应发展目标建立关联，使科研成果能够按照其所涉及的可持续发展方向进行分类。随后，可基于对应的出版物集合，8.国际合作的分类自 20 世纪 90 年代以来，Web of Science 相关产品所构建的分析体系已将成果类型、发表时间和主题相关性纳入数据分类维度。但近期研究表明，这些并非影响科研评估的全部因素。国际合作格局已经发生显著变化，成为一个亟需纳入可比分类的关键维度。例如，在西欧地区，20 世纪 80 年代国际合作的研究成果占比不足 10%，而如今在 Web of Science 收录的期刊文章中，这一比例已高达三分之二。随着国际合作占比的提升，跨国合作论文的被引频次高于其他论文的现象也愈发明显。ISI 的一项近期研究vi进一步拓展了科研成果的“同类可比”分类原则。为纳入合作这一维度，ISI 开发了“合作性学科规范化引文影响力”（Collab-CNCI）指标，将合作因素纳入CNCI 的规范化过程中。科研成果可按照不同的合作类型进行划分：国内合作（无国际合著者）、国际双边合作（包含来自非本国或非本地区的合著者）、国际三边合作（涉及三个国家或地区），以及国际多边合作（涉及四个及以上国家或地区）。与其他分类变量一样，一篇论文的被引次数会与全球范围内相同合作类型、相同学科类别、相同年份的论文平均水平进行比较。如此一来，国际合作论文可以仅与其他国际合作论文进行比较，而不会与纯国内论文进行比较。忽视合作因素所带来的影响，可通过对比两种年度引文影响力平均值加以说明：（1）传统 CNCI（仅考虑年份、文献类型与学科类别）；（2）Collab-CNCI（同时考虑合作因素）。对比结果表明，在国际合作程度较高的国家或地区，国际合作对引文影响力的提升作用显著，因此标准 CNCI 指标通常高于纳入合作因素后的 Collab-CNCI 指标。然而，中国内地是一个例外，其国际合著期刊论文仅占约 10%-15%（见图 5、表 1）。针对每一个 SDG 计算相关指标，从而支持对整个 SDG 框架下科研贡献的量化分析与长期追踪。这一分类方法结合了自动聚类与专家评审机制。随着“引文主题”或“研究主题”通过年度重新聚类不断演化，SDG 映射也会同步更新，以保持分析连续性，并对科研领导者、政策制定者及机构战略决策者提供切实的支持，助力其评估进展、识别优势与差距，同时确保科研投入与政策决策与全球发展重点相协调。该方法具有高度灵活性，可扩展用于支持全球或国家层面的其他社会需求或战略目标的分类体系。例如，在科睿唯安的“社会影响力框架”（Societal Impact Framework）ii中，类似的映射方法可应用于基于 PESTLE（政治、经济、社会、技术、法律与环境）的科研分类（通过 SDG 作为中介或独立进行），同时也可适用于英国 REF 影响力领域、法国ASIRPA（公共农业研究影响分析）影响力层级，或其他政策导向型或目标导向型的分类体系。引文影响力澳大利亚 CNCI英国 CNCI德国 CNCI中国内地 CNCI中国内地 Collab-CNCI澳大利亚 Collab-CNCI英国 Collab-CNCI德国 Collab-CNCI图 5.年度国家层面引文影响力趋势，展示了采用 Collab-CNCI 前后的差异：在按年份和学科规范化计算引文影响力之前，先按国际合作模式对论文进行分类。结果显示，对于澳大利亚、德国和英国而言，其标准 CNCI 净值明显高于考虑合作模式后的 Collab-CNCI 指标。中国内地由于国际合作占比较低，其引文影响力受到的影响较小。（数据来源：Web of Science 核心合集）表 1.2020-2024 年 Web of Science 核心合集收录期刊论文的 Collab-CNCI 指标。按合作类型对三个国家/地区的论文进行分类与比较。需要说明的是，这一创新做法并不意味着 CNCI 高估了引文影响力。指标计算结果发生变化，是因为不含国际合著者的国内论文，其平均引文影响力通常低于国际合作论文。CNCI 可作为总体参考指标，而 Collab-CNCI 则有助于揭示科研组合中更具体的优势与不足。进一步拆解还表明，国际双边及多边合作的论文，其引文影响力指标可能相对高于国内研究论文，即便与全球其他地区的同类合作相比也是如此（见表 1）。CNCI 指标Collab-CNCI 指标国内合作国际合作（总体）国际双边国际多边（四方及以上）1.50澳大利亚1.061.061.111.341.18中国内地1.151.151.261.311.30德国0.920.920.961.17Collab-CNCI 的开发，为 ISI 提出的一项建议提供了有力支撑：当我们从依赖单一指标（如CNCI）转向构建一个多维指标体系（例如，展示不同合作类型的分布情况），能够获得更具价值的信息，实现机构、部门或国家/地区层面的情境化对标分析。通过同时考察国

展开阅读全文