1、收稿日期:20220709基金项目:国家社会科学基金“学术期刊评价 指标创新与方法研究”(项目编号:21FTQB016);浙江省自然科学基金重点项目“制造业从数量型创新向质量型创新转型机制研究”(项目编号:Z21G030004)。作者简介:俞立平(1967),男,教授,博士,博士生导师,研究方向:技术经济、科技评价。通讯作者:舒光美(1979),男,讲师,硕士,研究方向:数字经济与文旅开发,高等教育管理。信息计量与科学评价异类指标相关对学术期刊评价影响及修正研究俞立平1舒光美2*(1 常州大学商学院,江苏 常州 213159;2 广州商学院数字经济产业学院,广东 广州 510700)摘要:目的
2、/意义 在学术期刊评价中,不同类型指标之间往往是相关的,这个问题对评价结果必然产生较大影响,相关研究缺乏。方法/过程 本文在理论分析的基础上,提出了一种基于拟合优度测度指标独立信息的思路,并基于中国知网的环境科学与技术期刊数据进行了实证。结果/结论 不同类学术期刊评价指标之间相关具有内生机制;机器分类在学术期刊评价中有时并不适用;不同类评价指标相关会影响期刊评价结果,涉及评价值、权重与结果排序;基于独立信息的修正方法可以有效克服不同类型评价指标的相关问题。关键词:学术期刊;独立信息;拟合优度;指标相关;学术评价DOI:103969/jissn10080821202303014中图分类号G302
3、文献标识码A文章编号10080821(2023)03013810esearch on the Influence and evision of Correlation of HeterogeneousIndicators on Evaluation of Academic JournalsYu Liping1Shu Guangmei2*(1 Business School,Changzhou University,Changzhou 213159,China;2 School of Digital Economy Industry,Guangzhou College of Commerce,G
4、uangzhou 510700,China)Abstract:Purpose/Significance In the evaluation of academic journals,there are often correlations between differ-ent types of indicators This problem will inevitably have a great impact on the evaluation results,and related research islacking Method/Process On the basis of theo
5、retical analysis,this paper proposed an idea to measure the independentinformation of indicators based on the goodness of fit,and conducted empirical research by the data of environmental sci-ence and technology journal on CNKI esult/Conclusion The research results show that:there is an endogenous m
6、ech-anism for the correlation between evaluation indicators of different types of academic journals;machine classification issometimes not applicable in the evaluation of academic journals;the correlation of different types of evaluation indicatorswill affect the evaluation results of journals,invol
7、ving evaluation value,weight and result ranking;the correction methodbased on independent information can effectively overcome the related problems of different types of evaluation indicatorsKey words:academic journals;independent information;goodness of fit;index correlation;academic evaluation在学术期
8、刊评价中,不同类型指标之间相关是一种容易被观测到的正常现象。通常情况下,同类指标相关更容易被理解,如影响因子、他引影响因子、h 指数之间,被引半衰期与引用半衰期之间。不同类型指标之间的相关其实也比较正常,如优秀期刊的传播力和影响力均较高,引用指标与时效性指标均较好等。本质上,这源自优秀趋同效应,即优秀期刊的表现不是某一个方面优秀,而是全方位8312023 年 3 月第 43 卷第 3 期现 代 情 报Journal of Modern InformationMar,2023Vol.43No.3优秀。不同类型指标相关带来的信息重叠问题会影响评价结果。同类指标相关带来的信息重叠问题总体上还好,毕竟
9、说明的是同一问题,但是不同类型指标相关会带来相关信息的重复计算,必然会扭曲评价结果。这个问题是学术期刊评价方法的基础问题,如果不加以解决,势必会影响学术期刊评价的科学性,降低学术评价的公信力12。关于指标相关导致的信息重叠问题的危害,Har-rigan N 等3 指出,信息重叠的表现是用户关注或收到许多内容相同或相似的信息。刘翠杰4 认为,在一个指标体系中,指标数量与信息重叠是一对矛盾,指标越多越全面,信息重叠问题也就越严重。王伟夏5 从集合论的角度分析了指标信息重叠对评价造成的不利影响。秦烁等6 提出信息重叠降低了传播效率,严重时会丧失信息自身价值。关于评价指标信息重叠的消除方法,一种观点认
10、为可以通过改进评价方法实现,如采用主成分分析、因子分析等方法进行评价,问题是基于降维的评价方法容易牺牲评价指标的部分信息,进而扭曲评价结果;另一种观点是通过删除信息冗余指标实现,Destrero A 等7 指出,应删除相关系数较大指标中的次要指标,以提高评价指标信息独立水平。陈洪海8 提出信息可替代性标准,然后删除信息重叠较大指标。迟国泰等9 构建了基于信息敏感性的指标筛选与赋权模型。从现有的研究来看,关于评价指标的信息重叠或数据冗余问题,学术界已充分认识到问题与危害。关于这个问题的解决方法,目前总体上停滞不前,因为以牺牲部分指标信息的降维方法解决了信息重叠问题但带来了新的问题,而删除评价指标
11、并不能从根本上解决问题,其他指标之间还是会相关,何况删除指标会带来信息损失。至于不同类型指标之间的相关问题,缺乏专门的研究,相关讨论尚处于探索阶段。在以下方面有待进一步深入研究:第一,对于学术期刊评价而言,其指标分类标准是什么?基于现有的指标分类标准,不同类型指标之间相关的形成机制是什么?只有弄清不同指标相关的形成机制的基础上,才能更好地解决相关问题。第二,不同类型指标之间相关会对学术期刊评价带来什么影响,现有的研究尽管提及相关问题,但缺乏深入分析。第三,解决不同类型指标信息重叠的方法,总体上缺乏研究,本文提出一种基于不同类型指标复相关系数的调整方法,试图解决这个问题。本文基于中国知网期刊数据
12、库,以环境科学与技术学科期刊为例进行实证。首先构建期刊评价指标分类框架,并分析不同类型期刊评价指标信息重叠的形成机制,然后提出消除不同类型指标信息重叠的解决方法,最后比较原始指标评价与消除信息重叠后指标评价结果的差异,从而得出结论。本文的研究推进了多属性评价与学术评价方法的进一步完善,对于提高学术期刊评价方法的科学性和公信力具有重要意义。1理论分析1.1期刊评价指标的分类期刊评价指标是指用于期刊评价、具有价值判断的指标。那些无法体现价值判断的指标一般不能称为期刊评价指标,比如平均发表周期、地区分布数等。本文重点研究不同类型指标之间的相关问题,对于同类指标相关,考虑到信息重叠对其影响较小,因此不
13、做重点研究。这样就涉及评价指标的分类问题,为了研究方便,主要从一级指标角度进行分类,一级指标之间的相关是不同类型指标相关的典型代表,因此主要对一级指标之间的信息重叠问题进行深入研究。期刊评价指标的分类依据有很多,如指标内涵、外表形式、时间跨度、统计特征等,本文重点研究不同类型评价指标之间的相关关系,因此从指标内涵角度进行分类。关于期刊评价指标的分类,尽管不少文献在期刊评价应用中进行过分类,但缺乏系统研究。赵惠祥等10 将期刊评价指标分为影响力指标、文献指标、载体指标、管理指标。本文根据当前期刊评价的实际,将其分为编辑出版指标、知识传播指标、影响力指标、引用类指标、时效性指标、来源特征指标。编辑
14、出版指标包括政治指标以及体现期刊编辑9312023 年 3 月第 43 卷第 3 期异类指标相关对学术期刊评价影响及修正研究wwwxdqbnetMar,2023Vol.43No.3图 1期刊评价指标分类出版质量的指标,如编排规范化、差错率、印刷质量等,一般在学术期刊评价中,评价目的也是多样的,基于期刊学术质量的评价一般不选择此类指标进行评价,而相关学术期刊管理部门往往比较重视该类指标评价。知识传播指标包括网络下载指标、网络评论指标等,目前许多 Altmetrics 指标可以归到此类。影响力指标众多,如影响因子、h 指数、即年指标等,该类指标也是非常重要的引文指标,是传统文献计量学中最重要的指标
15、。引用类指标指期刊论文中与引用相关的指标,如平均引文数、引用期刊数、引用外文文献数等,该类指标对期刊质量具有潜在的影响。需要说明的是,影响力指标与引用类指标还是有较大差异的,影响力指标主要是被引指标,是期刊论文的“输出”指标,引用类指标是期刊引用其他期刊论文的指标,是期刊的“输入”指标。时效性指标指典型的如引用半衰期、被引半衰期等、平均发表时滞等,用来反映期刊文献的老化速度,期刊类别不同,文献老化速度不同,一般侧重基础研究的期刊文献老化速度慢。来源特征指标是体现期刊内在信息又不包括编辑出版的指标,如平均国家基金数量、基金论文比、海外论文比、平均作者数等,其实这些指标涉及范围比较广泛,有时可以划
16、分到其他类型中去。1.2学术期刊评价指标分类方法对于同类指标而言,评价指标相关信息适当重复是可以的,而对于不同类型指标而言,其对评价结果的影响可能很大,因此,评价指标的分类对实证研究结果影响很大,必须进行全方位分析。学术期刊评价指标的分类方法有两种,一种是人工分类,这也是传统分类方法;另一种是采用机器分类,分类方法包括聚类分析、因子分析等。机器分类有时是必要的,俞立平等11 在学术期刊评价指标分类中发现聚类方法并不适用,建议采用因子分析。本文综合采用聚类分析、因子分析进行数据分析,再进行人工分类,这样可以使得期刊评价指标分类更加全面。图 2期刊不同类型指标之间关系1.3 异类指标相关的原因分析
17、第一,作者同源效应。比如引用类指标与来源特征指标相关。引用类指标是评价期刊引用其他期刊的一些指标,如平均引文数、引用期刊数等,表面看它与其他期刊相关,但实际引用行为却是作者在论文中进行的引用,作者水平越高,引用期刊的档次、论文水平等越高。来源特征指标本质上也是由作者和稿件决定,作者水平越高,期刊篇均国家基金数量、基金论文比等指标值越大。所以由于作者同源效应,导致引用类指标与部分来源特征指标相关。第二,先后次序效应。如期刊知识传播指标与期刊影响力指标相关。期刊论文首先要进行传播,在互联网时代,传播主要通过网络进行,作者下载论文后才能在后续研究中将其列入引用,两者有先后次序关系,当然具有一定的相关
18、性。其相关性大小又受到具体的期刊评价指标内容、不同学科期刊评价数据、指标之间滞后关系等因素的影响,有些指标之间相关性较大,有些指标之间相关性相对较小。第三,期刊质量效应。如时效性指标、知识传播指标、影响力指标之间相关,当期刊论文水平较0412023 年 3 月第 43 卷第 3 期现 代 情 报Journal of Modern InformationMar,2023Vol.43No.3高时,比如会取得较好的时效性,同时传播指标与影响力指标也较高,所以它们三者之间存在一定程度的相关。2信息重叠问题的危害及独立信息的测度2.1不同类型评价指标相关问题的危害传统线性指标加权汇总方法如下:Ci=w1
19、X1+w2X2+wnXn(1)式(1)中,wi代表权重,i 为评价指标的序号,n 为评价指标的数量,Xi为标准化的评价指标。假设指标分类评价结果为 L1、L2Lk,为简化起见,假设 L 为一级指标评价值,各分类的权重为 1、2k。这里 L 为 X 的线性组合,为w 的线性组合。那么期刊评价结果也可以写成:Ci=1L1+2L2+kLk(2)假设 L 由两部分组成,一部分是其没有重叠的独立信息 P,另一部分是重叠信息 Q,则有:Ci=1(P1+Q1)+2(P2+Q2)+k(Pk+Qk)=(1P1+2P2+kPk)+(1Q1+2Q2+kQk)(3)式(3)包括独立信息与重叠信息评价结果之和,这样独立
20、信息评价结果值就会小于实际评价值,并且当学术期刊数量较多时,会对排序的影响较大。如果假设分类评价结果 L 的独立信息与重叠信息比重分别为、,很显然有+=1,并且每类指标的独立信息与重叠信息比重并不相同,即 ij,ij,则式(2)也可以写成:Ci=1(1+1)L1+2(2+2)L2+k(k+k)Lk=(11L1+22L2+kkLk)+(11L1+22L2+kkLk)(4)从式(4)既可以得出式(3)的结论,同时从独立信息评价部分也可以看出,由于信息重叠问题存在,实际上导致了独立信息评价中权重被扭曲了,同时评价值变小了,显然有 iii,并且:11+22+kk1(5)2.2独立信息测度借鉴 Diak
21、oulaki D 等12 提出的 CITIC 评价方法中测度指标独立信息的方法,其基本思路是采用复相关系数的原理。以指标分类评价结果 L1为例,其与 L2、L3LK相关。以 L1为因变量,其他分类评价结果为自变量进行回归:L1=c0+2L2+3L3+kLk+(6)式(6)中,c0为常数项,i为回归系数,为残差,这样 L1就被分解为两部分,一部分是由L2Lk可以解释的重叠信息部分,重叠比例为拟合优度,而另一部分就是独立信息部分,用 1表示。所以独立信息评价结果为:1(11)L1+2(12)L2+k(1k)Lk(7)式(7)中,由于存在权重扭曲,因此要重新进行归一化处理:i=i(1i)ni=1i(
22、1i)(8)所以最终独立信息评价结果为:Ci=1L1+2L2+kLk(9)3研究数据与实证结果3.1研究数据本文选取中国知网定期发布的学术期刊影响因子年报,以 2020 版环境科学与技术期刊来进行分析。环境科学期刊属于自然科学期刊,在中国知网收录的中文自然科学期刊中属于数量中等偏多的期刊,这样可以保证较大样本,便于后续进行统计分析。此外还有一种重要的原因是,开展异类指标相关对期刊评价的影响研究,必须以一个学科为例进行说明,不同学科期刊不能混在一起,因为可比性首先是评价和进一步研究的前提条件。评价指标包括:总被引频次、影响因子、即年指标、被引期刊数、Web 即年下载率、总下载量、引用期刊数、平均
23、引文数、基金论文比、引用半衰期、被引半衰期,共 11 个评价指标。环境科学与技术学科期刊共有 74 种,因为 6种期刊部分数据缺失,将其删除后实际还有 68 种期刊,评价指标描述统计如表 1 所示。表 1评价指标描述统计评价指标均值极大值极小值标准差总被引频次2 024.4413 549.0082.002 606.41影响因子0.893.800.150.63即年指标0.160.830.020.15被引期刊数619.411 834.0041.00406.941412023 年 3 月第 43 卷第 3 期异类指标相关对学术期刊评价影响及修正研究wwwxdqbnetMar,2023Vol.43No
24、.3表 1(续)评价指标均值极大值极小值标准差Web 即年下载率107.21601.0010.0078.06总下载量17.2380.730.2117.02引用期刊数539.381 538.0025.00301.92平均引文数21.6858.004.0011.62基金论文比0.681.000.060.29引用半衰期5.559.100.201.66被引半衰期7.1611.200.901.553.2期刊评价指标分类首先采用聚类分析中的系统聚类进行评价指标分类,结果如图 3 所示。聚类分析中,被引期刊数与引用期刊数被分为一类,这是可以解释的,因为论文作者决定了引用期刊数,而引用期刊的相关知识和思想又体
25、现在论文中,从而对被引期刊数产生影响。总被引频次被分为单独一类,其他指标也被分为单独一类,总体上,这种分类体系并不合理,主要原因还是评价指标之间的相关造成的。图 3指标聚类分析结果继续采用因子分析降维进行评价指标分类,KMO 检验值为 0.736,Bartlett 检验值为 702.426,p 值为 0.000,具备因子分析的前提条件。公共因子共分为 3 类,其解释总方差如表 2 所示,第一公共因子的方差贡献率为 35.548%,第二公共因子为 31.473%,而第三公共因子的方差贡献率相对较小,仅为 12.298%,三者之和为 79.319%。从另外一个角度看,如果采用因子分析进行评价,也意
26、味着存在 20.681%的信息损失,这无疑会严重影响评价结果。表 2解释总方差成份初始特征值旋转平方和载入合计方差的%累积%合计方差的%累积%15.24747.70247.7023.91035.54835.54822.44922.26569.9673.46231.47367.02131.0299.35279.3191.35312.29879.31940.8547.76087.07950.5344.85391.93260.3463.14195.07370.2021.83496.9072412023 年 3 月第 43 卷第 3 期现 代 情 报Journal of Modern Informat
27、ionMar,2023Vol.43No.3表 2(续)成份初始特征值旋转平方和载入合计方差的%累积%合计方差的%累积%80.1271.15198.05890.1171.06599.123100.0630.57199.694110.0340.306100.000因子分析旋转矩阵如表 3 所示。从结果看,第一公共因子主要相关指标包括总被引频次、被引期刊数、总下载量、Web 即年下载率、引用期刊数、引用半衰期;第二公共因子主要相关指标包括影响因子、即年指标、平均引文数、基金论文比;第三公共因子主要相关指标为被引半衰期,这个分类结果难以解释,主要原因是指标之间的复杂相关关系。表 3旋转矩阵评价指标公共
28、因子 1公共因子 2 公共因子 3总被引频次0.7700.5160.162被引期刊数0.9180.2960.013总下载量0.9300.2190.097Web 即年下载率0.5150.4930.280引用期刊数0.7760.1590.241引用半衰期0.5370.3740.473影响因子0.4960.7800.040即年指标0.4480.7580.188平均引文数0.0740.8470.106基金论文比0.0340.8670.124被引半衰期0.0500.0190.945从机器分类结果看,目前机器分类方法并不总是有效,因此本文采用人工分类,权重赋值采用专家赋值,选取了 7 位专家,1 名是相关
29、领域国家级科研院所教授,4 名为 985 高校图书馆情报学领域教授,2 名为环境科学期刊编辑,最后根据专家权重求平均并适当进行取整处理,经过两轮打分,结果如表 4 所示。3.3指标分类评价及独立信息分析首先对 4 个一级指标进行评价,然后分别进行回归,得到其拟合优度,影响力、传播力、来源特表 4评价指标权重赋值一级指标二级指标权重影响力指标0.45总被引频次0.100影响因子0.100即年指标0.100被引期刊数0.100传播力0.25Web 即年下载率0.125总下载量0.125来源特征指标0.20引用期刊数0.050平均引文数0.050基金论文比0.050时效性指标0.10引用半衰期0.0
30、50被引半衰期0.050征、时效性的拟合优度分别为 0.836、0.779、0.512、0.145,影响力指标的拟合优度最高,为 0.836,说明其独立信息最低,而时效性的拟合优度最低,说明其能够提供更多独立信息。用 1 减去拟合优度,得到独立信息,再分别乘以专家权重,最后进行归一化处理,得到 4 个一级指标的综合权重,影响力、传播力、来源特征、时效性的综合权重分别为 0.236、0.177、0.313、0.274,很明显这个权重组合与专家权重相差较大。表 5指标分类独立信息权重计算权重影响力传播力来源特征时效性专家权重0.450.250.200.100.8360.7790.5120.1451
31、0.1640.2210.4880.855综合归一权重0.2360.1770.3130.2743.4原始指标与独立信息分类指标评价结果比较首先采用原始指标数据和专家权重进行评价,再用 4 个一级指标数据和归一化权重进行评价得到独立信息评价结果,两者比较如表 6 所示。其平均排序位次差为 2.94 个,即两种评价结果平均每个期刊的排序误差为 2.94,这个是不应该被忽视的。当然由于对一级指标独立信息权重进行了归一化处理,独立信息评价值较小的问题得到了克服。3.5评价结果值对比原始指标评价值 X 与独立信息评价值 Y 的散点图如图 4 所示,两者高度相关,总体上独立信息3412023 年 3 月第
32、43 卷第 3 期异类指标相关对学术期刊评价影响及修正研究wwwxdqbnetMar,2023Vol.43No.3表 6原始指标与独立信息评价结果对比期刊名称影响力传播力期刊特征时效性原始评价排序独立信息评价排序位差中国人口 资源与环境100.00100.0087.9073.3994.92188.9210环境科学88.4152.2294.9270.3078.85279.0820中国环境科学61.0435.13100.0071.9263.44371.6330生态经济43.6354.2886.7577.4858.30568.2841环境科学学报59.4235.0794.9066.7361.1646
33、8.2251长江流域资源与环境47.7246.2091.5868.2758.17666.8160生态环境学报51.5628.5296.4257.5355.37763.1670环境工程学报46.1838.8081.9871.2254.00962.9481农业环境科学学报48.9533.2793.6956.9454.78862.3791环境科学与技术37.3030.5398.5159.9950.121161.48101环境科学研究46.4523.2893.5660.6951.501061.00111环境工程32.4229.9285.6575.9346.791360.56121环境化学33.8925
34、.9488.0365.1545.861457.99131生态与农村环境学报36.1319.5886.8066.3245.151557.33141安全与环境学报34.2322.8478.4270.8543.891656.08151中国环境管理27.5824.9266.3388.0040.711855.79162环境保护43.3939.1741.1992.7546.831255.48175农业资源与环境学报27.9316.1685.5066.6940.381954.49181生态毒理学报17.0511.1892.2671.4036.062654.44197JES36.594.5889.3661.2
35、441.611754.20203环境与发展16.7535.1052.26100.0036.762453.92213环境污染与防治26.2722.1780.6562.7239.762052.55222水处理技术24.0829.1168.7971.9539.072152.08232安全与环境工程23.2815.3077.5671.3336.952352.02241湿地科学28.2615.5677.0367.0238.722251.90253环境工程技术学报18.4611.7076.9677.5534.383051.76264三峡生态环境监测17.7413.1368.3379.9032.923449
36、.79277环境科学与管理23.8819.8355.3184.8035.242749.69281JE18.498.4177.7669.9332.973349.35294资源节约与环保15.1733.6238.8296.1432.613548.02305中国资源综合利用15.4124.1646.5691.6831.463947.61318地球环境学报10.738.3881.6462.1629.474246.603210环境与可持续发展20.5019.5546.1784.9831.853746.04334环境监测管理与技术22.4011.4565.7164.2632.513645.49342化工环
37、保20.4014.3358.8870.9231.633845.21353地球与环境23.8913.8082.8040.1934.782845.01368中国环境监测27.2216.6859.0162.5734.482944.99378中国环境管理干部学院学报16.8418.8343.3986.7929.644144.673834412023 年 3 月第 43 卷第 3 期现 代 情 报Journal of Modern InformationMar,2023Vol.43No.3表 6(续)期刊名称影响力传播力期刊特征时效性原始评价排序独立信息评价排序位差工业水处理24.7724.1654.1
38、163.6734.383144.51398工业安全与环保18.4512.4463.5564.2630.554044.06400IJDS5.470.9673.7770.5924.525243.894111中国给水排水28.0333.3744.1062.8636.062543.554217海洋环境科学20.7319.0472.5244.7633.073243.224311环境保护科学16.1013.1659.4967.1329.154343.14441净水技术13.3112.7655.4073.3927.604742.85452环境监控与预警11.536.4852.4577.2225.025041
39、.44464环境科技20.4711.9851.1165.6228.994540.93472亚热带资源与环境学报13.059.7274.4445.3427.734640.53482四川环境16.3212.4652.6964.9627.494840.35491环境影响评价16.699.1239.9575.6025.344938.77501再生资源与循环经济12.1612.4639.4177.3624.215338.61512水生态学杂志17.4612.2674.7331.5829.024438.33528电力科技与环保18.347.9233.9878.3624.865137.83532湿地科学与管
40、理10.3011.3748.5966.1023.815437.76540环境保护与循环经济9.6912.0044.3765.4422.785536.23550大气与环境光学学报8.224.7158.3547.8821.335834.16562铁路节能环保与安全卫生6.874.6530.2379.8318.296433.78577中国环保产业11.6510.6629.0672.4320.965933.58581环境卫生工程7.9016.0333.0265.6620.736033.03591工业用水与废水14.099.6635.7361.3222.035633.02604环保科技7.667.993
41、7.3965.5919.486132.89610环境科学导刊12.9012.6336.4754.5121.715731.63625鄱阳湖学刊6.547.9944.1447.2918.506329.73630能源环境保护8.7411.2138.0150.1719.356229.69642油气田环境保护7.875.5329.5263.1217.146529.37650新疆环境保护5.415.2041.3247.5516.756628.16660地质灾害与环境保护8.486.1128.7729.8914.096720.28670干旱环境监测6.665.3914.6233.9710.676816.41
42、680均值24.6419.5962.9866.9335.2747.332.94评价结果值要大于原始指标评价,但这并不具有必然性,也许是数据原因偶然产生的。两者回归结果如下:log(Y)=1.344+0.710log(X)(10)(19.123 )(35.397 )2=0.950n=68原始数据评价值与独立信息评价值描述统计分别如图 5、图 6 所示,原始数据评价结果并不服从正态分布,而独立信息评价结果服从正态分布,独立信息评价结果的均值提升较大,原始指标评价结果离散系数为 42.91%,而独立信息评价结果的离散系数为 28.11%。以上充分说明,独立信息评价5412023 年 3 月第 43
43、卷第 3 期异类指标相关对学术期刊评价影响及修正研究wwwxdqbnetMar,2023Vol.43No.3图 4原始评价与独立信息评价散点图结果与原始指标评价结果的差距还有很多隐性的东西,对评价的影响是巨大的。4研究结论1)不同类学术期刊评价指标之间相关具有内生机制本文在理论分析的基础上,将期刊评价指标分为编辑出版指标、知识传播指标、影响力指标、引用类指标、时效性指标、来源特征指标等,通过分析这些指标之间的关系发现,它们之间之所以相关,是存在作者同源效应、先后次序效应、期刊质量效应 3 种内生效应,所以这种相关是必然的。图 5原始数据评价值描述统计图 6独立信息评价值描述统计2)机器分类在学
44、术期刊评价中有时并不适用本文实证研究发现,无论是采用聚类分析,还是采用因子分析进行学术期刊的机器分类,其结果都是难以解释的,其根本原因是学术期刊评价指标之间存在复杂相关关系。在学术期刊评价中,涉及评价指标分类时,应采用人工分类方法。3)不同类型评价指标相关会影响期刊评价结果通过理论研究发现,不同类型评价指标相关会使评价权重扭曲,并且影响评价结果的排序,同时使得真实评价值低于实际评价值,这 3 个方面的影响无疑使得学术期刊评价结果产生较大误差,降低了学术评价方法科学性与公信力。6412023 年 3 月第 43 卷第 3 期现 代 情 报Journal of Modern Information
45、Mar,2023Vol.43No.34)基于独立信息的修正方法可以有效克服不同类型评价指标的相关问题基于不同类型指标之间的拟合优度,间接得到各类指标的独立信息,经权重归一化后可以有效克服不同类型指标之间的相关问题。基于中国知网环境科学与技术期刊的研究结果表明,原始指标评价与独立信息评价在数据分布、评价结果排序、离散系数等方面均有较大差异,这从另外一个角度说明不同类型指标相关问题的严重性。需要说明的是,本文提出的研究方法大大降低评价指标之间的相关性,可以采用评价指标的独立信息来进行评价,进而降低异类指标相关对学术评价的影响,但在具体的评价过程中,受评价期刊学科、评价数据、指标选取等诸多因素的影响
46、,异类指标相关对学术期刊评价带来的影响也存在一定的差异。参考文献 1 史双青,许人杰,申静 高校智库智力资本评价指标体系研究J 科技情报研究,2022,4(1):89102 2 胡千代,王芳 政府数据质量评价指标体系构建研究 J 科技情报研究,2021,3(3):1734 3 Harrigan N,Achananuparp P,Lim E P Influentials,Novelty,andSocial Contagion:The Viral Power of Average Friends,Close Commu-nities,and Old News J Social Networks,2
47、012,34(4):470480 4 刘翠杰 论统计指标间的信息重叠 J 河北职业技术师范学院学报(社会科学版),2003,(2):1518 5 王伟夏 消除评价中重复计算的方法研究 J 浙江大学学报(社会科学版),1987,(1):6476 6 秦烁,吕欣,孟凡辉,等 在线社交媒体信息冗余现象建模与实证研究 J 大数据,2018,4(5):5061 7 Destrero A,Mosci S,Mol C D,et al Feature Selection for HighDimensionalData J ComputationalManagementScience,2009,6(1):254
48、0 8 陈洪海 基于信息可替代性的评价指标筛选研究 J 统计与信息论坛,2016,31(10):1722 9 迟国泰,陈洪海 基于信息敏感性的指标筛选与赋权方法研究 J 科研管理,2016,37(1):153160,162 10 赵惠祥,张弘,刘燕萍,等 科技期刊评价指标的属性分类及选用原则 J 编辑学报,2008,(2):179182 11 俞立平,潘云涛,武夷山 基于因子分析的学术期刊评价指标分类研究 J 图书情报工作,2009,53(8):146149 12 Diakoulaki D,Mavrotas G,Papayannakis L Determining Objec-tive Wei
49、ghts in Multiple Criteria Problems:The ClTIC Method J Computers Ops es,1995,22(7):763770(责任编辑:王维)(上接第 72 页)19 张璐 从 Python 情感分析看海外读者对中国译介文学的接受和评价:以 三体英译本为例 J 外语研究,2019,36(4):8086 20 李洁,魏家海 基于在线书评的 生死疲劳英译本海外接受研究 J 解放军外国语学院学报,2022,45(3):144151 21 余承法,郑剑委 基于读者反馈的 西游记英译版海外传播研究 J 湖南师范大学社会科学学报,2021,50(6):8
50、389 22 由丽萍,何玲玲 基于框架语义的在线医疗评论情感分析J 现代情报,2020,40(3):111116,125 23 张清慧,陈谊,武彩霞 基于词表示模型的领域文献数据可视分析方法 J 图学学报,2022,43(4):685694 24 Egger,Yu J A Topic Modeling Comparison Between LDA,NMF,Top2Vec,and BETopic to Demystify Twitter Posts J Frontiers in Sociology,2022,7:886498 25 乔澄澈 理雅各的 中国经典及其宗教思想 J 学术界,2013,(