1、2023 年第 35 卷第 7 期基于响应面分析的国家预印本平台自组织同行评议参数设计王凌峰袁 王申鹏(桂林电子科技大学 商学院,桂林541004)摘要院 目的/意义为保障国家预印本平台论文质量,需引入同行评议。近年来自组织同行评议逐渐受到关注。为达到国家预印本平台管理机构预期的性能表现,需要研究自组织同行评议关键参数优化设计。方法/过程以论文评议完成率渊CR冤、评议人任务分配均衡度 渊TBD冤、论文平均评议时间 渊A_r_time冤 为自组织同行评议性能评价的 3 个因变量,评议人休息时间、评议人拒审率、作者人数、评议资格比例 4 个关键参数为自变量,对 Box-Behnken 抽样设计得到
2、数据进行响应面分析,得到性能评价因变量与关键参数自变量的量化表达关系式。结果/结论通过 4 个关键参数自变量取值不同组合,国家预印本论文平台可以调整自组织同行评议的 3 个性能参数表现,保障国家预印本平台发布论文平均质量。关键词院 国家预印本平台;论文质量;自组织同行评议;Box-Behnken 设计;响应面分析中图分类号院G35文献标识码院A文章编号院1002-1248渊2023冤07-0075-10引用本文院 王凌峰,王申鹏.基于响应面分析的国家预印本平台自组织同行评议参数设计J.农业图书情报学报,2023,35(7):75-84.收稿日期:2023-05-16基金项目:国家自然科学基金项
3、目“预印本数据库环境下开放同行评议机制研究”(71563007);桂林电子科技大学研究生教育创新计划基金项目“预印本 2.0 与期刊评议速度差异定量建模分析”(2022YCXS120)作者简介:王凌峰(1976-),男,博士,研究员,硕士生导师,研究方向为科技管理与创新。王申鹏(1997-),男,硕士研究生,研究方向为科技管理与创新DOI院10.13998/ki.issn1002-1248.23-03031 引言科技信息是国家创新体系关键支撑要素袁2020年中国颁发的 叶关于制定国民经济和社会发展第十四个五年规划和二茵三五年远景目标的建议曳 提出建设国家科研论文和科技信息高端交流平台袁 并将其
4、列为野强化国家战略科技力量冶 七要点之一袁 这是中国首次将科技信息纳入中央级文件遥 作为落实文件上述要求的具体体现袁 科技部直属中国科学技术信息研究所建设了国家科研论文集中发布平台 渊China Open AccessArchive袁CoaA冤袁 该平台互联网址为https:/ 该平台已于2022年底上线遥 国家科研论文集中发布平台目前包括3个子平台要要要国家预印本平台尧国家科技期刊平台尧 国家知识仓储平台遥 其中袁 国家预印本平台互联网为https:/ 实现原创科研论文 野中国首发尧 全球知研究论文752023 年第 35 卷第 7 期晓冶遥 国家预印本平台接收中英文预印本科研论文袁 作者实
5、名注册后即可投稿袁 文章通过最必要的基本审核后可获得DOI编号遥 为保障作者首发权袁 平台向首发论文提供电子收录证书遥 国家预印本平台同时整合中国目前最有代表性的多个预印本网站要要要教育部科技发展中心主办的中国科技论文在线 渊目前论文数量最多冤尧 中国科学院文献情报中心主办的中国科学院预印本尧 中国科技信息研究所主办的中国预印本服务系统渊该系统官网通告2023年4月1日停止接收稿件冤遥国家预印本平台的高端定位要求其具有较完备的论文质量保障机制1遥 但是袁 预印本缺乏期刊的同行评议机制袁 故到目前为止袁 世界主要科研国家的科研人事管理部门在职称晋升尧 课题申报等诸多研究者关心的个人利益场合并没有
6、将预印本文章与期刊文章等同视之遥 个人利益关切驱动下袁 大多数研究者虽然态度上支持预印本袁 但实际上并不向预印本提交文章遥 因此袁 尽管欧美代表性学科性预印本数据库 渊如数学尧物理尧 计算机领域arXiv袁 生物学领域bioRiv冤 目前每年提交文章数量数以万计袁 但在数学尧 物理尧 计算机尧生物学领域的大部分仍然在期刊发表2遥 同样现象也在中国的国家预印本平台上重现袁 数据表明袁 近年中国发表的中文期刊文章数 渊中国知网统计冤 是中国发布的预印本文章 渊中国科技论文在线尧 中国科学院预印本尧 中国预印本服务系统合计冤 的500多倍3遥随着国家预印本平台于2022年底落地运行袁 争取国家预印本
7、平台发布文章和期刊文章一样被科研人事管理部门认可袁 激励大批研究者向国家预印本平台提交文章袁 很自然地成为国家预印本平台下一阶段建设的重要议题4遥 目前国内外预印本采用的论文质量保障机制主要有院由预印本工作人员对研究者提交的论文进行技术性形式审查袁 主要包括审核作者是否在正规学术机构工作尧 作者履历是否具备基本的学术研究训练尧 软件查重以及是否有可信研究者背书遥 优点是审核快袁 缺点是并非对论文内容的评价袁 论文质量保障力度小遥招募志愿者5遥 志愿者机制的优点是不需要预印本平台支付报酬袁 缺点是学术观点分歧甚至私人矛盾可能介入其中袁 国际著名预印本数据库arXiv多次发生审核员因不同原因删掉论
8、文而引发作者抗议事件遥读者自由点评6遥 优点是评议者可以畅所欲言袁发表看法袁 缺点在于一些论文可能长期无人点评袁 另外可能出现一些作者之间互相给对方论文虚假好评袁或者刻意低评与自己存在利益冲突的论文遥同行评议遥 由具备评议资格的评议人对论文质量进行评议遥根据评议人邀请方式不同袁 又分为作者邀请尧 编辑邀请尧 自组织同行评议7遥 由于作者邀请评议人容易作弊或者评议人天然倾向于拔高评价袁 故实践中可行的是编辑邀请尧 自组织评议遥 中国国家预印本平台文章来源最多也即目前最主要子平台要要要中国科技论文在线要要要采用编辑邀请遥 自组织同行评议的最大特点是由算法而不是由人来完成搜索评议人尧 匹配评议人-待
9、评材料两个同行评议的关键环节遥 由于算法一旦启动袁 不再需要人介入袁 故称为自组织同行评议遥 同行评议组织者不再具体介入搜索评议人尧 匹配评议人-待评材料袁 而是专注于设计与完善算法尧 处理同行评议过程出现的意外情况遥在评议人尧 待评材料相同的条件下袁 自组织同行评议在公正性尧 有效性尧 快捷性方面整体上优于传统的由编辑组织的同行评议7遥 作为近10年来同行评议模式的一种创新袁 自组织同行评议具有一定理论与应用价值遥 自组织同行评议理论上完全适用于预印本8袁已有文献讨论将自组织同行评议应用于预印本如中国科技论文在线9尧arXiv10遥自组织同行评议应用于国家预印本平台袁 需要解决两个核心问题院
10、激励研究者广泛参与问题曰关键参数设计问题遥激励研究者广泛参与问题产生的原因是同行评议普遍没有报酬袁 属于研究者对学术社区的义务劳动遥由于期刊得到科研人事管理部门认可袁 因此给期刊担任文章评议人对研究者而言具有一定声誉认可价值袁有助于个人职业发展袁 因此相对多数研究者愿意为期刊免费评议文章遥 预印本文章目前不被科研人事管理部门认可袁 国家预印本平台引入同行评议袁 则激励研究者参与同行评议势必成为难题遥 对此可引入自组织同行评议解决遥 自组织同行评议引入国家预印本平台DOI院10.13998/ki.issn1002-1248.23-0303研究论文762023 年第 35 卷第 7 期的基本思路是
11、平台通过算法匹配一个学科领域下提交文章的研究者袁 让研究者之间双盲的情况下互相评议袁对于连续拒评或评议超时的研究者进行处罚袁 处罚期间被处罚者提交和参与署名的所有论文暂停被访问尧 下载和被评议袁 同时向这些论文的其他作者通报处罚情况袁通过研究者个人声誉受损与同侪压力激励评议人按时完成评议任务8遥 除通过上述处罚方式激励研究者参与外袁 石进等还讨论了自组织同行评议的积分激励机制11尧 付江阳等人提出自组织同行评议的通证激励12遥关键参数设计问题产生的原因是影响自组织同行评议性能的4个关键参数包括评议人休息时间尧 评议人拒审率尧 作者人数尧 评议资格比例袁4个关键参数取值组合不同袁 则自组织同行评
12、议性能表现不同遥 那么袁在国家预印本平台管理方要求性能下袁 自组织同行评议上述关键参数如何优化设计才能达到要求钥为此袁 本文使用论文评议完成率 渊CR冤尧 评议人任 务 分 配 均 衡 度 渊TBD冤 尧 论 文 平 均 评 议 速 度渊A_r_time冤3个性能指标评价自组织同行评议表现袁具体定义详见表1袁 采用Box-Behnken实验方案袁 对自组织同行评议关键参数的不同取值进行试验设计袁仿真得到关键参数典型组合对应的自组织同行评议在上述3个性能指标的表现值袁 再拟合得到性能指标与关键参数之间的量化方程式袁 国家预印本平台管理方可以根据需要设定关键参数取值袁 用于国家预印本平台的管理决策
13、参考遥2 数值实验研究设计2.1 自组织同行评议过程规则设定为提高小同行评议概率袁 讨论在二级学科层面上进行遥 论文数与论文作者关系服从洛特卡分布袁 通过调整洛特卡分布参数取值从而仿真不同学科遥 一个仿真周期为365天袁 评议时间超出仿真周期的文章视为未评议遥自组织同行评议过程规则仿真设定院通过调整评议人占全部作者比例来保证评议人具备必要的专业资质10遥3名评议人为一组评议一篇论文 渊目前国内外惯例冤遥3名评议人评议用时最长者为论文最终评议时间遥 作者不自评自己参与署名的论文遥一名评议人任务数为其提交论文数量乘以3袁 如甲尧 乙两人分别向平台提交1篇尧2篇文章袁 则甲评议人相应任务数量为3篇袁
14、 乙为6篇遥 提交文章多袁 则评议任务多遥若有多个满足条件的评议人组合袁 优先选择评议任务未完成数量最多的组合遥若存在多个评议任务未完成数量相同的评议人组合要求选择袁 则随机选择一个评议人组合遥如没有满足条件的组合袁 等待下一轮匹配遥对评议超期尧 多次拒评的评议人处罚为将被处罚评议人提交的待评论文直接后移到论文-评议人匹配序列的最后位置遥自组织同行评议与目前大多数期刊采用的编辑邀请同行评议模式的根本区别在于院 自组织同行评议的评议人来源为预印本平台注册者袁 且为待评议论文匹配评议人时是根据一组算法规则袁 无需编辑介入遥 两者相同之处在于院 都是根据摘要尧 关键词及作者主要研究方向袁 为待评议论
15、文匹配研究领域相似的评议人遥2.2 自组织同行评议性能指标自组织同行评议性能表现评价指标以及定义详见表1遥 其中袁 评议任务饱和度含义是院 以3名评议人为一组评议一篇论文为例袁 假设一名作者有评议资格袁向国家预印本平台提交2篇文章要求评议袁 则为维持编号 名称 符号 定义 1 评议完成率 CR 一个仿真周期内,已经完成评议的论文数量占总待评议论文数的比例 2 平均评议时间 A_r_time 一个仿真周期内,处于完成评议状态的文章所用评议时间均值 3 任务分配均衡度 TBD 评议任务饱和度大于 80%的评议人数占所有具备评议资格的评议人数的比例 表1自组织同行评议性能评价指标Table 1 Pe
16、rformance evaluation indicators of self-organizing peer review王凌峰,王申鹏基于响应面分析的国家预印本平台自组织同行评议参数设计772023 年第 35 卷第 7 期评议可持续袁 该作者需要在平台评议其他论文的评议任务量为2伊3=6遥 如在一个仿真周期内袁 此人实际完成评议论文3篇袁 则其任务饱和度为3衣6=50%袁 表明平台向该评议人分配任务次数不够袁 或者该研究者拒审次数过多袁 都属于应该避免的情况遥 显然袁 任务饱和度越接近100%越好遥2.3 参数取值仿真参数除了4个关键参数 渊作者人数尧 评议资格比例尧 评议人休息时间尧
17、评议人拒审率冤 外袁 还包括其他一些辅助参数袁 全部参数具体取值如表2所示遥部分参数取值依据较长袁 表2补充说明如下遥渊1冤 评议人休息时间在15,25区间取值依据是院据Publons网站完成的 叶全球同行评议报告曳 显示袁 论文评议时间中位数约为14.7天 渊取整为15天冤13遥 取5天为步长是考虑一周工作时间为5天遥 考虑2月通常为28天袁 故评议人休息时间上限取值不超过28天遥考虑步长为5天袁 为保障实验步长一致袁 设置休息时间上限为25天遥渊2冤 据中国科学技术信息研究所2022年5月份发布的 叶2020年中国科技论文统计分析曳袁 国内发表科研论文最多的10个学科共计发表28.6万篇论
18、文袁 则平均一个学科一年发表约23万篇论文遥 根据洛特卡定律袁以论文第一作者身份一年发布一篇文章的占比最大遥目前多数文章中署名作者数量不超过3个袁 综上推断得出大多数学科研究者人数约在28万人区间内遥渊3冤 设定洛特卡参数组合时袁 约束条件为 野撰写不同篇数文章的作者所占百分比之和等于1冶遥 对于绝大多数作者来说袁 以第一作者身份一年内撰写有一定质量的论文袁 通常篇数不会超过4篇遥 根据洛特卡分布撰写1篇尧2篇尧3篇尧4篇文章作者比例的方法如下院 给定洛特卡参数 n袁 由广义洛特卡分布公式14遥公式 渊1冤C 为参数袁 f(x)为撰写 x 篇论文的比例 渊x=1尧2尧3尧4冤 得院公式 渊2冤
19、根据上述归一化约束条件算出参数 C 后袁 可求出撰写1篇尧2篇尧3篇尧4篇文章作者的占比遥 一个洛特卡参数代表一个学科领域遥渊4冤 一名评议人完成评议的时间上限设为60天的原因是院 现实中多数期刊都要求评议人两个月内完成审稿遥 评议时间下限设为10天的原因是院 国际及国内某些顶尖期刊要求评议人审稿时间控制在两周左右袁如国内物理学顶刊 叶物理学报曳 官网 野审稿政策冶 栏目中承诺首轮审稿通常在两周内完成遥编号 参数名称 取值范围 取值依据 1 评议人休息时间/天 15,25(步长:5)具体说明详见表 2 后文 2 作者人数/人 20 000、40 000、80 000 具体说明详见表 2 后文
20、3 洛特卡定律参数 24(步长:0.25)尽量覆盖较广学科领域范围,提高仿真研究结果的普适性 4 论文总数 由作者总数和洛特卡定律参数计算得出 5 一年作者提交最大论文数/篇 4 为保证论文质量与评议速度,作者可以提交多篇论文,但平台一年最多评议 4 篇,多出论文自动推迟到下一年度评议 6 论文月度上传量 每月在 8%左右波动,幅度为2%假定投稿比较均匀,一年 12 个月,每月占比 1/12,即 8%左右 7 一名评议人完成评议时间/天 10,60(步长:1)评议完成时间大致服从正态分布,使用 1060 天的区间内正态分布随机赋值 8 评议资格比例 50%,80%(步长:15%)经验设定 9
21、拒审率 10%,20%(步长:5%)经验设定 10 一篇文章评议时间 取值为 3 名评议人评议用时最长者 表2仿真参数的取值设定Table 2 Value setting of simulation parameters.()nxfxC4411()1iniiiCf xx窑DOI院10.13998/ki.issn1002-1248.23-0303研究论文782023 年第 35 卷第 7 期2.4 实验设计响应面分析通过实验设计取得因变量尧 自变量代表性数据袁 用多项式回归得到系统自变量和响应特征的量化关系15遥 响应面分析常用的非全因子实验设计方法有中心复合实验设计 渊CCD冤 和Box-Be
22、hnken实验设计 渊BBD冤遥BBD法一个主要优点是实验参数取值不会出现超出设定范围的情况袁 故此处选择BBD方法16遥采用Design-expert软件进行设计遥 作者一年中提交论文数尧 评议时间分布尧 文章评议时间参数随机设定袁 总论文数根据洛特卡定律参数计算得出袁 不纳入BBD实验抽样遥 一个洛特卡定律参数代表一个学科领域袁 洛特卡定律参数全部讨论袁 不抽样遥 选取休息时间 渊A冤尧 拒审率 渊B冤尧 研究者人数 渊C冤尧 评议资格比例 渊D冤 为实验因素袁 各自取3个水平袁 使用-1尧0尧+1进行编码袁 分别代表低尧 中尧 高3种水平遥每个洛特卡定律参数均单独设计一张BBD表袁 对表
23、内各组合进行3次重复实验遥 使用R语言编程袁 不同洛特卡定律参数BBD表内组合运行50次袁 按照15次尧15次尧20次划分为三大组遥 使用R语言中summary()函数和mean()函数袁 计算各性能指标均值遥3 结果与讨论3.1 实验结果篇幅原因袁 本文给出洛特卡定律参数值为2尧 运行20次后各变量取均值结果袁 详见表3遥 其余组合结果类似遥由表3可知院3个性能指标中袁CR随因素变化的波动幅度最大袁 而TBD和A_r_time指标波动幅度很小袁 进一步考虑篇幅限制袁 下文只对CR性能指标进行响应面分析曰各实验组合TBD性能指标值均大于95%袁 说明自组织同行评议在评议人评议任务分配方面表现良
24、好遥A_r_time性能指标值均落在33-35天区间袁 相比较于目前期刊同行评议普遍需要23个月时间袁 自组织同行评议速度快很多遥3.2 CR 性能指标与 4 个关键参数的量化关系根据表3数据袁 以CR渊y1j袁 j=1尧2尧3尧4尧5尧6尧7尧8尧9冤 为因变量袁 以4个关键参数要要要休息时间渊x1冤尧 拒审率 渊x2冤尧 研究者人数 渊x3冤尧 评议资格比例渊x4冤 要要要为自变量袁 进行函数拟合袁 确定量化关系遥自变量数据使用无量纲化伸缩法中的归一化方法进行无量纲处理后袁 得到不同洛特卡定律参数取值下袁4个关键参数与CR的量化关系详见表4遥在表5中袁 各模型失拟项的Pr值均大于0.05袁
25、 不显著袁 模型可信遥 各模型决定系数 R2及校正决定系数AdjR2均大于0.99袁 表明各模型实验实际测量值与预测值的吻合度较高遥 各模型AdjR2和预测决定系数PreR2间高度接近遥 精密度Adeq Precision远大于4袁 说明各模型拟合情况良好遥 各模型变异系数C.V小于0.5%袁 表明实验结果信度高遥对于共线性问题袁Design-expert软件计算得到各洛特卡定律参数值回归方程的VIF值均小于1.414袁 远小于通常设定的VIF判断值袁 因此不存在共线性问题遥表4中列出模型显示袁 评议资格比例变量系数绝对值是其余3个自变量系数绝对值的数倍袁 表明评议资格比例对CR指标的影响数倍
26、于其他3个自变量遥其次为休息时间袁 为负相关遥 研究者人数和拒审率对CR影响不显著遥 因此袁 对自组织同行评议CR性能指标最重要影响因素是评议资格比例袁 其次是休息时间袁最后是研究者人数和拒审率遥以洛特卡参数值为2时的回归方程举例分析袁 保持其他3个参数值不变袁 评议资格比例数值加1袁CR值在十位数位置变动曰 休息时间数值加1袁CR值在个位数位置变动曰 研究者人数和拒审率数值加1袁 仅变动CR值的百分位数袁 变动幅度小袁 可忽略不计遥 故在CR值变动时袁 评议资格比例贡献度最大袁 其次为休息时间遥3.3 关键参数交互作用由于拒审率尧 研究者人数两个参数很难由国家预王凌峰,王申鹏基于响应面分析的
27、国家预印本平台自组织同行评议参数设计792023 年第 35 卷第 7 期印本平台管理机构调控袁 故此处仅讨论休息时间尧 评议资格比例两个参数的交互作用遥响应曲面和等高线图可直观描述试验设计中各参数间的交互作用袁 通常响应面的陡峭程度或等高线的形状可以在一定程度上反映出交互效应的强弱遥 使用Design Expert软件绘出响应曲面图和等高线图遥 篇幅原因袁 此处仅列出洛特卡参数值为2时的响应曲面图和等高线图遥根据图1袁 随着休息时间减少和评议资格比例变大袁CR值随之变大袁 且休息时间尧 评议资格比例交互作用响应面图坡度较陡且等高线呈微弯曲状态袁 说明休息时间减少和评议资格比例变大对CR的影响
28、较为显著遥因素编码 自组织同行评议性能指标 编号 A(休息天数/天)B(拒审率/%)C(研究者人数/人)D(评议资格比例/%)CR/%TBD/%A_r_time/天 1 15 10 40 000 65 63.27 98.59 34.82 2 25 10 40 000 65 61.00 95.28 33.58 3 15 20 40 000 65 63.42 98.43 33.24 4 25 20 40 000 65 61.12 95.37 33.71 5 20 15 20 000 50 47.60 96.70 33.74 6 20 15 80 000 50 47.81 96.99 33.12 7
29、 20 15 20 000 80 77.34 97.10 34.54 8 20 15 80 000 80 77.05 97.52 34.48 9 15 15 40 000 50 48.10 98.00 33.84 10 25 15 40 000 50 46.58 95.24 34.53 11 15 15 40 000 80 78.36 98.71 34.74 12 25 15 40 000 80 75.61 95.44 34.90 13 20 10 20 000 65 62.32 96.94 33.45 14 20 20 20 000 65 62.10 96.98 34.16 15 20 10
30、 80 000 65 62.46 97.27 34.64 16 20 20 80 000 65 62.46 97.09 33.51 17 15 15 20 000 65 63.20 98.16 34.80 18 25 15 20 000 65 60.79 95.32 33.96 19 15 15 80 000 65 63.28 98.13 34.36 20 25 15 80 000 65 61.16 95.23 33.76 21 20 10 40 000 50 47.95 97.18 33.67 22 20 20 40 000 50 47.52 96.94 33.86 23 20 10 40
31、000 80 77.18 97.30 34.76 24 20 20 40 000 80 76.88 97.08 34.53 25 20 15 40 000 65 62.22 96.78 33.99 26 20 15 40 000 65 62.35 97.12 33.96 27 20 15 40 000 65 62.54 97.15 33.97 28 20 15 40 000 65 62.18 97.06 33.97 29 20 15 40 000 65 62.48 97.10 33.96 表3洛特卡定律参数值为2的BBD实验结果Table 3 BBD experiment results wi
32、th Lotkas law parameter value of 2DOI院10.13998/ki.issn1002-1248.23-0303研究论文802023 年第 35 卷第 7 期图1休息时间尧 评议资格比例对CR性能的交互影响Fig.1 Interaction effects of rest time and review qualification ratio on CR performance表4不同洛特卡定律参数值下CR值与4个关键参数的量化关系Table 4 Relationship between CR value and four key parameters under
33、 different Lotkas law parameter values洛特卡值 失拟项 R2 Adj R2 Pred R2 Adeq Precision C.V/%2 0.480 2 0.999 8 0.999 7 0.999 3 260.629 0.27 2.25 0.206 2 0.999 9 0.999 7 0.999 3 279.800 0.25 2.5 0.415 1 0.999 9 0.999 8 0.999 6 334.659 0.20 2.75 0.604 2 0.999 9 0.999 8 0.999 6 316.227 0.22 3 0.617 9 0.999 7 0
34、.999 5 0.999 0 196.707 0.34 3.25 0.657 5 0.999 7 0.999 5 0.998 9 193.838 0.35 3.5 0.597 4 0.999 7 0.999 5 0.998 9 193.904 0.35 3.75 0.614 9 0.999 7 0.999 5 0.998 9 196.288 0.35 4 0.411 9 0.999 7 0.999 3 0.998 3 166.873 0.41 表5不同洛特卡定律参数值下回归方程误差统计Table 5 Error statistics of regression equations under
35、different Lotkas law parameter valuesCR值与4个关键参数的回归方程y11=62.38-1.1x1-0.046x2+0.072x3+14.71x4-0.003x1x2+0.066x1x3-0.31x1x4+0.053x2x3+0.033x2x4-0.12x3x4-0.21x12+0.012x22-0.027x32-0.047x42y12=62.49-1.1x1-0.047x2+0.071x3+14.71x4-0.003x1x2+0.065x1x3-0.31x1x4+0.052x2x3+0.036x2x4-0.1x3x4-0.11x12+0.1x22+0.06
36、9x32+0.14x42 y13=62.92-0.74x1-0.001x2+0.04x3+14.76x4+0.01x1x2+0.044x1x3-0.088x1x4-0.06x2x3+0.037x2x4+0.098x3x4-023x12+0.039x22-0.12x32-0.013x42y14=63.21-0.74x1-0.001x2+0.044x3+14.75x4+0.009x1x2+0.045x1x3-0.087x1x4-0.06x2x3+0.041x2x4+0.092x3x4-0.22x12+0.045x22-0.11x32-0.007x42y15=63.79-0.56x1-0.031x2
37、-0.047x3+14.71x4-0.18x1x2+0.063x1x3-0.008x1x4-0.078x2x3+0.026x2x4+0.048x3x4-0.35x12-0.17x22-0.15x32-0.16x42y16=63.74-0.56x1-0.03x2-0.048x3+14.71x4-0.18x1x2+0.063x1x3-0.008x1x4+0.078x2x3+0.026x2x4+0.048x3x4-0.32x12-0.15x22-0.13x32-0.13x42y17=63.78-0.52x1-0.036x2-0.084x3+14.71x4-0.24x1x2+0.021x1x3-0.0
38、42x1x4-0.079x2x3+0.051x2x4+0.046x3x4-0.27x12-0.18x22-0.12x32-0.18x42y18=64.07-0.51x1-0.069x2-0.047x3+14.66x4-0.059x1x2+0.047x1x3-0042x1x4+0.089x2x3+0.026x2x4-0.089x3x4-0.32x12-0.12x22-0.11x32-0.14x42y19=64.09-0.57x1-0.007x2-0.052x3+14.75x4-0.21x1x2+0.066x1x3+0.092x1x4+0.071x2x3+0.026x2x4+0.055x3x4-0
39、.38x12-0.16x22-0.14x32-0.19x42洛特卡值22.252.52.7533.253.53.754王凌峰,王申鹏基于响应面分析的国家预印本平台自组织同行评议参数设计812023 年第 35 卷第 7 期4 仿真方程应用院 自组织同行评议关键参数优化设计示例前文表明袁 休息时间尧 评议资格比例两个关键参数对自组织同行评议CR性能指标表现影响显著袁 同时又是国家预印本平台管理机构完全可控参数遥 相比之下袁 拒审率尧 研究者人数两个参数国家预印本平台管理机构不能控制遥 因此袁 管理实践中袁 国家预印本平台管理机构主要在一个学科提交论文作者数尧 经验拒审率或者运行一段时间后取得真实
40、拒审率数据基础上袁 调整休息时间尧 评议资格比例两个参数袁 进行优化设计遥以某学科的作者-论文数分布符合洛特卡定律参数值为2时为例 渊其余洛特卡定律参数取值情况类似袁不再赘述冤袁 应用表3中洛特卡参数值为2时的量化方程袁 如公式 渊3冤 所示遥y11=62.38-1.1x1-0.046x2+0.072x3+14.71x4-0.003x1x2+0.066x1x3-0.31x1x4+0.053x2x3+0.033x2x4-0.12x3x4-0.21x12+0.012x22-0.027x32-0.047x42公式 渊3冤若国家预印本平台管理方预期自组织同行评议性能表现CR值达到75%及以上袁4个关键
41、参数取值可以有多种组合袁 篇幅原因袁 此处列出根据公式3计算的3种不同人数区间组合供参考院如果作者人数落入区间0,20000袁 拒审率落入区间10%,15%袁 则其余两个关键参数取值可以确定为休息时间20天尧 评议资格比例80%袁 此时CR值落入区间77.24%,77.32%曰如果作者人数落入区间20000,40000袁 拒审率落入区间15%,20%袁 则其余两个关键参数取值可以确定为休息时间15天尧 评议资格比例80%袁 此时CR值落入区间78.32%,78.34%曰如果作者人数落入区间40000,80000袁 拒审率落入区间15%,20%袁 则其余两个关键参数取值可以确定为休息时间25天尧
42、 评议资格比例80%袁 此时CR值落入区间75.51%,75.56%遥 其余情况袁 根据文中所得量化方程再进行计算即可遥5 结语本研究主要结论院评议资格比例尧 评议人休息时间对自组织同行评议性能影响较大袁 特别是评议资格比例设定重要性远高于其他3个关键参数曰量化方程中袁 作者人数变量系数绝对值非常小袁 表明作者人数变化对自组织评议性能影响极低袁 近似于可忽略遥本文对国家预印本平台建设问题的贡献为院 通过仿真为国家预印本平台采用自组织同行评议保证论文质量提供了数值实验论据袁 得到的仿真方程可为国家预印本平台管理机构决策提供量化支持遥 需要强调的是袁 由于本文作者掌握算力资源有限袁 故仿真精度还有
43、提高空间袁 如需要且具备算力资源的情况下袁 可以按照本文方法和参数进行更加精细的仿真计算遥参考文献院1李广建.对国家科研论文和科技信息高端交流平台的理解及研究建议J.图书与情报,2021(6):1-4.LI G J.Understanding and research suggestions on the high-end ex鄄change platform of national scientific research papers and scientificand technological informationJ.Library&information,2021(6):1-4.2孙
44、异凡,陈一,蒋子可,等.开放科学视域下预印本认可政策研究J.数字图书馆论坛,2021(6):2-12.SUN Y F,CHEN Y,JIANG Z K,et al.Research on the recognitionpolicy of preprints from the perspective of open scienceJ.Digitallibrary forum,2021(6):2-12.3王凌峰,程灵慧.预印本与期刊:互补合作到优势融合J/OL.情报杂志:1-72023-06-19.http:/ L F,CHENG L H.Preprint and journal:Compleme
45、ntary co-operation to advantage integrationJ/OL.Journal of intelligence:1-72023-08-19.http:/ 2.0 应用于国家科研论文高端交流平台建设的设想J.图书情报导刊,2021,6(9):20-24.TANG B Q,WANG L F.A proposal of preprint 2.0 applied to na鄄tional high-level scientific paper platform constructionJ.Journal oflibrary and information science
46、,2021,6(9):20-24.5宋永辉,马廷灿,刘静羽.志愿者参与下国际预印本平台学术质量控制方法调研与启示要要要以 arXiv 与 RePEc 平台为例J.中国DOI院10.13998/ki.issn1002-1248.23-0303研究论文822023 年第 35 卷第 7 期科技期刊研究,2023,34(2):119-126.SONG Y H,MA T C,LIU J Y.Roles of volunteers in academicquality control of international preprint platforms:Taking arXiv andRePEc as
47、 examplesJ.Chinese journal of scientific and technicalperiodicals,2023,34(2):119-126.6祝忠明.国家高端交流平台建设体系及其开放科学实践策略J.图书与情报,2021(6):21-30.ZHU Z M.Open science platforms for the development of high-endcommunication platforms in ChinaJ.Library&information,2021(6):21-30.7唐碧群,王凌峰.自组织同行评议:技术赋能同行评议的产生尧设计与多场景应
48、用J.图书情报导刊,2022,7(11):63-68.TANG B Q,WANG L F.Self-organized peer review:The generation,design and multi-scenario applications of technology-enpowered peerreviewJ.Journal of library and information science,2022,7(11):63-68.8王凌峰,孙英潮.E-prints 预印本数据库的自组织同行评议模式设计J.现代情报,2016,36(5):9-15.WANG L F,SUN Y C.De
49、sign of self-organizing peer review mecha鄄nism under E-prints database environmentJ.Journal of modern infor鄄mation,2016,36(5):9-15.9唐碧群,杨硕,王凌峰.自组织同行评议在预印本数据库中的应用要要要以野中国科技论文在线冶为例J.图书情报导刊,2018,3(4):26-31.TANG B Q,YANG S,WANG L F.Application of self-organizingpeer review in preprint database:Taking Chi
50、nese science papersonline as an exampleJ.Journal of library and information science,2018,3(4):26-31.10WANG L F,ZHAN Y Q.A conceptual peer review model for arX鄄iv and other preprint databases J.Learned publishing,2019(3):213-219.11 石进,苗杰,李明.面向预印本系统的自组织同行评议及激励机制研究J.现代情报,2019,39(12):88-100.SHI J,MIAO J