收藏 分销(赏)

基于科研奖励数据的情报分析模式构建.pdf

上传人:自信****多点 文档编号:640689 上传时间:2024-01-22 格式:PDF 页数:7 大小:1.03MB
下载 相关 举报
基于科研奖励数据的情报分析模式构建.pdf_第1页
第1页 / 共7页
基于科研奖励数据的情报分析模式构建.pdf_第2页
第2页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷第 期 年 月(社会科学版)().收稿日期基金项目教育部协同育人项目“基于创新驱动的信息获取能力提升研究”()教育部协同育人项目“基于科研写作优化的知网研学应用研究”()山东大学横向项目“学校学科学者学术:基于科研数据的近四年来的山东史学研究”()作者简介姚传义男副研究馆员.李修波男副研究馆员 .基于科研奖励数据的情报分析模式构建姚传义李修波(山东大学 图书馆 山东 济南)摘 要 基于科研奖励数据的情报分析模式构建是一个复杂的过程 模式构建以用户需求原则、可行性原则以及多样性原则为指导 模式构建过程有三个基本步骤:建立科研奖励情报分析基础数据源、完成学者和机构等用户画像和主题分析并形成分

2、析报告、完成报告修订并提供给用户 在这些步骤中分别以科研奖励总体情况分析学者、机构科研奖励分析科研奖励学科分析科研奖励主题分析以及科研奖励机构的对比分析等为切入点对完成用户画像和主题分析进行了重点描述 同时针对模式构建的数据采集、归类、分析方法以及分析手段等问题寻找合理解决方案 模式构建过程中形成的经验主要有:数据采集表的设计要科学、数据归类要务实、分析工具应用要合理、分析方法要独辟蹊径关键词 科研奖励数据情报分析中图分类号 文献标志码 文章编号()引言科研数据是高校科研工作的终点是检验学校科技发展战略规划和政策引导科学性的重要指标 近年来随着高校科研数据管理工作的深入图书馆在科研数据的挖掘上

3、介入越来越深基于科研数据的情报分析逐渐成为其最常见的服务项目之一 具体做法是图书馆基于用户委托运用文献计量和情报分析方法搜集符合用户需求的科研数据完成用户画像并出具图文并茂的分析报告 科研奖励数据作为科研数据的一部分因其与高校科研人员个人、团队或所在机构的荣誉及其发展密切相关受到了科研人员、科研团队和科研机构等情报用户的特别关注成为开展情报分析所依据的重要信息来源长期以来高校图书馆以科研奖励数据为数据源开展情报分析的案例并不多主要基于两个方面的原因:一方面是科研奖励数据种类繁多授奖主体和奖项复杂搜集起来较为困难另一方面是科研奖励数据的管理体系较为复杂作为与科研奖励管理业务交集不多的部门图书馆在

4、科研奖励的分类、奖项和相关政策把握上存在短板 年山东大学图书馆学科服务团队(以下称团队)接受 学会委托对 年山东史学的科研奖励数据进行搜集、清洗以此数据为基础构建用户画像完成情报分析 本文是对完成科研奖励数据情报分析过程的概括和总结也是对基于科研奖励数据的情报分析模式构建的提炼和升华 这一情报分析模式的构建对图书馆传统信息服务的发展对信息服务的改革和创新具有一定指导意义一、模式构建的指导原则(一)用户需求原则所谓用户需求原则即科研奖励情报分析模式构建以用户需求为中心数据搜集和报告撰写都围绕着用户需求进行 按照这一原则团队接受委托后与委托人进行深入交流请其提供明确的信息需求清单完成与委托人所在机

5、构指定专家的对接在指定专家的帮助下展开科研奖励数据的搜集保证情报分析工作的效率(二)可行性原则所谓可行性原则即对数据搜集和情报分析的可行性进行评估并依据评估结果开始情报分析和报告撰写 主要是指对科研奖励数据的易得性、情报分析的科学性以及数据和结论的周延性进行评估并用以指导整个情报分析模式构建的全过程(三)多样性原则所谓多样性原则即科研奖励情报分析模式中的展示形式多种多样 不管是用户画像、主题分析还是报告撰写都采用多工具、多角度和多方式表现 如分析报告中的可视化图谱可以根据不同情况设置成柱状图、折线图、面积图、饼图、气泡图、雷达图、箱形图、仪表盘、渲染地图、标点地图、流向地图、漏斗图、架构图、词

6、云图等形式丰富多样二、模式的构建过程关于科研奖励数据情报分析模式的构建过程王宪朋的描述值得借鉴 他以用户画像为切入点将分析过程具化为三个步骤:一是数据的搜集二是将数据分析与用户需求紧密结合构建具有用户特色的用户画像三是将情报分析与数学建模相结合 通过可视化技术展示用户有价值的信息团队借鉴此分类理念同时结合用户需求建立了基于科研奖励数据的情报分析模式 第一步建立科研奖励情报分析的基础信息源 分别指定团队成员完成相应类型科研数据的搜集、汇总和清洗搜集数据以“尽可能全”为前提汇总团队搜集的数据和委托单位提供的数据数据清洗则力求严谨、科学保证数据准确 第二步对基础数据涉及的学者、机构等实施用户画像和主

7、题分析形成情报分析报告 以清洗后的科研奖励数据为基础对数据涉及的机构、学科、学者、研究主题等进行统计完成机构、学科、学者的纵向分析和可视化展示 同时以教育部人文社科优秀成果奖获奖数据为依据以委托人指定的学科和获奖人省域为切入点对委托人获奖能力进行跨省机构分析描绘委托人在全国同行中的科研获奖能力 第三步修订 完成情报分析报告的修改和勘误提升情报分析的总体服务质量(一)建立基础数据源融合不同的数据资源是 情 报 分 析 的 基础是情报分析结论是否科学的关键因素在数据搜集阶段必须保障搜集到的数据既全又准 为达到这一目标团队在数据采集中实行了团队数据采集和委托人统计信息的数据采集“双保险”首先由团队成

8、员依托委托人可能获得奖项的奖单采集数据其中包括国家哲学社会科学成果文库、第八届高等学校科学研究优秀成果奖(人文社会科学)、第五届郭沫若奖、山东省三十二届至三十五届社会科学优秀成果奖等为采集数据源采集到与委托人相关的科研奖励 (社会科学版)年第 期数据 条 同时通过设计科研奖励数据信息采集表由委托人组织其下属会员和会员单位完成科研奖励数据填报获得科研奖励数据 条 将两种来源的数据汇总经过数据去重和无效数据删除等数据清洗后得到数据 条 为提升数据的可用性将 条数据交由委托机构指定的学者进行数据复核和选择最终得到科研奖励数据 条以此作为基于委托人科研奖励数据的情报分析基础(二)完成用户画像和主题分析

9、这是科研奖励情报分析模式的关键环节在本环节将利用清洗后的数据完成委托人(含子机构、学者)的整体画像和主题分析完成分析报告撰写 为使情报分析模式更加清晰团队从科研奖励数据入手对委托人的总体科研奖励情况、学者和机构科研奖励对比、科研奖励学科分布、科研奖励主题分布、科研奖励跨省机构对比等依次分析揭示委托人科研奖励产出数量及其在学科中的获奖表现.科研奖励总体情况分析从科研奖励级别(管理级别、等级)、时间分布(获奖时间、科研产出时间)等方面展开分析根据科研奖励的管理惯例管理级别划分为国家级、教育部级、山东省级、厅局级、校级及其他等科研奖励等级则分为特等并一等、一等、二等、三等和无等级等多种情况 表 展示

10、的是 条科研奖励数据奖励级别的总体统计情况 表 是对表 中“其他”项科研奖励的进一步细分表 年山东省史学界科研奖励总体分布奖励级别奖励次数奖项占比国家.教育部.山东省.厅局.其他.表 年山东省史学界“其他”科研奖励总体分布奖励名称奖励次数奖励名称奖励次数第三十四次泰安市社会科学优秀成果奖第三十五次泰安市社会科学优秀成果奖第三十二次泰安市社会科学优秀成果奖第三十三次烟台市社会科学优秀成果奖第三十四次淄博市社会科学优秀成果奖第三十一次淄博市社会科学优秀成果奖第二十七次潍坊市社会科学优秀成果奖第三十二次淄博市社会科学优秀成果奖第二十八次潍坊市社会科学优秀成果奖第三十三次淄博市社会科学优秀成果奖第二十

11、九届北方十五省、市、自治区哲学 社会科学优秀图书奖 年文化和旅游部优秀研究成果奖泰山学院 年优秀科研成果奖第五届风筝都文化奖泰山学院 年优秀科研成果奖 年全国古籍出版社年度百佳图书奖其他山东省全省党校系统优秀社科成果奖 .学者、机构科研奖励分析主要以全部科研奖励所涉学者、机构和省级以上科研奖励所涉学者、机构两个数据集为切入点展开情报分析 其中省级以上科研奖励获奖机构基于科研奖励数据的情报分析模式构建参见 山东省史学会科研奖励汇总表/.().网址链接:/./.主要从国家级奖励所涉机构、教育部级奖励所涉机构、山东省级奖励所涉机构等三类机构作出用户画像和主题分析 表 展示的是 项科研奖励数据中获得

12、项以上科研奖励机构的统计表 年山东省史学界获得 项以上科研奖励的机构分布机构名称获奖次数机构名称获奖次数山东大学潍坊科技学院聊城大学滨州学院山东师范大学淄博市委党校曲阜师范大学山东社会科学院泰山学院山东省委党校鲁东大学临沂大学青岛大学中国海洋大学山东理工大学表 第八届高等学校科学研究优秀成果奖(人文社会科学)历史学科 项科研奖励所涉机构对比获奖机构获奖次数获奖机构获奖次数北京大学海南大学复旦大学扬州大学武汉大学吉林大学南京大学浙江师范大学东北师范大学河北省社会科学院山东大学澳门大学中山大学福建师范大学中国人民大学湖南大学清华大学南京邮电大学南开大学郑州大学西北大学重庆师范大学浙江大学暨南大学北

13、京师范大学云南大学华中师范大学山西大学西南大学北京外国语大学上海师范大学兰州大学宁夏大学苏州大学上海交通大学四川大学上海大学西南交通大学南京师范大学西南政法大学厦门大学温州大学华东师范大学 (社会科学版)年第 期 .科研奖励学科分布主要从世界史与中国史以及中国古代史(年前)、中国近现代史()、当代中国史()两个学科分类维度完成基于全部科研奖励数据和省级以上科研奖励数据两个数据集合的情报分析.科研奖励主题分布主要以科研奖励每条数据的“关键词”基于所有科研奖励数据和省级以上科研奖励数据两个数据集展开主题分析以词云和主题关联图谱加以展示.科研奖励机构跨省对比以第八届高等学校科学研究优秀成果奖(人文社

14、会科学)项获奖成果为数据集以单一学科和省域为限制对委托人进行“省区总体数据比较”和“机构比较”揭示委托人在各省域中的研究层次和水准 表 展示的是基于第八届高等学校科学研究优秀成果奖(人文社会科学)历史学科 条科研奖励数据所涉机构的统计(三)修订基于科研奖励数据的用户画像和主题分析初步完成并形成报告后团队与委托人指定的专家进行沟通听取专家意见和建议并对分析报告中所涉及的委托人总体科研奖励情况、学者和机构科研奖励对比、科研奖励跨省机构对比等进行了修订 修订主要集中在:减少科研奖励管理级别的种类即将原来的国家级、教育部级、山东省级、厅局级、校级和其他级的分类简化为国家级、教育部级、山东省级、厅局级及

15、其他级等同时删除对厅局级科研奖励数据所涉学者、机构的画像和主题分析突出了委托人的关注重点三、模式构建的相关问题(一)数据采集问题.数据全面性问题主要采用多渠道采集科研奖励信息的方法来解决这一问题()由团队成员多渠道搜集获奖信息 如通过国家哲学社会科学成果文库、第八届高等学校科学研究优秀成果奖(人文社会科学)、郭沫若奖、胡绳青年学术奖、山东省社会科学优秀成果奖等奖单获取科研奖励信息()由委托人组织其会员和会员单位填报科研奖励信息 通过以上采集较大程度地保证了科研奖励信息的全面性.数据准确性问题主要采用多轮数据清洗和专家辅助选择的方法来解决这一问题()多轮数据清洗主要是去除重复的、错误、冗余的数据

16、()将多轮清洗后的数据交由委托机构指定专家由其完成数据选择保障数据的准确性(二)数据归类问题.管理级别归类问题这一问题主要集中在设置多少科研奖励管理级别 按照委托人会员和会员单位的填写结果科研奖励的管理级别非常多大到国家级奖、教育部级奖小到校级奖、学会奖 结合汇集的各类管理级别科研奖励情况同时征求委托单位专家的意见最后将科研奖励的管理级别定义为四个级别即国家级、教育部级、山东省级、厅局级及其他级()国家级奖 主要是指获得全国广泛影响力的科研奖励如国家哲学社会科学成果文库等()教育部级奖 主要包括第八届高等学校科学研究优秀成果奖(人文社会科学)、郭沫若奖、胡绳青年学术奖等()山东省级奖 主要包括

17、山东省社会科学优秀成果奖等基于科研奖励数据的情报分析模式构建此处依据 学会专家要求将郭沫若奖、胡绳青年学术奖定义为与教育部奖同一级别奖项()厅局级及其他级奖项 包括厅局级及地市级以下各类奖项.学科数据归类问题焦点主要出现在跨学科科研奖励的归类对一些跨越了中国古代史、中国近现代史和当代史多个历史学科的科研奖励采取了设置新分类“跨代”的单独类别使这部分科研奖励数据的归类更加准确(三)数据分析方法和分析手段问题.分析方法问题对于文献计量定律的移植问题将用以确定学术论文核心作者的普赖斯定律移植到用以评价科研奖励的学者分析中根据普赖斯定律的计算公式 .其中 为文章篇数为所统计年限内发表文章数量最多的那位

18、作者的发文数 验证发现基于全部科研数据的学者分析与普赖斯定律非常吻合.分析手段问题()交叉分析问题 对委托人的总体科研奖励情况、学者和机构科研奖励对比、科研奖励学科分布、科研奖励主题分布、科研奖励省域分析等均需实现奖励管理级别、奖励等级至少两个维度的分析因此数据分析工具的选择和应用就显得尤其重要 笔者对比了多款数据统计工具最后选择问卷星实现数据的交叉统计分析很好地解决了多维度数据交叉分析的问题提高了数据分析效率()可视化图谱问题 根据用户需求为不同分析对象选择适当的可视化图谱是情报分析的一种常见手段 这些图谱美观、大方和实用便于展示科研奖励数据的最显著特点 为充分显示管理级别、等级科研奖励数据

19、的不同特色笔者在分析中针对不同的分析对象分别采用了柱状图、折线图、饼图、雷达图、仪表盘、词云图等对统计分析结果进行展示达到了较好的分析展示效果四、模式构建的经验与技巧(一)数据采集表的设计要科学数据搜集是情报分析的基础它直接决定情报分析的科学性和准确性 团队设计用户数据搜集表的原则是表格必须完全覆盖用户委托信息和用户报告的分析方向 指标不宜多更不能少 如果少设计一个指标可能会造成大量的人力资源浪费并对后期的情报分析造成难以预料的困难 团队设计的用户数据采集表层次分明科学细致涵盖了委托人的所有需求及情报分析要点对情报分析结论的科学性形成了有力支撑(二)数据的归类要务实一条科研奖励数据可能涉及多个

20、奖项、多个管理部门、多个奖励等级对其进行科学归类直接决定了情报分析结论的层次与特色 团队在对国家、教育部、山东省和学校等多级科研奖励管理部门调研的基础上设置了科研奖励的归类统计方案即将科研奖励简化为国家级、教育部级、山东省级、厅局级及其他级四个级别充分体现了现有科研奖励评价体制下科研奖励的管理级别、等级的实际情况 这使科研奖励数据的分析更加多元也使科研奖励重要性的展示层次更加分明(三)工具的应用要合理科研奖励多管理部门、多等级和多层次的特 (社会科学版)年第 期验证采用普赖斯定律即个人的论文数大于 的科学家为核心作者所发表的论文总数恰好等于全部论文总数的一半 将其移植到获奖者的测评中 单一学者

21、最高获奖次数为 算出 值为.接近 获奖次数 以上的学者获奖总次数为 非常接近总获奖次数 的一半 因此比照论文核心作者的定义可将获奖次数为 次以上的学者定义为核心获奖学者根据需要本文将原报告中以图展示的数据改为以表、表、表、表 展示点决定了科研奖励情报分析的复杂性和多维性 分析者在利用科研数据试着找出情报分析结论的同时还需要找出情报分析最佳算法风险治理策略进而达到治理成本与收益最大化的目标 团队在进行科研奖励数据分析时合理利用了问卷星的数据汇集和交叉分析功能 在汇集多轮清洗后数据时设置了科研奖励管理级别、管理等级等分析点然后根据这些分析点完成科研奖励数据的情报分析实现了利用 等工具难以完成的数据

22、交叉分析和可视化展示大大减少了利用 等工具统计数据的工作量丰富了可视化图谱的展示方式提升了情报分析报告显示的颗粒度(四)分析方法要独辟蹊径团队在分析科研奖励数据涉及的学者和学术机构时将普赖斯定律中科研论文核心作者的认定方法移植到科研奖励核心学者的认定上一定程度上提升了科研奖励数据分析报告的理论厚度和可信度五、结语本文所构建的基于科研奖励数据的情报分析模式取得了较好的分析效果不但取得了用户满意和高度信任团队成员在经历短暂困难后收获了成功并积累了宝贵特种数据情报分析的实战经验 需要强调的是这一分析模式还有很多方面需要进一步研究 如模式构建时没有设计科研奖励与激励机制的数据统计因此无法统观委托人科研

23、奖励和激励机制的关系再如模式没有设立人才引进和科研奖励的关系指标因而无法确立人才引进对科研奖励数据分布的影响又如模式没有设计成果转化和科研奖励的关系指标无法确定科研奖励和成果转化之间的对应关系等 非常期待有新的研究成果涉足这些研究领域参 考 文 献胡羚邹建伟黄静等.广东省科学技术奖励数据统计分析/.().:/./?.刘敏张颖.浙江省 所公办本科院校图书馆决策支持服务的调查与思考.图书馆研究与工作():.王宪朋.基于视频大数据的用户画像构建.电视技术():.王电.情报信息处理与分析技术概述.警察技术():.姚雪徐川平李杰等.基于普赖斯定律和二八定律及在线投稿系统构建某科技期刊核心作者用户库.编辑学报():.孙钦莹汪颖姜磊等.智能情报分析算法风险治理可持续策略建模与仿真.图书与情报():.(责任编辑 李逢超)基于科研奖励数据的情报分析模式构建

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服