收藏 分销(赏)

基于科技政务数据开放共享的数据分类分级方法研究.pdf

上传人:自信****多点 文档编号:647357 上传时间:2024-01-23 格式:PDF 页数:4 大小:1.57MB
下载 相关 举报
基于科技政务数据开放共享的数据分类分级方法研究.pdf_第1页
第1页 / 共4页
基于科技政务数据开放共享的数据分类分级方法研究.pdf_第2页
第2页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、科技创新导报 Science and Technology Innovation Herald科技创新导报2022 NO.30 Science and Technology Innovation Herald智 能 智 造 与 信 息 技 术基于科技政务数据开放共享的数据分类分级方法研究王欣宇 曹芙 李宇博 滕飞(天津市科学技术信息研究所 天津 300074)摘要:实现科技政务数据开放共享,对发挥科技数据资源规模优势,提升数据资源利用率具有十分重要的意义,需建立数据分类分级标准是实现科技政务数据开放共享的基础工作。基于科技政务数据开放共享,本文分析了科技政务数据资源的特点,研究了数据分类分级方

2、法,提出科技政务数据分类分级框架,从数据敏感性角度进行分级并给出数据安全防护建议。关键词:科技政务数据 数据分类 数据分级 数据开放共享中图分类号:D63文献标识码:A文章编号:1674-098X(2022)10(c)-0117-04Study on Data Classification and Grading Method Based on Opening and Sharing of Scientific and Technological Government DataWANG Xinyu CAO Fu LI Yubo TENG Fei(Tianjin Institute of Sci

3、entific and Technical Information,Tianjin,300074 China)Abstract:Opening and sharing of scientific and technological government data is great significance to giving full play to the scale advantage of scientific and technological data resources and improving the utilization rate of data resources.The

4、 establishment of classification and grading standards is a basic work for the opening and sharing of scientific and technological government data.In this paper,based on the opening and sharing of scientific and technological government data,the characteristics of scientific and technological govern

5、ment data resources are analyzed,the data classification and grading methods are studied,a classification and grading framework of scientific and technological government data is proposed,data are graded from the perspective of sensitivity and data security protection suggestions are given.Key Words

6、:Scientific and technological government data;Data classification;Data grading;Data opening and sharing随着“互联网+政务服务”逐步落实,科技政务部门已逐步实现网络信息化管理,各类科技政务信息平台迅速发展并形成海量大数据资源。实现科技政务信息平台与其他信息平台间的数据开放共享,对发挥科技大数据资源规模优势,提升数据资源利用率具有十分重要的意义。1目前,各信息平台间存储的数据内容差异很大,分类方法不尽相同,导致很难跨平台建立统一的信息共享标准。同时,各类信息平台采用的数据安全标准不同,数据安全等

7、级划分不一致,一些平台中还存有个人信息、商业秘密、涉密信息等不适合公开或共享的数据信息,不能直接进行数据开放共享。2因此,建立一套完整的数据分类分级标准是实现跨平台数据开放共享的基础工作。1 科技政务数据资源分类分级1.1 科技政务数据资源科技政务数据资源是指科技政务部门通过科技政DOI:10.16660/ki.1674-098X.2209-5640-6090基金项目:天津市科技计划智库项目(项目编号:21ZLZKZF00220)。作者简介:王欣宇(1991),男,硕士,工程师,研究方向为科技项目管理、数据分析。117科技创新导报Science and Technology Innovatio

8、n Herald2022 NO.30 科技创新导报 Science and Technology Innovation Herald智 能 智 造 与 信 息 技 术务信息平台开展科技管理工作过程中产生的数据资源。科技政务数据资源储存在科技政务信息平台下设的各业务系统数据库中,包括科技计划项目、科技奖励、科技成果推广、高企业认定、创新创业等业务系统数据库。业务系统数据库存储的数据依据工作内容的不同,侧重点不同。科技项目管理信息系统侧重于科技计划项目的执行管理,系统涵盖自然科学基金、科技重大项目、重点研发计划、创新平台计划等计划项目体系。运行过程中系统产生了项目申请书、项目合同书、年度检查报告、

9、结项报告书、企事业单位信息、科研院所信息、用户个人信息、评审专家信息、诚信记录等各类科技政务数据。科技奖励管理信息系涵盖科技奖励提名、材料审查、专家评审、授奖、在线公示等工作内容。科技奖励系统数据库包括用户信息、科技奖提名书、评审专家信息、评审结果、授奖名单等数据。科技成果推广系统征集各类科技项目最新成果面向社会推广。成果信息数据库包括科技项目执行完成产出的研究报告、学术论文、专著、专利、标准等成果数据信息。创新创业系统服务于人才创新创业,系统侧重于对企业发展能力的考核。创新创业系统数据库包括创新型企业和人才的认定、考核、评估等数据,还包括孵化器、创业中心等创新载体的评估、备案、绩效考核等数据

10、。1.2 数据分类分级的重要意义2021年9月1日,中华人民共和国数据安全法正式施行,该法律从国家层面对数据的保护与利用进行了宏观层面的总体布局和战略规划,为数据开放共享提供指引。3数据安全法 第二十一条规定:“国家建立数据分类分级保护制度,对数据实行分类分级保护。”这说明在法律层面数据分类分级保护制度已得到充分重视,数据分类分级已成为政府开展数据治理工作中必不可少的环节。政府部门纷纷推出举措,促进数据分类分级共享利用。北京、天津、上海等地推出了政府数据资源开放共享网络平台,整合本地区政务大数据资源,在政府部门间进行数据共享,并面向全社会开放部分数据。天津市出台 天津市数据安全管理办法 天津市

11、政务信息资源分类分级指南 等政策,规范了公共数据资源开放途径,并对解决数据分类分级共享问题提出了明确的工作要求。1.3 数据分类分级现状及问题各地政策均明确了分类分级在数据开放共享中的重要性,但采取的分级分类政策差异较大 4,对于数据分类概念、具体维度也不统一,数据分级标准不一致。目前科技政务数据开放共享遇到的主要问题有如下几点。(1)科技政务数据资源分散,各类数据资源分类方法不一。平台层面的数据开放共享需要从各业务系统调取数据。(2)数据开放共享条件和开放共享方式不明确,缺乏统一的数据分类分级框架进行支持。(3)开放共享过程采用的分级标准,安防策略还不明确。数据的可用性、完整性及保密性需要进

12、一步提升。2 科技政务数据分类方法开展科技政务数据分类应充分考虑数据资源的系统性、唯一性、实用性、扩展性和兼容性原则。5科技政务数据可从业务主题、技术领域、管理职能等不同角度进行分类。从业务主题角度对科技政务数据进行分类,对数据内容进行定性分析,按照数据内容首先选择业务主题词对业务进行概括作为一级分类,再根据目标主题选二级主题词。从技术领域角度对科技政务数据分类,按照计划体系中的计划类别、项目类别、技术领域、所属学科进行分类。对于科技计划项目数据,已有完整的计划体系支撑,项目有明确的专业领域划分。从业务管理逻辑角度对科技政务数据分类5,可按照政府部门、行政区划、政务事项等多角度开展分类。例如,

13、将科技政务数据按照信用服务、卫生健康、交通运输等进行分类。在科技政务信息平台内部,各业务系统间的数据共享可采用技术领域角度、业务管理逻辑角度的分类方法。科技政务信息平台对外开放共享中,应充分考虑科技政务数据涉及的范围广、种类多、体量大的特点,并考虑平台间数据分类标准的兼容性。本文从业务主题角度对科技政务数据进行分类。3 科技政务数据分级方法数据分级主要是从数据安全性、隐私保护和安全合规性角度出发对数据特征进行考量,也可以认为数据分级是在数据安全维度的数据分类。数据分级应遵循安全属性原则、结果导向原则、综合判定原则、弃低取高原则6,常用的数据分级方法如下。按照数据敏感性分级,主要考量数据开放共享

14、后在社会层面可能造成的不利影响,包括受影响的对象、影响范围、影响程度。按照数据的重要性进行分级,主要考量数据对于国家、法人和公民个人等主体的重要程度,数据一旦遭到破坏、泄露后对于主体的损害。如表1所示,科技政务数据分级同时参考数据敏感性与重要性分级方法,根据数据资源受到威胁时受危害的主体,以及对相应主体造成的危害范围和程度分为4级:1级数据具有公共传播属性,可对外公开发布、转发传播,但也需考虑公开的数据量及类别,避免118科技创新导报Science and Technology Innovation Herald科技创新导报 Science and Technology Innovation

15、Herald2022 NO.30 智 能 智 造 与 信 息 技 术由于类别较多或者数量过大被用于关联分析;2级数据通常在组织内部、关联方共享和使用,相关方授权后可向组织外部共享;3级数据仅能由授权的内部机构或人员访问,如果要将数据共享到外部,需要满足相关条件并获得相关方的授权;4级数据按照批准的授权列表严格管理,仅能在受控范围内经过严格审批、评估后才可共享或传播。科技政务数据资源开放面向的对象是社会上的公民、法人和其他组织,开放属性分为无条件开放、有条件开放、不予开放3种。在共享开放层面,科技政务数据资源共享面向的对象是国家、省、市地域范围内的政务部门,共享属性分为无条件共享、有条件共享和不

16、予共享3种。科技政务管理部门根据数据的安全级别和开放属性确定具体的开放共享条件,条件包括注册用户、实名认证、申请权限等。4 科技政务数据分类分级框架设计科技政务信息平台产生、汇聚、关联形成了涵盖主体、资源、条件、要素等在内的科技活动信息数据库。应用大数据处理方法,从科技政务信息平台各业务系统数据库中提取出科技政务数据,再经过数据清洗、数据分类和数据编码导入科技政务数据资源池,再对各分类的科技政务数据分别进行分级,根据数据分级和开放属性确定具体的数据开放共享条件。科技政务数据分类分级框架如图1所示。4.1 科技政务数据提取从各业务系统数据库中提取出科技计划项目、科研机构、科技人员、评审专家、科技

17、人才、科技企业、科研产出、科技成果、科技奖励、平台载体、科技政策等数据资源。数据清洗过程中,首先进行数据去重,例如,科技项目与创新创业等数据库中均记录了同一家企业信息,将企业信息数据逐条对比,如果数据内容相同则只保留一条数据。其次,进行信息补全,如部分信息缺失,在几个数据库中进行数据交叉对比,将缺失数据补全。数据加工是对数据进行整合标准化的过程,便于后续的数据分类和建立科技政务数据资源池。4.2 科技政务数据分类将科技政务数据按来源、内容、用途进行重新定义分析、梳理划分,并依次设立“域集组表”四层树形分类框架。(1)“域”用来描述客观实体的类别,从业务主题角度将科技政务数据资源分为科技项目、创

18、新主体、创新载体、科技人员、科技成果、认定补贴6个数据域。(2)“集”用来描述不同客观实体,如科技成果域中包括专利、软著、文献等,科技主体域中包括企业、事业、机关等集。(3)“组”是一类相似业务属性的集合,如企业集中包括工商信息、经营信息、创新活动信息等组。(4)“表”用来描述业务属性,如工商组中包括注册信息表、收入信息表、税务信息表等。4.3 科技政务数据编码完成分类后,对数据逐条编码建立科技政务数据目录体系,对科技政务数据资源实施有效管理。每一条科技政务数据都被赋予一个唯一不变的标识代码。参照 政务信息资源目录编制指南 中关于政务信息资图1科技政务数据分类分级框架图表1科技政务数据开放共享

19、分级安全级别1级2级3级4级开放属性无条件开放有条件开放有条件开放不开放开放条件-实名认证、依申请实名认证、依申请-共享属性无条件共享无条件共享有条件共享不共享共享条件-需申请-119科技创新导报Science and Technology Innovation Herald2022 NO.30 科技创新导报 Science and Technology Innovation Herald智 能 智 造 与 信 息 技 术源编码结构的规定,科技政务数据编码结构由前段码、后段码组成。前段码由标准数据域、标准数据集、标准数据组、标准数据表组成,作为科技政务数据的分类码,子集编码前缀以继承的方式获得

20、,后段码为科技政务数据的顺序码。科技政务数据编码长度共10位。前段码8位,其中“域集组表”分别对应2位,后段码2位。即“域”的编码为2位,“集”的编码为4位,“组”的编码为6位,“表”的编码为8位,字段的编码为10位。以“创新主体”为例,“创新主体”数据域编码为“03”,“创新主体”数据集编码为0301,“工商维度信息”数据组编码为030101,“企业工商信息”数据表编码为03010101,“企业名称”数据字段编码为0301010127。4.4 科技政务数据分级科技政务数据经过分类编码后整合形成科技政务数据资源池,在开放共享前需要从数据域层面开展数据分级。结合六类科技政务数据的特点,主要考量数

21、据受到危害时造成的影响程度和影响范围大小,将数据分为4个等级。其中,科技项目、科技成果部分核心数据如发生数据泄露会造成严重影响,应设定较高的安全分级,仅在受控范围内使用,不予开放共享。科技人员、创新主题、创新载体大部分信息由科研人员、单位自行申报,也设定较高的安全等级。认定补贴类信息均通过网上申报并且已在网上公示,考虑到数据体量和影响范围只将部分数据划分3级进行有条件共享(见表2)。4.5 数据安全分级防护建议(1)根据数据分级结果,完善科技政务数据开放共享的管理授权机制。分级为有条件开放共享的数据采用实名认证、开放共享申请审批流、开放共享白名单等方式进行数据开放共享授权,并记录数据开放共享日

22、志保障数据在各节点间流动的过程记录清晰可追溯。(2)引入第三方数据安全审计,对数据安全分级和数据开放共享使用情况进行评估。增强科技政务信息平台与其他数据开放共享平台间横向对比,及时发现并调整数据安全分级,调整数据开放共享条件。(3)加强大数据分析、人工智能等新技术的应用,提升数据提取、分类、分级由计算机自动化执行程度。减少数据开放贡献过程的人为主观判断,提升数据开放共享框架的整体运行效率与安全程度。5 结语本文对科技政务数据开放共享中的数据分类分级方法进行了研究,根据科技政务数据特点提出科技政务数据分类分级框架并给出数据分级防护建议。本文提出的数据分类分级方法为科技政务大数据分析汇集与安全利用

23、提供了理论参考,为科技政务精准治理和科学决策提供支撑辅助,为实现科技政务数据多路汇集、规范定级、高效治理及共享应用提供安全保障。参考文献1 邵玉昆.科技数据资源的开放共享机制研究J.科技管理研究,2019,39(13):177-181.2 顾荣杰,吴治平,石焕.基于TFR模型的公安云平台数据分级分类安全访问控制模型研究J.计算机科学,2020,47(S1):400-403.3 陈兴跃.数据分级分类正式入法具有重大实践指导意义J.信息安全研究,2020,6(10):949-952.4 赵润娣.我国政府数据开放分类分级研究:基于开放政府数据平台教育类数据的调查J.现代情报,2021,41(4):9

24、0-100.5 刘召栋,周亿城.科技大数据资源及分类分级研究J.科技与创新,2021(18):123-126.6 高磊,赵章界,林野丽,等.基于 数据安全法 的数据分类分级方法研究J.信息安全研究,2021,7(10):933-940.表2科技政务数据6个数据域开放共享分级影响程度无危害不利影响损害严重损害影响范围较小大范围较小大范围较小大范围较小大范围科技项目开放共享分级1级1级2级3级3级4级4级4级科技成果1级1级2级2级3级3级4级4级科技人员1级1级2级2级2级3级3级4级创新主体1级1级1级2级2级2级3级4级创新载体1级1级1级1级2级2级3级4级认定补贴1级1级1级1级1级2级2级3级120

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服