收藏 分销(赏)

DB2301∕T 113-2022 公共数据采集规范(哈尔滨市).pdf

上传人:曲**** 文档编号:207505 上传时间:2023-01-11 格式:PDF 页数:16 大小:1.07MB
下载 相关 举报
DB2301∕T 113-2022 公共数据采集规范(哈尔滨市).pdf_第1页
第1页 / 共16页
DB2301∕T 113-2022 公共数据采集规范(哈尔滨市).pdf_第2页
第2页 / 共16页
DB2301∕T 113-2022 公共数据采集规范(哈尔滨市).pdf_第3页
第3页 / 共16页
DB2301∕T 113-2022 公共数据采集规范(哈尔滨市).pdf_第4页
第4页 / 共16页
DB2301∕T 113-2022 公共数据采集规范(哈尔滨市).pdf_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、黑 龙 江 省 哈 尔 滨 市 地 方 标 准DB2301/T 1132022公共数据采集规范Specifications for public data acquisition2022-11-14 发布2022-12-13 实施哈尔滨市市场监督管理局发 布ICS 35.020CCS L 70DB2301DB2301/T 1132022I目次前言.II1范围.12规范性引用文件.13术语和定义.14总体要求.15数据采集准备.26数据采集方案.77数据映射关系.78数据采集方式.79数据质量控制.910绩效评价.9附录 A(规范性)数据协议方申请/变更表.10附录 B(资料性)数据采集绩效考核

2、表.12参考文献.13DB2301/T 1132022II前言本文件按照 GB/T 1.12020标准化工作导则第 1 部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由哈尔滨市大数据中心提出并归口。本文件起草单位:哈尔滨市大数据中心。本文件主要起草人:张文程、刘承启、张茁、顾鸣声、姜荣昌、刘桓、国晓宇、蒋彤影、吴琼、裴伟明、蒋月英、张长龙、杨拓。DB2301/T 11320221公共数据采集规范1范围本文件规定了公共数据采集的术语和定义、总体要求、数据采集准备、数据采集方法、数据映射关系、数据采集方式、数据质量控制、

3、绩效评价。本文件适用于规范哈尔滨市公共数据开放平台的数据采集工作。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 22239-2008信息安全技术信息系统安全等级保护基本要求GB/T 35274信息安全技术大数据服务安全能力要求GB/T 38888数据采集软件的性能及校准方法DB2301/T 91公共数据资源目录工作规范3术语和定义下列术语和定义适用于本文件。3.1公共数据common data国家机关和法律、法规授权的具有管理公共事

4、务职能的组织以及供水、供电、供气、供热、通讯、公共交通等公共服务运营单位(以下统称公共管理和服务机构)在依法履职或者提供公共管理和服务过程中收集、产生的,以一定形式记录、保存的各类数据及其衍生数据。注:包含政务、公益事业单位数据和公用企业数据。3.2公共数据平台common data platform统一规划、统筹建设,用于承载市级大数据业务的平台。3.3数据采集data acquisition将特定原始数据收集进入公共数据平台的过程。3.4数据协议方data protocol party通过公共数据平台提供资源的公共管理和服务机构。4总体要求DB2301/T 113202224.1公共数据平

5、台方应建立统一的采集管理制度,满足公共数据管理总体框架的要求,并配备系统管理员,实行逐级授权管理,实现管理角色的划分。4.2公共数据平台方应制定具体操作流程,按流程进行数据采集,保障公共数据平台能正确执行数据采集任务。4.3公共数据平台方应保证采集数据运行环境的安全,公共数据平台安全等级保护基本要求满足 GB/T22239 三级的规定。4.4公共数据平台方通过对数据协议方的数据及数据接口进行分析,优化数据采集方案,确定数据采集方式。4.5数据协议方应遵守公共数据平台方制定的管理制度和操作流程。4.6数据协议方应梳理其公共数据资源目录,明确公共数据更新频率。4.7数据协议方应配备部门操作员,负责

6、数据采集对接工作,按公共数据平台数据采集流程采集、上传数据。5数据采集准备5.1注册和变更公共管理和服务机构应在公共数据管理平台用户注册信息,并填写附录 A 中表 A.1平台用户申请表,将申请材料提交至公共数据管理部门,由公共数据管理部门按图 1 的流程,对申请表内容进行审核。填写内容完整、清晰的,审核予以通过。若审核未通过,应告知公共管理和服务机构未通过的原因,由公共管理和服务机构修改后重新提交,完成申请后,成为数据协议方,并按照公共数据平台方的要求进行管理与授权。DB2301/T 11320223图 1平台用户注册流程图5.1.1数据协议方如需要变更用户信息,应在公共数据管理平台填写附录

7、A 中表 A.2平台用户变更申请表,将申请材料提交至公共数据管理部门,由公共数据管理部门按图 2 的流程变更用户信息及权限。DB2301/T 11320224图 2平台变更用户流程5.2数据资源目录管理5.2.1数据协议方应分析本单位涉及的公共数据,按照 DB2301/T 91 的规则,编制本单位公共数据资源目录,按图 3 的流程在公共数据平台注册。公共数据平台方对注册的公共数据资源目录进行审核,符合 DB2301/T 91 的要求,审核予以通过。若审核不通过,应告知原因。数据协议方修改后,需重新提交审核。DB2301/T 11320225图 3公共资源目录注册流程注:数据协议方在完成公共数据

8、资源目录申请后,由公共数据平台方对公共数据资源目录对应的数据库表类信息资源、文件类信息资源、接口类信息资源进行审核。5.2.2如发生机构改革或者法定职责调整,数据协议方应在有关法律法规作出修订或行政职能发生变更之日起,按图 4 的流程,对相应的公共数据资源目录名称、信息项、描述等内容进行变更,确保公共数据资源目录与实际情况的一致。公共数据平台方对变更的公共数据资源目录进行审核,符合 DB2301/T91 的要求,审核予以通过。若审核不通过,应告知原因。数据协议方修改后,需重新提交审核。DB2301/T 11320226图 4公共资源目录变更流程注:数据协议方在完成公共数据资源目录变更申请后,应

9、保证数据库表资源随目录变更的生效同步完成变更。5.3数据安全保障5.3.1公共数据平台方应建立公共数据资源安全管理制度,分级管理、按流程申请、按流程修改。确保数据来源的合法性、正当性、可定位溯源性,满足公共数据资源采集审计及监测的要求。5.3.2公共数据平台方应建立数据访问权限管理制度,明确公共数据平台方和数据协议方分级权限安全管理职责分工和工作要求,对数据采集环境、设施和技术采取安全管控措施,数据在整个采集、转化、传输过程中应依据授权使用,不被非法冒充、窃取、篡改、抵赖。5.3.3公共数据平台方应建立公共数据安全监测、安全审计、数字签名、数据加密等技术或手段,对不同数据进行分类并标识.采用安

10、全技术进行安全维护。5.3.4公共数据平台方应建立应急事件响应机制,编制应急预案,开展应急演练,编制应急演练报告,持续优化应急预案等。5.3.5公共数据平台方数据服务安全能力应符合 GB/T 35274 的规定,定期对公共数据采集的安全性进行风险评估,并据此制定相应的风险处理计划,及时排查安全漏洞、加固安全技术。DB2301/T 113202275.3.6公共数据平台方应开展公共数据管理安全培训,编制公共数据安全培训规划,培训公共数据专业知识,开展公共数据安全工作经验交流,宣传公共数据安全知识等。5.3.7公共数据平台方应明确数据采集过程中个人信息和重要数据的知悉范围和安全管控措施。并采取必要

11、的技术手段和管理措施保证数据不被泄露。5.3.8数据协议方应梳理接入应用系统和终端的公共数据,确定接入终端数量、网络带宽和接入地点等信息,制定接入实施方案,明确访问控制、接入认证和审计等安全措施。6数据采集方案6.1采集方案应包括采集内容、采集频率、采集方式等。6.2采集内容由数据协议方填报,分类、分项符合 DB2301/T 91 的规定。6.3公共数据平台应支持增量更新、全量更新、定时更新、事件触发更新和手动更新等方式。6.4公共数据平台提供多种标准协议的服务接入方式,包括但不限于数据库抽取、服务网关、消息队列、文件传输、直报系统、标准协议接口。6.5公共数据采集实时性要求低的数据可采用定时

12、批量采集的方式,实时性要求高的数据应采用实时采集的方式。6.6公共数据量较大、单批量采集可能会造成系统故障的,应使用分批采集。6.7宜使用数据协议方系统的备份库作为采集对象,使用备份库时应保证数据一致性和可用性。对于海量数据,宜支持分批或增量读取,宜采用分布式方式对数据源进行读取。7数据映射关系7.1数据协议方通过数据库表方式向公共数据平台提供数据时,应建立数据协议方数据库表与平台数据库表之间的存储结构映射关系,通过数据库表对接。7.2数据协议方以接口方式向公共数据平台提供数据时,如返回数据为结构化或半结构化的接口类型,应建立接口返回数据结构与目标数据库之间存储结构映射关系,通过接口进行数据采

13、集。7.3数据协议方以接口方式向公共数据平台提供数据时,如返回数据为非结构化的接口类型,可将文件通过接口上传后建立文件映射关系表。8数据采集方式8.1数据采集方式分类数据采集方式包括在线数据采集和离线数据提交。8.2获取公共数据采集权限确定公共数据采集方案,获取公共数据的采集权限,包括但不限于:数据量;数据范围;采集时间;采集区间;数据使用权限。DB2301/T 113202288.3在线数据采集8.3.1在线数据采集符合图 5 的流程。图 5线数据采集流程8.3.2确定数据项间的逻辑关系,通过数据服务接口协议进行数据传输,实现对接采集。8.3.3数据协议方如发生数据变更,可根据业务需要申请增

14、加数据信息项目,由公共数据平台方依申请负责创建数据项。8.3.4公共数据平台方应维护数据采集的业务管理规范,可以查询、查看采集数据信息,但不能新增、删除数据信息。8.3.5公共数据平台方应确认写入数据与读取数据数量一致。判定一致后,按流程将数据入库待治理;发现数据存在差异,联系数据协议方重新获取加载信息,并将修改和原始记录都存储下来,以供校验,获取差异数据应符合 GB/T 38888 的规定。8.4提交离线数据8.4.1离线数据可由表格数据、文件材料、信息扫描录入,通过移动介质提交,保证数据的完整性和准确性。3DB2301/T 113202298.4.2离线数据文件采集应与公共数据平台的数据库

15、表结构一一对应,确定数据分类和格式,实现数据分类入库存储。8.5数据清洗管理8.5.1对原始数据开展数据清洗管理,定义清洗规则,分析、检查和处理数据源存在的质量问题。对定义的清洗方法的正确性和效率进行验证与评估,对不满足清洗要求的清洗方法进行调整和改进。8.5.2数据转换应对数据的标准代码、格式、类型等进行转换。必要时,可建立数据转换规则表。9数据质量控制对采集的原始数据进行清洗、转换、分析等处理,确保数据的完整性、准确性、一致性、可访问性、时效性。完整性:应包含数据规则要求的数据的必要元素;准确性:应真实反映数据所描述的实体;一致性:应保证数据与其他特定上下文中使用的数据无矛盾;时效性:应保

16、证数据发生变化后及时被更新;可访问性:应保证数据在需要时能被安全访问;可追性:应保证数据能够被跟踪和管理。10绩效评价10.1总体要求10.1.1应通过数据的逐年积累,各绩效指标各年度数据的对比分析,建立标准统一、数据准确、普遍认可的绩效指标体系和评分标准。10.1.2绩效评价指标设计应能反映数据协议方提供数据的基本情况。10.1.3绩效评价指标设计支持自动生成数据报表模式。10.1.4可实行指标库动态化管理,应用于数据采集评价。10.1.5绩效评价数据统计方式,宜具备易用性和易见性,实现数据易于展示和调取,操作步骤简洁合理。10.2绩效指标10.2.1按数据协议方注册的数据资源目录内容,分为

17、共性绩效指标和个性绩效指标,见附录 B。10.2.2绩效指标分为三级,包括一级指标、二级指标、三级指标,见附录 B。10.3绩效指标管理指标库的维护是指数据采集绩效指标的入库、调整、退库等操作,应在既定管理规则约束下实施:对共性绩效指标,由平台进行维护;对个性绩效指标,由数据协议方提出申请,填报需要新增、调整或删除的数据采集绩效指标信息,同时提供相关的理由或文件依据,经平台审核,不合格返回数据协议方,合格后进行调整更新。DB2301/T 113202210附录A(规范性)数据协议方申请/变更表A.1平台用户申请表表 A.1 为平台用户申请表。表 A.1平台用户申请表申请单位名称统一社会信用代码

18、单位性质单位经济类型单位所属行业单位隶属关系单位地址单位负责人联系方式单位电子邮箱单位邮编联络人职务及姓名联系方式角色类别所在处室姓名手机号码邮箱部门管理员部门操作员.单位负责人意见:单位负责人签字:(公章)日期:DB2301/T 113202211A.2平台用户变更申请表表 A.2 为平台用户变更申请表。表 A.2平台用户变更申请表申请单位名称统一社会信用代码单位性质单位经济类型单位所属行业单位隶属关系单位地址单位负责人联系方式单位电子邮箱单位邮编变更事项变更理由联络人职务及姓名联系方式类别角色所在处室姓名手机号码邮箱部门管理员部门操作员.单位负责人意见:单位负责人签字:(公章)日期:DB2

19、301/T 113202212AB附录B(资料性)数据采集绩效考核表B.1绩效考核指标分为共性绩效指标和个性绩效指标。共性绩效指标是适用于所有绩效管理对象、常规性工作的绩效指标;个性绩效指标是适用于不同业务主管部门或行业领域、专业性较强的指标,主要根据业务主管部门或行业特点设定。B.2绩效指标分为三级,一级指标为最上级,下级指标从属于上级指标:一级指标为采集数据项;二级指标对应一级指标分为支持自动采集数量指标、人工采集通过指标、时效指标;三级指标由数据协议方申请设置,由平台收录,包括针对性强的绩效指标。B.3公共数据平台方对数据协议方开展数据采集的绩效评价,见表 B.1。表 B.1数据采集绩效

20、考核表一级指标二级指标三级指标分值得分采集数据项支持自动采集数量指标(40 分)超出数据协议方申请自动采集数量40完成自动采集数量达到 90%25完成自动采集数量达到 80%15人工采集通过指标(30 分)占自动采集小于等于 2%30占自动采集小于等于 5%20占自动采集小于等于 10%10时效指标(30 分)实时采集大于等于 80%30实时采集大于等于 60%20实时采集大于等于 40%10总分DB2301/T 113202213参考文献1 国务院办公厅印发政务信息系统整合共享实施方案2 黑龙江省促进大数据发展应用条例3 政务信息资源共享管理暂行办法4 推动“数字龙江”建设加快数字经济高质量

21、发展若干政策措施5 黑龙江省“十四五”数字政府建设规划6 哈尔滨市加快数字经济发展实施方案(20222024 年)7 哈尔滨市公共数据开放管理办法8 哈尔滨市“十四五”数字经济“1+4”发展规划体系9GB/T 39440-2020公共信用信息资源目录编制指南10GB/T 21063.1-2007政务信息资源目录体系第 1 部分:总体框架11GB/T 21063.2-2007政务信息资源目录体系第 2 部分:技术要求12GB/T 21063.3-2007政务信息资源目录体系第 3 部分:核心元数据13GB/T 21063.4-2007政务信息资源目录体系第 4 部分:政务信息资源分类14GB/T 21063.6-2007政务信息资源目录体系第 6 部分:技术管理要求15DB23/T 28392021政务信息资源目录第 1 部分:编码规则16DB23/T 28402021政务信息资源目录第 2 部分:核心元数据17DB23/T 28412021政务信息资源目录第 3 部分:编制指南18DB23/T 28422021政务信息资源数据交换规范19DB23/T 33042022大数据平台数据接入规范

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 通信科技 > 数据库/数据算法

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服