收藏 分销(赏)

DB32∕T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf

上传人:din****188 文档编号:66967 上传时间:2022-04-26 格式:PDF 页数:19 大小:277.06KB
下载 相关 举报
DB32∕T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第1页
第1页 / 共19页
DB32∕T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第2页
第2页 / 共19页
DB32∕T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第3页
第3页 / 共19页
DB32∕T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第4页
第4页 / 共19页
DB32∕T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第5页
第5页 / 共19页
点击查看更多>>
资源描述

1、ICS 35.020 CCS L72 DB32 江苏省地方标准 DB 32/T 4040.12021 政务大数据 数据元规范 第 1 部分:总则 Big Data of AdministrativeSpecification for Data Elements Part 1:General 2021- 05- 14 发布 2021- 06- 14 实施江苏省市场监督管理局 发 布 DB32/T 4040.1- 2021 I 目 次 前 言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 数据元和代码集的表示规范 . 2 4.1 数据元的属性概述 . 2 4.

2、2 数据元属性的描述方法 . 3 4.3 数据元标识类属性 . 4 4.4 数据元定义类属性 . 6 4.5 数据元关系类属性 . 6 4.6 数据元表示类属性 . 7 4.7 数据元管理类属性 . 10 4.8 数据元附加类属性 . 11 4.9 代码集标识符 . 12 5 数据元的设计方法 . 12 5.1 数据元和数据元属性的提取 . 12 5.2 数据元的分类规则 . 12 5.3 数据元的命名规则 . 12 6 数据元的维护和扩展方法 . 13 6.1 数据元维护策略 . 13 6.2 新增数据元 . 13 6.3 变更数据元 . 14 6.4 废止数据元 . 14 7 数据元的使用

3、方法 . 14 参考文献 . 16 DB32/T 4040.1- 2021 II 前 言 本文件按照 GB/T 1.12020标准化工作导则 第 1 部分:标准化文件的结构和起草规则的规定起草。 DB32/T 4040政务大数据 数据元规范分为 7 个部分: 第 1 部分:总则; 第 2 部分:公共数据元; 第 3 部分:综合人口数据元; 第 4 部分:综合法人数据元; 第 5 部分:社会信用数据元; 第 6 部分:电子证照数据元; 第 7 部分:自然资源和空间地理数据元。 本文件为政务大数据 数据元规范的第 1 部分。 本文件由江苏省大数据管理中心提出。 本文件由江苏省政务服务管理办公室归口

4、。 本文件起草单位:江苏省政务服务管理办公室、江苏省大数据管理中心。 本文件主要起草人:赵明、陈俊、宋裕官、何正庆、王旭、徐建荣、刘瑛、韩骉、邱玉婷、杨坤、尤慧、朱小燕、朱珠、姚丹、刘伟、王子文、刘晓红、纪雅莉、张献彬、张永丽、张媛媛、张树楠。DB32/T 4040.1- 2021 1 政务大数据 数据元规范 第 1 部分:总则 1 范围 本文件规定了政务数据元(以下简称数据元)的概念和组成、数据元和代码集的表示规范、数据元的设计方法、数据元的维护和扩展方法、数据元的使用方法。 本文件适用于政务数据元的编制、使用和扩展。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不

5、可少的条款。 其中, 注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 18391.12009 信息技术 元数据注册系统(MDR) 第一部分:框架 GB/T 19488.12004 电子政务数据元 第 1 部分:设计和管理规范 GB/T 352952017 信息技术 大数据 术语 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据 data 信息的可再解释的形式化表示,以适应于通信、解释或处理。 注:数据可以由人工或自动的方式加工、处理。 来源:GB/T 18391.12009,3.2.6 3.2 大数据 bi

6、g data 具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。 注:国际上,大数据的 4 个特征普遍不加修饰地直接用 volume、variety、velocity 和 variability 予以表述,并分别赋予了它们在大数据语境下的定义: a) 体量 volume:构成大数据的数据集的规模; b) 多样性 variety:数据可能来自多个数据仓库、数据领域或多种数据类型; c) 速度 velocity:单位时间的数据流量; d) 多变性 variability:大数据其他特征,即体量、速度和多样性等特征都处于多变状态。 来源:GB/T

7、 352952017,2.1.1 3.3 数据元 data element 由一组属性规定其定义、标识、表示和允许值的数据单元。 注:数据元在特定的语义环境中被认为是不可再分的最小数据单元。数据元一般来说由对象类、特性和表示三部分组成: DB32/T 4040.1- 2021 2 a) 对象类:思想、概念或真实世界中的事物的集合,它们具有清晰的边界和含义,其特征和行为遵循同样的规则。对象类是人们希望研究、搜集和存储它们的相关数据的事物; 示例 1:汽车、人、房屋、订单等。 b) 特性:对象类中的所有成员共同具有的有别于其他的、显著的特征。特性是用来区分和描述对象的手段; 示例 2:颜色、性别、

8、年龄、收入、地址等。 c) 表示:描述了数据被表达的方式,表示与数据元的值域关系密切。一个数据元的值域指数据元的所有允许值的集合。 示例 3:对于“个人所得税金额”这个数据元,它的值域可以是一系列非负整数(带有货币单位),这是一种非枚举型的值域,而“个人所得税比率”对收入进行分段划分,并给每一段赋予一个比率,它的值域就是这些比率的集合,此时称它的值域为枚举型值域。 来源:GB/T 18391.12009,3.3.8,有修改 3.4 元数据 metadata 定义和描述其他数据的数据。 来源:GB/T 18391.12009,3.2.16 3.5 属性 attribute 某个对象或实体的一种特

9、性。 来源:GB/T 18391.12009,3.1.1 3.6 值域 value domain 允许值的集合。 来源:GB/T 18391.12009,3.3.38 3.7 注册 registration 一个管理项与其管理部门的关系。 来源:GB/T 18391.12009,3.3.31 3.8 政务部门 administrative organization 政府部门及法律法规授权具有行政职能的事业单位和社会组织。 3.9 管理部门 responsible organization 标准化行政主管部门授权对政务数据元实施注册、维护和管理功能的组织。 3.10 应用部门 applicati

10、ons organization 因履行职责需要使用其他政务部门(3.8)的政务信息资源和为其他政务部门(3.8)提供政务信息资源的政务部门(3.8)。 4 数据元和代码集的表示规范 4.1 数据元的属性概述 数据元的表示规范是通过对其一系列属性的描述来实现的,这些属性即是数据元的元数据。表 1给出了数据元的六大类属性。 DB32/T 4040.1- 2021 3 表 1 数据元的六大类属性 属性类别 属性名称 说明 属性类别 属性名称 说明 标识类属性 内部标识符 标识类属性是用于标识数据元的一类属性。 中文名称 中文全拼 中文首拼 英文名称 版本 同义名称 定义类属性 定义 定义类属性是描

11、述数据元语义方面的一类属性。 对象类词 特性词 关系类属性 分类方案 关系类属性是描述数据元之间相互关系的一类属性。 分类方案值 关系 表示类属性 表示词 表示类属性是描述数据元表示方面的一类属性。 数据类型 数据格式 值域 计量单位 管理类属性 状态 管理类属性是描述数据元管理与控制方面的属性。 来源部门 管理部门 批准日期 附加类属性 备注 附加类属性是描述上述属性以外的其他属性。 4.2 数据元属性的描述方法 下面的描述符是对数据元属性的描述: a) 名称 赋予数据元属性的标记,名称是唯一的,名称以字符型表示。 b) 定义 属性的描述,可使一种属性与其他属性清晰地区别开来,定义以字符型表

12、示。 c) 约束 显示一个属性是始终还是有时出现的描述符, 该描述符有必选和可选两个取值, 前者表示该属性必须出现,后者表示该属性是否出现可选。 d) 出现次数 显示一个属性出现多少次的描述符,该描述符有以下四种情况:01(表示不出现或出现 1 次),0n(表示不出现或出现多次),11(表示出现且仅出现 1 次),1n(表示出现 1 次或多次)。 e) 类型 描述属性的所有取值的类型。 示例:字符、数值、日期、时间、日期时间和二进制。 f) 规则 DB32/T 4040.1- 2021 4 数据元属性的命名和分配规则。 g) 备注 与属性应用有关的注释。 4.3 数据元标识类属性 4.3.1

13、名称:内部标识符 定义:在一个管理部门内由管理部门自行分配的,与语言无关的数据元的唯一标识符。 约束:必选。 出现次数:11。 类型:字符型。 规则: 内部标识符由 14 位阿拉伯数字分4个部分组成,规则如下: a) 第一部分为信息资源分类码, 用从 01 开始递增的两位阿拉伯数字表示,分为公共、综合人口、综合法人、社会信用、电子证照、自然资源和空间地理 6 大类,表 2 给出了信息资源分类码; 表 2 信息资源分类码 序号 信息资源分类 代码 序号 信息资源分类 代码 1 公共 01 2 综合人口 02 3 综合法人 03 4 社会信用 04 5 电子证照 05 6 自然资源和空间地理 06

14、 b) 第二部分为政务信息资源数据元的一级分类,用从 01 开始递增的 2 位阿拉伯数字表示; c) 第三部分为政务信息资源数据元的二级分类,用从 00001 开始递增的 5 位阿拉伯数字表示; d) 第四部分为二级分类下数据元的顺序码,用从 00001 开始递增的 5 位阿拉伯数字表示。图 1 给出了内部标识符结构的表示方式; 图 1 内部标识符表示方式 e) 内部标识符一旦赋予,将不被复用。 备注:无。 4.3.2 名称:中文名称 定义:赋予数据元的单个或多个中文字词的指称。 DB32/T 4040.1- 2021 5 约束:必选。 出现次数:11。 类型:字符型。 规则: a) 在一定语

15、境下数据元的名称应唯一; 中文名称由一个对象类词、一个特性词和一个表示词组成,其顺序为:中文名称对象类词特性词表示词; b) 中文名称中应只有一个对象类词、特性词和表示词; c) 当表示词与特性词有重复或部分重复时,可将名称中冗余词省略; d) 中文名称尽量与权威名称保持一致。 备注:无。 4.3.3 名称:中文全拼 定义:数据元中文名称的汉语拼音。 约束:必选。 出现次数:11。 类型:字符型。 规则:数据元的中文全拼是用“- ”连接中文名称中的每一个汉字的拼音,全部用小写。 备注:无。 4.3.4 名称:中文首拼 定义:数据元中文名称的汉语拼音的首字母。 约束:必选。 出现次数:11。 类

16、型:字符型。 规则:中文首拼全部使用大写字母。 备注:无。 4.3.5 名称:英文名称 定义:赋予数据元的单个或多个英文字词的指称。 约束:可选。 出现次数:01。 类型:字符型。 规则:英文名称优先采用权威来源。 备注:无。 4.3.6 名称:版本 定义: 用于本文件在正式发布后和下次修订发布期间, 数据元应用部门和管理部门内部版本管理的标识。 约束:可选。 出现次数:01。 类型:字符型。 规则: a) 版本是由阿拉伯数字字符和小数点字符组成的字符型,本文件实施后,版本定为 1.0。 DB32/T 4040.1- 2021 6 b) 版本号变更的原则为: 1) 数据元的必选属性发生变化时,

17、 无论非必选属性是否变化, 则小数点字符前的数字字符加1,小数点字符后的数字归 0; 2) 数据元的必选属性不变而非必选属性发生变化时, 则小数点字符前的数字字符不变, 小数点字符后的数字加 1。 示例:某数据元的版本号为 1.0,当数据元第一次修订时,其必选属性发生变化而非必选属性不变,则该数据元的版本为 2.0; 当该数据元第二次修订时, 其必选属性不变而非必选属性发生变化, 则该数据元的版本为 2.1;当数据元第三次修订时,其必选属性和非必选属性同时发生变化,则该数据元的版本为 3.0。 备注:无。 4.3.7 名称:同义名称 定义:一个数据元在不同应用环境下的不同称谓。 约束:必选。

18、出现次数:0n。 类型:字符型。 规则:无。 备注:一个数据元可以有多个同义名称。 4.4 数据元定义类属性 4.4.1 名称:定义 定义:是用描述性的短语或句子对一个数据元所作的解释。 约束:必选。 出现次数:11。 类型:字符型。 规则:无。 备注:无。 4.4.2 名称:对象类词 定义:数据元名称成分之一,表达了该数据元所属事物或概念的集合。 约束:可选。 出现次数:01。 类型:字符型。 规则:无。 备注:标识出数据元的对象类词,有助于实现对数据元的规范化命名、分析、类比和查询等功能。 4.4.3 名称:特性词 定义:用以表达数据元所属的对象类的某个显著的、有区别的特征。 约束:可选。

19、 出现次数:01。 类型:字符型。 规则:无。 备注:标识出数据元的特性词有助于对数据元的规范化命名、分析、类比和查询。 4.5 数据元关系类属性 DB32/T 4040.1- 2021 7 4.5.1 名称:分类方案 定义: 根据数据元的来源、 组成、 结构、 应用、 功能等共同特性, 将数据元排列或划分成组的模式。 约束:可选。 出现次数:0n。 类型:字符型。 规则:本文件中的数据元的“分类方案”均遵照 4.3.1 给出的分类方案。 备注:数据元可使用多种分类方案进行描述,以便于使用者从不同的角度进行查询和使用。每种分类方案有一个标识符,不同的标识符代表不同的分类方案;数据元的分类原则和

20、方法见 GB/T 7027。 4.5.2 名称:分类方案值 定义:某个数据元在一个分类方案中所处的位置,用该数据元在此分类方案中的分类代码表示。 约束:可选。 出现次数:0n。 类型:字符型。 规则:本文件中的数据元的“分类方案值”均遵照 4.3.1 给出的分类方案值。 备注:分类方案和分类方案值之间存在一一对应关系。 4.5.3 名称:关系 定义:关系用以描述当前数据元与其他相关数据元之间的关系。 约束:必选。 出现次数:0n。 类型:字符型。 规则:无。 备注:表 3 给出了数据元之间基本关系的数据格式,为更加通俗准确表示数据元的基本关系,其关系数据格式采用中文描述和表 3 中的关系表示符

21、共同表示。 表 3 数据元基本关系的数据格式 关系 关系表示符关系 关系表示符 关系描述 示例 关系描述 示例 派生关系 Derive- from 描述了数据元之间的继承关系,一个较为专用的数据元是由一个较为通用的数据元加上某些限定词派生而来。 “Derive- from B” (B 是数据元的标识符,下同) ,表明当前数据元由数据元 B 派生而来。数据元“参保人姓名”派生自数据元“姓名” 。 组成关系 Compose- of 描述了整体和部分的关系,一个数据元由另外若干个数据元组成。 “Compose- of B,C,D” ,表示当前数据元是由数据元 B,C,D 共同组成。数据元“籍贯区划内

22、详细地址”由数据元“籍贯区划”和数据元“详细地址”组成。 替代关系 Replace- of 描述了数据元之间的替代关系。 “Replace- of B” 表明当前数据元替代了数据元 B。数据元“学历”替代了数据元“文化水平” 。 连用关系 Link- with 描述了一个数据元与另外若干数据元一起使用的情况。 “Link- with B,C,D” ,表明当前数据元需要和数据元 B,C,D 一起使用。数据元“护照号码”与数据元“护照类型”连用。 4.6 数据元表示类属性 4.6.1 名称:表示词 DB32/T 4040.1- 2021 8 定义:表示词用于描述数据元值域的表示形式,表示词是数据元

23、名称的组成成分之一。 约束:可选。 出现次数:01。 类型:字符型。 规则:无。 备注:标识出数据元的表示词有助于实现数据元的规范化命名、分析、类比和查询。国际范围内认可的表示词见表 4。 表 4 国际范围内认可的表示词 表示词 含义 表示词 含义 金额 货币单位的数量,通常与货币类型有关。 日期 特定的年月日,格式参照 GB/T 7408。 日期时间 特定的年月日中的特定时间点,格式参照 GB/T 7408。 代码 表示一组值中的一个值的字符型(字母、数字、符号) 。 描述 表示一个人、客体、地点、事件或概念一系列句子,即可用于定义(通常用一两个句子) ,也可用于较长文本。在数据元的中文名称

24、中通常使用“说明” 、 “备注” 、 “意见”等词。 名称 表示一个人、客体、地点、事件或概念指定的一个词或短语。该词或短语是该人、客体、地点、事件或概念的称谓。 号码 一个特定的值的数字表示,它通常暗示了顺序或一系列中的一个。 百分比 具有相同计量单位的两个值之间的百分数形式的比率。 量 非货币单位数量,通常与计量单位有关。 比率 一个计量的量或金额与另一个计量的量或金额的比值。 指示符 两个且只有两个表明条件的值,如 on/off、true/false,又称标志。 4.6.2 名称:数据类型 定义:用于表示数据元的符号、字符或其他表示的类型。 约束:必选。 出现次数:11。 类型:字符型。

25、 规则:无。 备注:表 5 包括了数据类型的可能取值列表,但不限于下表中所列。 表 5 数据类型的取值 数据类型 说明 数据类型 说明 字符型(string) 以字符包括字母、数字、汉字和其他字符形式表达的数据元值的类型。 数值型(numeric) 用任意实数表达的数据元值的类型。 年(year) 通过 YYYY 的形式表达的值的类型,符合 GB/T 7408。 年月(month) 通过 YYYY- MM 的形式表达的值的类型,符合 GB/T 7408。 日期型(date) 通过 YYYY- MM- DD 的形式表达的值的类型,符合 GB/T 7408。 日期时间型(datetime) 通过

26、YYYY- MM- DD hh:mm:ss 的形式表达的值的类型,符合 GB/T 7408。 DB32/T 4040.1- 2021 9 表 5 数据类型的取值(续) 数据类型数据类型 说明说明 时间型(time) 通过 hh:mm:ss 的形式表达的值的类型,符合 GB/T 7408。 时间间隔型(time interval) 通过 nYnMnDnTnHnMns 的形式表达的值的类型,符合 GB/T 7408。 布尔型(boolean) 两个且只有两个表明条件的值,如 on/off、true/false。 二进制型(binary) 上述无法表示的其他数据类型,比如图像、音频等。 注:字符型采

27、用 GB 13000 中规定的字符,其中每个汉字用 2 个字节表示,其余每个字符用 1 个字节表示。 4.6.3 名称:数据格式 定义:从业务的角度规定的数据元值的格式需求,包括所允许的最大和/或最小字符长度,数据元值的表示格式等。 约束:必选。 出现次数:11。 类型:字符型。 规则:无。 备注:政务数据元推荐使用的数据格式如表 6,数据格式示例说明见表 7。 表 6 数据格式字符和含义说明 数据格式字符 符号含义 数据格式字符 符号含义 a 英文字符(A- Z,a- z)。 c 包含英文字符、数字字符、中文字符和特殊字符四种字符类型。 n 数字字符(0- 9)。 z 中文字符。 t 除了英

28、文字符、数字字符、中文字符以外的特殊字符。 an 英文字符(A- Z,a- z)和数字字符(0- 9)。 m(m 为自然数) 表示长度为 m 个字符(字符集默认为 GB/T 2312)。 .ul 长度不确定的文本。 .p,q(p,q 均为自然数) 最长 p 个数字字符,小数点后 q 位。 . 从最小长度到最大长度,前面附加最小长度,后面附加最大长度。 ”YYYY“ “MM” “DD” “hh” “mm” “ss” “YYYY”表示年份,“MM”表示月份,“DD”表示日期,“hh”表示小时,“mm”表示分钟,“ss”表示秒,可视实际情况组合使用。 B 布尔型,是/否,on/off,true/fa

29、lse。 BY 二进制,图像、音频、WAN、RM、AVI、MPEG 等二进制流文件格式。 Short 短整数型。 Double 双精度浮点型。 注:在系统建设中遇到数据格式为“.”时建议按最大值使用。 DB32/T 4040.1- 2021 10 表 7 数据格式示例说明 示例 示例说明 示例 示例说明 a3 固定长度为 3 位的英文字符。 n3 固定长度为 3 位的数字字符。 c3 固定长度为 3 位的任意字符。 z3 固定长度为 3 位的中文字符。 an3 固定长度为 3 位的英文数字字符。 a.3 最多为 3 位的英文字符。 n.3 最多为 3 位的数字字符。 c.3 最多为 3 位的任

30、意字符。 an.3 最多为 3 位的英文数字字符。 an3.8 表示最大长度为 8,最小长度为 3 的不定长的字母数字字符。 n.5,2 数值型,小数点前最多为 5 位数字,小数点后保留 2 位数字,总长度最多为 8 位的数字字符。 a.ul 长度不确定的英文字符。 YYYY- MM- DD hh:mm:ss 日期时间的某种表示方式。 4.6.4 名称:值域 定义:值域是根据相应属性中规定的数据类型、数据格式而决定的数据元的允许值的集合。 约束:必选。 出现次数:0n。 类型:字符型。 规则:该集合可通过以下方式给出: a) 通过名称给出,即直接指出值域的名称,比如数据元“两字母国家代码”的值

31、域是 GB/T 2659中的全部两字母代码; b) 通过参考资料给出,比如数据元“产品条码”的值域是已经在物品编码中心注册的所有产品的条形码; c) 通过一一列举的方式给出所有可能的取值以及每一个值对应的实例或含义; d) 通过数据元之间的逻辑关系给出值域范围,比如“结婚日期”的取值范围应大于“出生日期”小于“死亡日期”; e) 通过真实世界的正常逻辑给出,比如“年龄”的取值范围应为 0- 150; f) 无要求。 备注:无。 4.6.5 名称:计量单位 定义:属于数值型的数据元值的计量单位。 约束:必选。 出现次数:01。 类型:字符型。 规则:无。 备注:计量单位的名称应符合 GB/T 1

32、7295国际贸易用计量单位代码中的计量单位名称。 4.7 数据元管理类属性 DB32/T 4040.1- 2021 11 4.7.1 名称:状态 定义:状态指数据元在其注册的全生存期(即生命周期)内所处状态的标示。 约束:可选。 出现次数:01。 类型:字符型。 规则:本文件中的数据元的“状态”为其注册的全部生存期内所处的阶段。 备注:数据元在其注册的全部生存期内包括四种阶段: a) 草案:该数据元的内容处在草案阶段,相关单位和部门可以广泛提出意见和建议; b) 试用:该数据元的内容经过一定的技术程序,可以在一定范围内进行试用,并反馈实验意见; c) 标准:该数据元的所有内容已经成为各方应当遵

33、守的标准; d) 废止:该数据元的内容即将从标准中删去。 4.7.2 名称:来源部门 定义:产生或管理该数据元的机构或所属部门。 约束:必选。 出现次数:1n。 类型:字符型。 规则:无。 备注:无。 4.7.3 名称:管理部门 定义:标准化行政主管部门授权对政务数据元实施注册、维护和管理功能的组织。 约束:必选。 出现次数:11。 类型:字符型。 规则:管理部门应使用全称,本文件中的数据元的“管理部门”均为标准归口单位。 备注:无。 4.7.4 名称:批准日期 定义:批准日期指数据元进入“标准”状态的日期。 约束:必选。 出现次数:11。 类型:字符型。 规则:无。 备注:当数据元进入“标准

34、”阶段时,该属性必选。日期的表示采用 YYYY- MM- DD 的格式。 4.8 数据元附加类属性 名称:备注。 定义:备注用以描述数据元的附加注释。 约束:必选。 出现次数:01。 类型:字符型。 规则:无。 备注:即上述属性未能描述的其他注释。 DB32/T 4040.1- 2021 12 4.9 代码集标识符 代码集标识符由3个部分组成,规则如下: a) 第一部分:用“DM”表示代码集; b) 第二部分:信息资源分类码,用从01开始递增的2位数字表示,表1给出了信息资源分类码; c) 第三部分:顺序码,用从001开始递增的3位数字表示。 图 2 给出了代码集标识符的表示方式。 图 2 代

35、码集标识符表示方式 5 数据元的设计方法 5.1 数据元和数据元属性的提取 5.1.1 数据元的提取 数据元提取应采用面向对象的方法,通过业务功能建模、业务流程建模、信息建模、数据元的提取和数据元的提交等步骤,分析研究各领域的业务流程,建立相应的信息模型,从信息模型中提取其对象类和特性,再结合实际业务需求细化其表示,以构成完整的数据元。详细的提取步骤见 GB/T 19488.12004 中 6.1.1。 5.1.2 数据元属性的提取 对于需新增加的数据元, 数据元提交者需要提交的数据元属性包括中文名称、 英文名称、 中文全拼、中文首拼、同义名称、定义、关系、数据类型、数据格式、值域、计量单位、

36、来源部门和备注等。详细的提取步骤见 GB/T 19488.12004 中 6.1.2。 5.2 数据元的分类规则 数据元常用的分类方法有以下几种: a) 按数据元本身的结构:对象类、特性和表示来划分; b) 按数据元使用的政府职能部门来划分:如教育、海关、公安、工商、税务等; c) 按数据元的应用分类:如基础公共类数据元、日常办公类数据元、人口管理类数据元、法人管理类数据元、资源管理类数据元、信用管理类数据元等; d) 按电子政务服务的主体进行分类:如政府对政府、政府对企业、政府对公民、企业对政府、公民对政府等。 5.3 数据元的命名规则 5.3.1 唯一性规则 DB32/T 4040.1-

37、2021 13 在一定语境下数据元名称应该唯一,名称中一般包括对象类词、特性词、表示词和限定词。 示例:在数据元“资格状态代码”中,“资格”为对象词,“状态”是该数据元的特性词,“代码”是该数据元的表示词。 5.3.2 语义规则 对象词表示数据元所属的事物或概念, 它表示某一语境下一个活动或对象, 它是数据元中占支配地位的部分: a) 数据元名称中应有一个且仅有一个对象词; b) 特性词是表示数据元的对象类的显著的、有区别的特征; c) 数据元名称中应有一个且仅有一个特性词; d) 表示词是数据元名称中描述数据元表示形成的一个成分,它描述了数据元有效值集合的格式; e) 数据元名称中应有一个且

38、仅有一个表示词; f) 当需要描述一个数据元并使其在特定的语境中唯一时, 可以使用限定词对对象类词、 特性词或表示词进行限定,限定词是可选的。 示例:数据元“资格状态代码”和“标准名称”中,“资格”和“标准”是对象词,“状态”和“名称”是特性词。 5.3.3 语法规则 语法规则如下: a) 对象词应处于名称的第一(最左)位置; b) 特性词应处于第二位置; c) 表示词应处于最后位置; d) 限定词可以附加到对象类词、特性词和表示词上,限定词应位于被限定成分的前面,限定词的顺序的不同不能用于区别不同的数据元; e) 当表示词与特定词有重复或部分重复时,可以从名称中将冗余词删除。 示例:数据元“

39、资格状态代码”和“标准名称”中,“代码”是“资格状态代码”的表示词,“名称”是“标准名称”的表示词,由于表示词“名称”与特性词“名称”语义重复,因此删去一个冗余词“名称”。 6 数据元的维护和扩展方法 6.1 数据元维护策略 本文件兼容已经引用的国家和行业标准, 同时定期跟踪国家和行业标准的最新版本。 应用部门结合实际的应用和数据需求引用本文件,并根据需求及时修订相应内容。 6.2 新增数据元 将新获取的数据元与现有数据元进行比对, 若没有对应的数据元, 将新获取的数据元作为新增数据元加入到数据元标准中,新增的方法和要求如下: a) 对于每一个新增加的数据元, 应按照本文件第 4 章给出的属性

40、规范方法和要求, 至少规范其内部标识符、中文名称、中文首拼、定义、数据类型、数据格式、值域(如有)、计量单位(如有)、备注(如有)等属性; b) 对于在原数据元上派生 (具体解释见 4.5.3) 的新增加的数据元, 除内部标识符、 名称、 定义、来源部门外,其他属性应于其原数据元保持一致; c) 对于在原数据元上组成(具体解释见 4.5.3)的新增加的数据元,数据元的各属性应根据情况编制并遵循 6.2 中 a)的要求; d) 发布新增后的数据元标准。 DB32/T 4040.1- 2021 14 6.3 变更数据元 数据元标准宜定期或根据应用的需要对数据元各属性进行变更, 变更的内容、 方法和

41、要求包括但不限于: a) 当新获取的数据元在已有的数据元标准中, 找到与其定义相同的数据元, 但数据元的称谓不同时,将新获取的数据元的中文名称作为与它定义相同的数据元的同义名称加到属性描述中; b) 数据元的名称(包括中文名称和英文名称)、定义、来源部门等属性需定期根据权威的变更做相应的调整; c) 需定期根据业务的变更,对值域为代码表的数据元的值域进行修订或扩充; d) 对可建立代码表的数据元的值域建立代码表, 代替值域为自由文本的内容, 对于新建的代码表,应说明取值代码及其涵义; e) 对现有数据元实施更严格的可选性限制; 示例:增加新的属性限制。 f) 发布变更后的数据元标准。 6.4

42、废止数据元 当数据元发生变更时, 将变更前的数据元定义为废止数据元, 将废止数据元作为历史版本保存到数据元历史库中。 7 数据元的使用方法 政务部门在使用数据元时,有如下两种方式: a) 直接使用 政务部门可以直接使用数据元来开展数据库或信息交换格式的设计。 示例 1:“联系电话”、“公民身份号码”等数据元可以直接使用。 示例 2: 表 8 人口基本信息 列名 中文描述 数据类型(精度范围) 列名 中文描述 数据类型(精度范围) 空/非空 是否主键 说明 空/非空 是否主键 说明 ID 主键 VARCHAR(36) 非空 是 GMSFHM 公民身份号码 VARCHAR2(18) 非空 否 直接

43、引用公共数据元“公民身份号码” XM 姓名 VARCHAR2(100) 非空 否 XB 性别 VARCHAR2(12) 非空 否 LXDH 联系电话 VARCHAR2(50) 非空 否 直接引用公共数据元“联系电话” 注:表中的“公民身份号码”和“联系电话”为直接使用。 b) 派生使用 不同政务部门根据自身的业务特点,对数据元中的对象类词或特性词进行限定,生成新的数据元。 示例 1:对于公共数据元“年” ,财政部门可以将其扩展为“财政年度” ;对于公共数据元“姓名” ,社会保障部门可以将其扩展为“参保人姓名” 。需要注意的是,派生后的数据元与原数据元相比,在定义、数据类型、数据格式、值域等属性

44、上不能出现矛盾的现象。 示例 2: DB32/T 4040.1- 2021 15 表 9 参保人信息 列名 中文描述 数据类型(精度范围)列名 中文描述 数据类型(精度范围) 空/非空 是否主键 说明 空/非空 是否主键 说明 ID 主键 VARCHAR(36) 非空 是 SHBZHM 社会保障号码 VARCHAR2(18) 非空 否 直接引用公共数据元 “社会保障号码” CBRXM 参保人姓名 NVARCHAR2(100) 非空 否 派生自公共数据元“姓名” XB 性别 VARCHAR2(12) 非空 否 MZ 民族 VARCHAR2(10) 非空 否 DB32/T 4040.1- 2021 16 参 考 文 献 1 国务院关于印发促进大数据发展行动纲要(国发201550 号) 2 国务院关于印发政务信息资源共享管理暂行办法(国发201651 号) 3 省政府关于印发江苏省政务信息资源共享管理暂行办法的通知(苏政发2017133 号) 4 GB/T 19488.22008 电子政务数据元 第 2 部分:公共数据元目录 _

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 通信科技 > 数据库/数据算法

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服