收藏 分销(赏)

WS_T 306—2023卫生健康信息数据集分类与编码规则.pdf

上传人:Fis****915 文档编号:459109 上传时间:2023-10-11 格式:PDF 页数:12 大小:215KB
下载 相关 举报
WS_T 306—2023卫生健康信息数据集分类与编码规则.pdf_第1页
第1页 / 共12页
WS_T 306—2023卫生健康信息数据集分类与编码规则.pdf_第2页
第2页 / 共12页
WS_T 306—2023卫生健康信息数据集分类与编码规则.pdf_第3页
第3页 / 共12页
WS_T 306—2023卫生健康信息数据集分类与编码规则.pdf_第4页
第4页 / 共12页
WS_T 306—2023卫生健康信息数据集分类与编码规则.pdf_第5页
第5页 / 共12页
点击查看更多>>
资源描述

1、ICS 11.020CCSC07中 华 人 民 共 和 国 卫 生 行 业 标 准WS/T 3062023代替 WS/T 306-2009卫生健康信息数据集分类与编码规则Rules for health information dataset classifying and coding2023-08-07 发布2024-02-01 实施中华人民共和国国家卫生健康委员会发布WS/T 3062023I前言本标准为推荐性标准。本标准代替WS/T 3062009 卫生信息数据集分类与编码规则。与WS/T 3062009相比,主要为编辑性修改。本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负

2、责技术审查和技术咨询,由国家卫生健康委统计信息中心负责协调性和格式审查,由国家卫生健康委规划发展与信息化司负责业务管理、法规司负责统筹管理。本标准起草单位:中国人民解放军总医院、国家卫生健康委统计信息中心、中国人民解放军空军军医大学。本标准主要起草人:刘丽华、张黎黎、冯丹、李顺飞、王珊、王霞、胡建平。WS/T 30620231卫生健康信息数据集分类与编码规则1范围本标准规定了卫生健康信息数据集分类与编码需遵循的基本原则、技术方法以及应用规则。本标准适用于卫生健康领域各类卫生健康信息数据集分类与编码方案的制定。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。其中,

3、注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。GB/T 2260中华人民共和国行政区划代码GB/T 2659世界各国和地区名称代码GB/T 7027信息分类和编码的基本原则与方法GB/T 10113分类与编码通用术语GB/T 11714全国组织机构代码编制规则GB/T 13745学科分类与代码GB/T 14396疾病分类与代码3术语和定义GB/T 10113中确立的及下列术语和定义适用于本标准。3.1数据集dataset具有一定主题,可以标识并可以被计算机化处理的数据集合。3.2数据集编码dataset coding在分类的基

4、础上,给数据集赋予的有一定规律性、计算机容易识别与处理的符号。3.3数据集标引dataset indexing指分析数据集的内容属性及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予数据集检索标识的过程。4数据集概述4.1数据集基本概念数据集是具有主题的、可标识的、能被计算机处理的数据集合。a)主题:围绕着某一项特定任务或活动进行数据规划和设计时,对其内容进行的系统归纳和描述。通常数据集主题应具有划分性和层级性,划分性是指主题间可通过不同的命名,将相同属性的主题归并在一起形成相同的类,将不同属性的主题区分开形成不同的类;层级性是指主题可被划分成若干子主题或子子主题。WS/T 3062

5、0232b)可标识:指能通过规范的名称和标识符等对数据集进行标记,以供识别。标识与名称的取值需要通过具体的命名或编码规则来规范。c)能被计算机处理:指可以通过计算机技术(软硬件、网络),对数据集内容进行发布、交换、管理和查询应用。这些数据可以由不同的物理存储格式来实现,按照数据元的定义与数据类型,在计算机系统中以数值、日期、字符、图像等不同的类型表达。d)数据集合:指由按照数据元所形成的若干数据记录所构成的集合。例如,病案首页数据集由主索引、入出转、诊疗、护理、手术、费用等不同数据组成。4.2数据集基本属性每个数据集所具有的属性都包括通用属性和特有属性两部分。数据集的通用属性包括数据集主题、标

6、识、实体和数据项,又称“基本属性”。数据集特有属性包括类别、区域、专业、学科、建立时间、涉及的疾病等。4.3卫生健康信息数据集卫生健康信息数据集是在卫生健康领域,为满足政府卫生决策、业务处理、科学研究、信息发布与绩效评价等需求,按照数据集概念设计、归纳、整合的主题信息集合。卫生健康领域的数据集主要可以归纳为三个方面:a)信息发布类统计数据集:如中国卫生健康统计年鉴中卫生机构设置及规模、卫生人员资源的地区分布、卫生经费的筹集及分配等数据集,各类卫生机构的统计月报、年报,以及满足某一专项统计需求通过统计收集、归纳、整理、报告形成的数据集。b)业务系统建设类的基本数据集:包括医疗服务、公共卫生、药品

7、供应、医疗保障、卫生管理等领域为了满足业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合。如:儿童出生登记、食品卫生许可、个人健康档案、住院病人入出转、居民死亡登记报告等基本数据集。c)为满足特定目的收集整理制作的数据集:包括通过调查、观察、监测、检测、试验、实验等方式获取的满足科学研究、业务咨询或卫生服务决策等需求的数据集。如:近年来国家投入建设的国家人口健康科学数据集、卫生服务调查数据集、疾病及危险因素调查等内容的数据集。5数据集分类5.1分类基本原则a)系统性原则:综合考虑数据集主题一致性,按其内在联系进行系统化排

8、列,确保类目唯一、结构合理、层次清晰,减少冗余。b)实用性原则:满足数据集分类编目的简便性、可操作和通用性需求和数据集查询的一致性理解。c)可扩展性原则:保证分类体系框架适应数据集不断丰富的内容和日益增长的种类与数量。d)兼顾科学性原则:自顶向下,优先选择最能代表卫生健康信息数据集主题的语言、词条定义类目名称,编制受控分类体系表。e)稳定性原则:使用稳定的因素作为分类依据,同时提高分类体系的可延展性或兼容性,促进稳定性。5.2分类方法5.2.1主题优先法卫生健康信息数据集分类体系首先依据主题构建主分类框架,分类框架各层级类目可表示为一级、二级、三级类目等,见表 1。WS/T 30620233表

9、 1卫生健康信息数据集主分类框架一级类目二级类目三级类目n 级类目数据集系列一级类目 1二级类目 1三级类目 1n 级类目 1数据集 1数据集 2.n 级类目 2.三级类目 2n 级类目 1.n 级类目 2.三级类目 3n 级类目 1.n 级类目 2.n 级类目 1.n 级类目 2.二级类目 2三级类目 1n 级类目 1.5.2.2多属性复分法卫生健康信息数据集以相同主题构建,同时在若干相同主题数据集中,又根据其个性,如时间、地域、疾病、学科、机构等多属性,构成辅助分类体系,即复分类体系。卫生健康信息数据集复分类见图 1:特有属性1类目1类目2类目3.特有属性3类目1类目2类目3.特有属性2类

10、目1类目2类目3.特有属性n类目1类目2类目3.图 1卫生健康信息数据集-复分类5.2.3组配分类法组配分类法是按照多维度、交叉性方式,将数据集主分类框架与复分类表组合使用,对数据集进行分类的规则。在某个主分类下的卫生健康信息数据集的组配分类示意见图 2:WS/T 30620234时间1949/01/011950/01/011951/01/01.疾病肺癌乙肝鼠疫.地域北京市天津市河北省.类目1类目2类目3.数据集系列数据集1数据集2数据集3.图 2卫生健康信息数据集组配分类5.3类目设置规则5.3.1主分类表类目设置5.3.1.1类目界定规则卫生健康信息数据集分类与编码中的每一个类目都围绕特定

11、的主题,表达一定主题知识的内涵和外延。遵照本分类与编码规则,科学分类体系所列的类目,能够容纳大量卫生健康信息的最小单元-数据集,从而成为管理数据集的工具。a)类目名称与主题对应:类目反映主题内容,一一对应。b)类目名称规范:名称应简洁、规范、通用、无歧义,且确切表达主题内容、范围,必要时应给出类目注释。c)同位类互斥:同位类之间应界限分明,非此即彼。d)数据集存在性:每个类目应确保存在一定数量的卫生健康信息数据集。e)类目均衡:类目均衡展开,允许突出或合并列类。f)层次逐级隶属:类目从总到分的结构须逐级隶属,每层划分应有单一、明确依据,连续展开。5.3.1.2类目层级约束规则卫生健康信息数据集

12、分类体系的展开层次决定着分类导航系统的导航程度,层次越多越深,知识被组织得越细密,用户查找信息耗费的时间和精力就越多。卫生健康信息数据集主分类层次应控制在3级-6级之间。5.3.2复分类表类目设置5.3.2.1类目界定规则类目界定规则如下:a)复分类表的类目根据特有属性分区段设置,每个区段对应数据集的一个特有属性,构成一个复分类的类目。b)复分类的类目间无层级、无关联,无顺序约束,属于分区段的松耦合约束。c)复分类目区段个数可根据实际需要进行扩展。5.3.2.2属性有限性控制复分类表属性宽度的控制应该充分考虑卫生健康信息数据集内容的特有属性进行设置,详细描述、全面覆盖数据集内容信息,多属性组配

13、,增加数据集管理维度、提高数据组织和生产的效率和质量,增强数据集聚类的灵活性、增加检索入口,适应计算机检索的需要。WS/T 30620235卫生健康信息数据集分类中的复分类表可以包括多种属性分类,例如,地区表(国内地区按GB/T2260、国际地区按GB/T 2659)、组织机构代码表按GB/T 11714、疾病分类表按GB/T 14396、学科分类表按GB/T 13745的规定。6数据集编码6.1编码基本原则编码基本规则如下:a)唯一性:在卫生健康信息数据集编码体系中,每一个类目仅有一个代码,一个代码只唯一表示一个主题概念。b)匹配性:代码结构应与分类体系相匹配。c)可扩充性:代码应留有适当的

14、后备容量,以便适应不断扩充的需要。d)简洁性:代码结构应尽量简单,以便减少代码的差错率,便于管理。e)区段性:在卫生健康信息数据集编码体系设置若干区段,每个区段表达不同的类目属性,便于实现不同维度检索。6.2编码方法按GB/T 7027规定的方法。6.3编码设计规则卫生健康信息分类与编码体系设计为两类系统,一类是主分类编码系统,一类是复分类编码系统。给予数据集主分类码和复分类码,进行分段编码标识。6.3.1主分类表编码6.3.1.1码位设计本标准规定主分类框架中每一个类目设定唯一的编码,码位结构对应各级类目分段组合而成,见表2,此示例中,一级类目为1位英文字母,二级、三级等类目分别为2位数字,

15、从01到99,后3位给出数字流水码,从001-999,各层级按从属关系逐级顺序编码。表 2卫生健康信息数据集主分类码位结构码位第 1 位第 2 位第 3 位第 4 位第 5 位第 6 位第 7 位.后 3 位名称一级类目码二级类目码三级类目码四级类目码.流水码类型字母码数字码数字码数字码数字码数字码取值AZ01990199019901990019996.3.1.2编码规则编码规则如下:整体编码是数字字母混合码,同位类目位数、类型一致;各级类目中的“其他”类编码定为“99”。6.3.2复分类表编码6.3.2.1码位设计复分类表编码需依据卫生健康信息数据集的特有属性采用分段设计,其基本内容可以由诸

16、如卫生机构、疾病分类和学科分类等多个区段组成,表述格式为(GB/T 11714).(GB/T 14396).(GB/T 13745)。对扩增的复分属性,其代码按照同一规则设计。WS/T 306202366.3.2.2编码规则编码规则如下:标准优先性原则。复分类表编码须参照其相应特有属性的标准化代码表,各类代码表的采用中,依次优先采用国家、地区、行业标准代码或积极采用适宜的国际标准代码,没有参考标准时可自定义代码。数据集内容不体现某一复分类目属性时,相应编码位须用等位 0 表述。7分类与编码标准文档结构在卫生健康领域层面对卫生健康信息资源进行统筹规划、规范描述和系统关联时,会涉及大量的数据集分类

17、与编码标准的制定工作。为便于起草这类标准,给出了卫生健康领域各专业分类与编码标准文档编写格式与规范,参见本标准附录A。WS/T 30620237附录A(资料性)卫生健康信息数据集分类与编码标准文档A.1 分类与编码标准文档结构卫生健康信息数据集分类与编码标准的内容和层次划分应符合GB/T 1.1的规定。一般来说,它包含以下内容:封面目次前言名称1.范围2.规范性引用文件3.术语和定义4.分类框架5.编码方法6.分类体系与代码表7.分类与编码的应用附录(资料性附录)参考文献A.2 分类与编码标准结构说明A.2.1 封面标准封面上端要注明标准的级别,统一写为:中华人民共和国卫生行业标准;封面中间部

18、分要求写明标准名称的全称及其英文名称;封面的下端则应标明发布日期、实施日期及发布者。需要特别说明的是:标准名称应简短,并应明确地反映卫生健康信息数据集分类与编码标准化对象或标准的主题。卫生健康信息数据集分类与编码标准名称的形式一般为分类、代码或分类与代码。A.2.2 目次卫生健康信息数据集分类与编码标准的目次一般采用二级目次(也可采用三级目次)。若标准的篇幅较少,也可以不要目次。A.2.3 名称标准的名称是识别标准的标志之一,标准名称应简练、主题明确、与其他标准易区分。A.2.4 前言WS/T 30620238卫生健康信息数据集分类与编码标准的前言应阐明本标准参考了哪些标准,最后部分应另起一段

19、,按照如下格式来写:本标准由提出。本标准由归口。本标准的附录是规范性附录(或资料性附录)。本标准主要起草单位:本标准主要起草人:A.2.5 范围卫生健康信息数据集分类与编码标准的范围应简明扼要:本标准规定了的分类代码。本标准适用于。A.2.6 规范性引用文件卫生健康信息数据集分类与编码标准的规范性引用文件的编写格式是固定的:下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。GB/T(标准名称)GB(标准名称)ISO:(标准名称)注:若没有引用文件,注明:本标准无

20、规范性引用文件。(此节为可选)A.2.7 术语和定义卫生健康信息数据集分类与编码标准的术语和定义,应给出为了理解标准中某些术语所必需的定义。在编写时应符合GB/T 1.1中6.3.1的规定。注:若没有术语和定义,注明:本标准无术语和定义。(此节为可选)A.2.8 分类框架卫生健康信息数据集分类与编码标准的分类原则遵循本标准的规定,但在分类标准文本中,需在此处阐明标准的分类依据和框架结构。A.2.9 编码方法卫生健康信息数据集分类与编码标准的编码原则和方法遵循本标准的规定,但在分类标准文本中需在此处阐明标准所采用的代码种类和代码结构。当代码结构较复杂时,可用示例说明。若代码较长需校验时,应阐明代

21、码的校验方法(参照GB/T17710)。A.2.10 分类体系与代码表A.2.10.1 主分类框架与代码表WS/T 30620239卫生健康信息数据集分类与编码标准的主分类框架与代码表(或代码表)可以用表格的形式给出,表格从左到右一般由类目名称栏、代码栏、数据集名称栏、数据集流水号栏组成,并可根据实际需要适当增减栏目,如下所示:一级类目名称一级代码二级类目名称二级代码n 级类目名称n 级代码数据集名称流水码一级类目 1A二级类目 101n 级类目 101数据集 1数据集 2.0102.n 级类目 2.02.二级类目 202n 级类目 1.01.数据集 1.A.2.10.2 复分类代码表卫生健康

22、信息数据集分类与编码标准的复分类属性与代码表需给出数据集复分类类目和引用(自定义)的代码标准。内容可以用表格形式列出,表格从左到右一般由属性段标识位次栏(简称“属性段标识位”)、属性名称栏、引用的编码标准栏组成,如下所示:属性段标识位属性名称引用的编码标准1疾病属性GB/T 14396 疾病分类与代码2组织机构属性GB/T 11714 全国组织机构代码编制规则3学科属性GB/T 学科分类与代码.A.2.11 分类与编码的应用卫生健康信息数据集分类与编码标准的应用需要阐述以下几方面问题的处理:关于交叉主题的处理方法;关于集中与分散问题的处理;关于扩展某一类目的问题的处理;需要特殊强调的类目注释;其他问题。A.2.12 资料性附录A.2.12.1卫生健康信息数据集分类与编码标准的资料性附录是为了对标准的正文内容进行补充说明。一般来讲,是针对标准中涉及的主要问题进行完整的例证说明。A.2.12.2当分类编码对象较多,可以编制代码索引。代码索引应位于附录之后。索引可采用下述形式编排:a)按编码对象名称的汉语拼音字母顺序;b)按编码对象名称的英文对应词字母顺序;c)按有关的其他关系排序。A.2.13 参考文献WS/T 306202310参考文献置于最后一个附录之后,参考文献的起草应遵照 GB/T 7714 的规定。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 通信科技 > 信息安全

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服