收藏 分销(赏)

天文数据处理流水线可视化建模的研究与实现_唐家宁.pdf

上传人:自信****多点 文档编号:454090 上传时间:2023-10-11 格式:PDF 页数:7 大小:1.69MB
下载 相关 举报
天文数据处理流水线可视化建模的研究与实现_唐家宁.pdf_第1页
第1页 / 共7页
天文数据处理流水线可视化建模的研究与实现_唐家宁.pdf_第2页
第2页 / 共7页
天文数据处理流水线可视化建模的研究与实现_唐家宁.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、本栏目责任编辑:王力数据库与大数据技术Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)天文数据处理流水线可视化建模的研究与实现唐家宁,吴开超,张晓丽(中国科学院 计算机网络信息中心,北京 100190)摘要:天文数据规模大,计算需求强,处理过程复杂,传统天文数据处理大多依赖手工操作,效率较低。面向FAST巡天快速射电暴研究的需求,提出天文数据处理流水线可视化建模研究方法,通过数据驱动模式实现流水线模型的自动化运行。在流水线模型中定义了数据处理流水线、算法模块、数据集等对象,通过交互式流水线建模构建流

2、水线模型。流水线建模工具基于MVC模型设计,通过gRPC实现前后端的高效通信,实现流水线的可视化建模,进而支持数据处理全生命周期管理,简化数据处理流程,提高天文科学研究的效率。关键词:流水线建模;数据处理自动化;快速射电暴;gRPC;布局管理中图分类号:TP311文献标识码:A文章编号:1009-3044(2023)03-0060-06开放科学(资源服务)标识码(OSID):1 引言天文学是一门以观测为基础的学科,从观测数据中搜寻信号总结规律,因而对数据运算处理都有很大需求。天文数据处理的流程复杂,传统上多依赖人工,处理效率较低。当前观测数据规模快速增长,现有处理方式难以满足PB级天文数据的快

3、速处理要求。500米口径球面射电望远镜FAST(Five-hundred-meter Aperture Spherical radio Telescope)是 我 国 于2016年建成的世界上单口径最大、灵敏度最高的射电望远镜1,每年观测产生的数据量达15PB。快速射电暴(Fast Radio Bursts,FRB)2是FAST的主要科学目标之一,也是当前射电天文领域的热点研究方向,FRB搜索计算处理的算力需求大、流程复杂、人工依赖性较强,需提升计算处理效率,以加快科研成果的产出。为解决以FRB搜索为代表的天文数据处理中存在的问题与挑战,在对其处理过程复杂、冗长、数据算法独立性较高等特点深入分

4、析的基础上,设计了流水线(Pipeline)模型,将整个数据处理过程分为若干步骤,每一个步骤都设计为独立的数据处理模块,整个模型采用流水线工作模式3将所有处理模块以有向无环图(DAG,Directed Acyclic Graph)串联起来,通过设计流水线处理引擎,来驱动对流水线DAG模型的自动化处理。基于此构建天文数据处理自动化流水线平台。流水线平台主要包括流水线处理引擎和支持与科学家交互的流水线建模工具软件。本文主要研究天文数据处理中的流水线建模技术以及建模中的可视化交互及可视化呈现。基于平台分布式架构,通过对接流水线处理引擎,实现流水线模型自动化执行,进而减少人工操作。2 可视化建模相关研

5、究工作可视化建模中涉及模型自身与模型可视化表达,基于经典的MVC模型开展相关研究是其中重要的研究内容;流水线建模应用涉及大量数据交互,gRPC(Google Remote Procedure Call)支持高效的数据序列化,是当前最重要的分布式对象协议之一,可为分布式的流水线建模应用提供底层支撑;模型图中的部件自动布局管理也是模型可视化的重要研究内容。2.1 MVC模型MVC 设计模式由 Trygve Reenskaug 于 1970 年代在Xerox Parc首次提出,其根本目的是构建人类用户理解的业务模型和计算机数字模型的桥梁4。1988年Krasner和Pope详细解释了smalltal

6、k中的MVC模式,如果在构建应用程序时考虑模块化,尽可能将功能单元彼此隔离,使应用逻辑设计更易于理解和修改,而无须了解其他逻辑单元5。按MVC模式,可将用户应用程序分为三个部分:主应用域模型、模型数据展示和用户交互。MVC模型结构如图1所示。收稿日期:2022-08-25作者简介:唐家宁(1994),女,吉林长春人,通信作者,工程师,学士,研究方向为云计算、天文科学应用、Web开发;吴开超(1970),男,研究员,博士,研究方向为数据密集型计算、科研云基础设施、天文科学应用;张晓丽(1977),女,工程师,硕士,研究方向为软件开发、科研云基础设施。E-mail:http:/Tel:+86-55

7、1-65690963 65690964ISSN 1009-3044Computer Knowledge and Technology电脑知识与技术Vol.19,No.3,January202360DOI:10.14004/ki.ckt.2023.0162数据库与大数据技术本栏目责任编辑:王力Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)ControllerViewModel图1 MVC模型示意图1)模型Model模型负责管理与数据相关的所有任务:验证、会话状态和控制,引入模型管理可降低应用代码的复

8、杂性。模型层负责应用程序的业务逻辑,通过封装访问数据(SQL/NoSQL/文件等)的方法,提供一个可重用的代码库6。通常一个模型是用数据构建的头脑中的抽象,验证和认证,由定义感兴趣领域的代码组成,封装存储在数据库中的数据及其操作,并与不同数据源的交互,执行业务规则。通过有效设计使得模型在应用程序间变得高度可重用。2)视图View视图负责图形界面管理。针对Web应用,所有表单、按钮、图形元素和应用程序内部的所有其他HTML元素,可用于生成RSS聚合器。通过将应用程序的设计与应用程序的逻辑分离,当设计师决定改变应用程序的界面时,可降低出错的风险6。Web应用中视图层控制数据显示方式和用户交互模式,

9、并提供收集用户数据的方法。视图通常不应包含属于应用逻辑的元素,以使其更容易供设计师使用。视图层通常利用模板技术来实现,模板中使用特殊的HTML基于相关内容来插入和生成注释,设计人员可看到渲染视图之前的整个标记,这使得模型处理对于前端开发人员透明。3)控制器Controller控制器负责事件处理,事件则由用户交互或系统进程触发。控制器绑定所有应用逻辑,将View的显示与View的功能绑定。模型则负责检索数据并为视图建立执行路径。控制器还负责统一的错误处理。控制器接受用户交互请求后,访问模型的功能,与模型交互检索所需数据生成视图,并解释接收到的数据,准备相应的数据格式,以便在视图中显示。2.2 g

10、RPC通信gRPC是一个高性能、通用的开源RPC框架,基于ProtoBuf(Protocol Buffers)序列化协议开发,且支持众多开发语言。面向服务端和移动端,基于HTTP/2设计,具有诸如双向流、流控、头部压缩、单TCP连接上的多复用请求等特征7。在gRPC 里客户端应用可以像调用本地对象一样,直接调用其他不同机器上的服务端应用的方法,能够更容易地创建分布式应用和服务,请求流程如图2所示。gRPC ServergRPC StubServiceClientProto ResponseProto Request图2 gRPC请求流程图1)客户端(gRPC Stub)调用M方法,发起RPC调

11、用。2)对请求信息使用 Protobuf 进行对象序列化压缩(IDL)。3)服务端(gRPC Server)接收到请求后,解码请求,进行业务逻辑处理并返回。4)对响应结果使用Protobuf进行对象序列化压缩(IDL)。5)客户端接受到服务端响应,解码请求体。回调被调用的M方法,唤醒正在等待响应(阻塞)的客户端调用并返回响应结果。对于技术选型,流水线平台基于gRPC进行前后端通信,有如下优势:1)性能好,传输效率高:流水线模型运行过程中数据层和视图层的数据规模都比较大,需要在前后端频繁通信,gRPC通过Protocol Buffers定义接口,基于ProtoBuf可将数据序列化为二进制格式,减

12、少数据量,大幅度提升性能8,且gRPC采用HTTP/2.0协议进行传输,可以减少TCP连接次数,更加节省网络带宽。总体上传输效率相较json数据流快6倍。2)简化编程,编码效率高:流水线平台客户端基于JavaScript实现,服务端基于Java实现,gRPC可以跨语言使用,支持多种语言,基于proto文件可生成客户端和服务端目标代码,通过前后端对象的序列化实现通信,序列化反序列化直接对应程序中的数据类,不需要解析后再进行映射,前端可直接调用后端接口方法,简化流水线建模工作平台工作流程,提高编码效率。2.3 图表布局管理(Diagram Layout Management)数据流建模中数据流模型

13、以图表形式展示并与用户交互,基于布局管理算法实现图表的自动绘制,使得其具有良好可读性,并符合美学要求。自动布局算法接收指定图表元素之间连接关系的抽象图(DAG)作为输入,并根据美学产生相应的图表作为输出。基本策略是逐步构建布局,首先构建好拓扑结构,减少边之间的交叉;随后,图表的形状根据沿边缘出现的角度做调整;最后给图赋予维度,得到图的网格骨61本栏目责任编辑:王力数据库与大数据技术Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)架9。数据流模型通常都是手动生成的,或者使用图形编辑器生成;在这两种情况

14、下,图表的布局都由设计者负责10。自动布局管理在以下方面对建模过程非常有用:降低制作和维护图表的成本;自动生成符合美学的图表,增加图解表示的表达能力;整合图表的构思和制作阶段;图文文档自动统一管理,增加用户和设计者之间的通信带宽。常见的自动布局管理如表1所示11。3 流水线可视化建模的设计与实现3.1 设计思路及方法流水线平台主要包括流水线处理引擎和支持与科学家交互的流水线建模工具软件。本文聚焦于天文数据处理中的流水线建模技术以及建模中的可视化交互及可视化呈现。向上面向科学家用户的使用需求,研究数据处理全生命周期的建模管理,提供图形化管理界面,支持数据处理流水线的可视化交互及可视化呈现;向下对

15、接流水线处理引擎,完成对流水线模型的驱动。驱动过程主要依靠后端调度算法,具体实现过程不是本文研究重点,不做具体介绍。流水线建模实现主要通过构建流水线建模工作台,完成Pipeline模型绘制,得到可视化模型数据结构,经过Pipeline 执行流程,赋予模型计算能力并且得到流水线处理引擎可工作的DAG模型数据结构。基于模型管理,完成流水线启动以及运行过程可视化展示,辅助用户分析。基于此,提出具体设计思路、实现方案及方法。1)基于DAG的流水线模型设计流水线平台实现数据处理自动化的关键在于模型数据结构定义,需构建各计算任务间的依赖关系,完成流水线处理引擎数据驱动。天文数据处理流水线是由一系列串行的、

16、数据驱动的处理模块组成的数据处理过程。流水线的数据流程中通常不存在分支或循环。第一个模块将原始数据作为输入,对其进行处理,并将其结果发送到第二个过程,依此类推,最终以最后一个模块产生的最终结果结束。软件平台层面上可理解为由相互连接的数据集和处理模块组成的有向无环图,因此流水线数据结构可基于DAG进行定义,以yml文件形式进行保存。模块封装和数据组织是流水线定义的重要环节,因此可定义两类节点,数据集节点和处理模块节点。DAG的起点和终点为数据集,数据集和处理模块交叉互联。数据集中应包含数据集名称节点实体路径等信息,处理模块应包含处理模块名称、输入输出数据集、下级处理节点、工作基础镜像等信息,ym

17、l文件具体定义形式如下所示:yml文件定义形式name:“xxx“/流水线英文名称submitter“xxx“/提交人员jobs:/处理节点,可定义多个xxxx:/处理节点英文名称label:“xxx“/处理节点中文名称base_image:“xxx“/处理节点工作基础镜像type:/处理节点工作类型input_datasets:/输入数据集节点,可对应多个-xxxx1output_datasets:/输出数据集节点,可对应多个-xxxx1sink_jobs:/下级处理节点-xxxxdatasets:/数据集节点,可定义多个xxxx:/数据集节点英文名称label:“xxx“/数据集节点中文名

18、称base_uri:“xxx“/数据集节点实体路径值布局名称Grid LayoutForce-DirectedLayoutTree LayoutLayered DigraphLayoutCircular Layout具体含义一个简单的布局,用于以类似网格的形式放置节点力导向布局将图形视作是一个物理系统,在其上以及它们之间作用有力此布局将树结构图的节点放置在层(行或列)中这会将有向图的节点排列成层(行或列)此布局将节点定位为圆形或椭圆形布局图例展示113214315456789101112213456781191021345621345672134567表1 自动布局管理62数据库与大数据技术本

19、栏目责任编辑:王力Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)2)流水线建模工具的构建流水线建模工具包括流水线建模工作台以及流水线相关管理界面,主要基于MVC模式实现模型构建与模型输出功能。Model模型层用于数据处理、逻辑处理,View视图层用于显示用户界面,Control控制层作用于模型和视图上,控制数据流向模型对象,并在数据变化时更新视图。针对流水线可视化建模需求,视图层需要为用户提供一个通过简单拖拽节点组件来构建Pipeline模型的工作台,构建好的Pipeline模型可保存、可复现、可

20、创建流水线实例,提供模型启动、模型执行过程、输出结果可视化的模型管理界面。Pipeline模型结构需与数据层相匹配,模型中包含的相关数据应有节点、连线、位置等信息,各节点默认配置项、配置参数选项等。基于此,将上述功能划分,应用于视图层设计,模块结构设计如图3所示。节点组件流水线建模工作台流水线管理界面图3 模块结构设计节点组件。节点组件可理解为流水线建模过程中的模型算子根据Pipeline定义形式,定义两类节点组件:数据集节点和处理节点。a)数据集节点:此类节点为用户提供数据处理所需的数据,包括建模流程交互功能和实例创建后数据管理功能。建模流程交互功能允许用户拖拽至流水线建模工作台,作为算子使

21、用;数据管理功能在模板实例创建后,可显示数据列表,支持数据详情查看等。b)处理节点:此类节点用于封装数据处理过程中的各类算法,实现对单位数据实体(单个实体、一组实体)的数据变换、数据过滤、数据传输等处理功能。该节点允许用户在建模流程交互功能中拖拽至流水线建模工作台,作为算子使用。允许用户在模板实例创建后查看处理过程任务列表,支持任务详情查看。流水线建模工作台流水线建模工作台为用户提供Pipeline模型构建功能。选用HTML5交互性图形库中图表布局管理技术,支持用户在图形编辑界面进行编辑,支持用户拉取具备连接关系的数据自动生成拓扑图。用户可通过图形编辑界面构建流水线模型,也可通过导入具备一定连

22、接关系的数据自动生成流水线模型,数据结构参考下文提到的可视化数据结构,自动布局无需节点位置关系。图形编辑界面建模主要涉及拖拽节点、节点配置、节点间连线形成模板。下面主要对拖拽实现,节点连线实现,模板数据结构定义进行介绍。a)拖拽技术实现:将节点组件拖拽至建模工作区域。应用JS库的拖拽技术,单击组件模块中的节点算子选中节点,拖动操作开始执行,拖动过程中选择合适位置放置目标,拖拽结束时,结束鼠标单击事件,节点组件放置在适当位置。b)节点连线实现:通过使用JS库中的链接功能为节点组件间生成可视化工作流。在节点事件绑定时,为节点添加输入、输出锚点。每个锚点允许引入多个数据流。节点连线时,可由一个节点的

23、输出锚点引入另一个节点的输出锚点,数据流向为输出到输入,在输出节点处添加数据流向箭头。c)模板数据结构定义模板数据结构分为基于DAG的模型数据结构和可视化数据结构。基于DAG的模型数据结构用于配合数据层完成任务执行功能,可视化数据结构用于模型复现,具体定义形式如下所示:可视化数据结构定义形式name:xxxx,/流水线名称output_basedir:xxxx,/输出目录master:xxxx,/所属集群nodeDataArray:category:xxxx,/节点类型key:xxxx,/节点idloc:xxxx,/节点位置信息basicinfo:,/节点配置数据,linkDataArray:

24、from:-4,/节点链接输入位置to:-3,/节点链接输出位置points:Array12,/节点链接位置信息category:xxxx/节点链接类型流水线管理界面流水线管理界面与流水线建模工作台相结合,通过流水线建模工作台完成流水线实例创建后,基于可视化数据结构,流水线管理界面通过自动布局管理将流水线数据流模型以图表形式展示。该页面为流水线实例提供了启动、执行过程展示、执行错误修正,执行结果展示等功能。在模型节点交互功能中,为模型节点绑定了点击事件,右击可选择点击任务查看/数据查看,并结合数据类型,利用可视化插件生成图表相关信息12-13,实现数据展示多样化,辅助用户分析。3)Pipeli

25、ne执行流程设计 Pipeline 执行流程的目的在于为平台的Pipeline模型和流水线处理引擎之间搭建桥梁以及为Pipeline模型提供计算能力。执行流程如图4所示。通过流水线建模工作台得到Pipeline模型及其可视化结构配置数据,经过模型翻译,对可视化结构数据遍历解析,得到DAG形式的可执行数据结构,以yml文件形式存储;对天文数据处理算法进行模块化封装构建独立的容器镜像,并以低耦合的形式加入天文数据处63本栏目责任编辑:王力数据库与大数据技术Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)

26、理模型的执行流程中14,满足Pipeline模型计算的需求;平台接收到流水线实例创建指令后,控制层对yml文件进行解析,构建 Pipeline、DataSet、Job 等基本信息,平台接收到流水线实例启动指令后,流水线处理引擎开始工作,根据构建的流水线相关信息,遵循流水线处理流程,拉取Job工作镜像,数据源开始注入。受DataSet实时数据的驱动,产生需要计算的任务,分配到计算资源中,当任务队列为空时,流水线执行结束。模块算法容器化脚本容器镜像构建Pipeline模型yml文件定义文件解析流水线建模工作台流水线处理引擎容器镜像库数据库图4 执行流程设计3.2 应用案例具体实现本部分以FRB实例

27、进行展示流水线建模过程,通过对FRB数据处理过程算法模块进行封装,提供模块计算能力,设计模型流向图,进行流水线模型构建,进而创建流水线实例,具体操作如下。1)算法模块化天文数据处理算法复杂、冗长,可划分为若干个处理模块。FRB搜索工作其数据处理过程涉及以下算法模块:数据补全、转换合并、GPU消色散、候选体筛选、结果绘图。考虑部署、移植、底层环境适配等因素,模块化封装采用轻量级、启动快、操作简单的Docker容器技术,通过定义Dockerfile文件形式15,为每个处理模块构建独立的容器镜像,为流水线实例创建提供模块计算能力,Dockerfile构建镜像通用模板实例如下所示:Dockerfile

28、实例#算法模块基础镜像FROM fast-frb/heimdall#增加核心调度软件COPY from= run.sh/app/bin#创建并设定工作目录RUN mkdir-p/workWORKDIR/work#容器启动ENTRYPOINT goagent2)数据流向设计流水线建模过程需构建模块间依赖关系,考虑FRB搜寻数据处理流水线实例,其数据源与处理模块间的模型数据流向设计如图5所示。3)模型构建用户通过流水线建模工作台依照FRB流水线数据流向设计图拖拽节点进行绘制,并对节点进行参数配置,绑定交互事件,提供FRB流水线模型保存功能以及实例创建功能。构建方式可利用前文介绍的节点组件进行建模,

29、建模过程主要涉及选择节点,定义节点参数,节点间连线形成模板流程。具体操作如下:节点拖拽,用户在节点面板中开始拖拽节点,拖拽至目标位置,拖拽开始则触发节点位置信息获取事件,节点位置信息随之变化,拖拽结束,节点位置信息保存,同时生成唯一的节点ID。有分组需求的,先拖拽分组节点,再将其他节点拖拽至分组节点内。节点事件绑定,单击显示节点配置信息,右击提供节点删除事件,并为节点添加输入点(节点上方),输出点(节点下方)。节点数据初始化,填写节点配置信息,如数据集节点所需的英文名 name,中文名 label,容器镜像base_image,保存在节点信息中,配置信息中可定义变量,实现模板重复利用。添加节点

30、间连线,为节点添加输入输出关系,每个节点允许多个输入,允许多个输出。对节点间连线绑定删除事件,同时绑定节点数据信息更新事件,添加连线,删除连线时触发。4)模型执行交互完成流水线模型构建后,对FRB流水线模型进行模板保存和实例创建,具体操作下:模板保存:用于模板复现和更新维护,用户点击模板保存按钮,获取节点、位置、连线等信息,以可视化数据结构json数组形式保存。实例创建:用户选择FRB流水线模板,当含有参数时,赋予参数实例,点击模板实例创建按钮触发模板实例化事件。控制层获取模板json数组信息进行处理,转化为可执行数据结构DAG形式,以yml文件格式进行保存。实例化的流水线模板可进行启动,每个

31、模板可实例化多条流水线。流水线实例启动,流初始化数据数据补全转换合并GPU消色散候选体筛选结果绘图图片结果图5 模型数据流向64数据库与大数据技术本栏目责任编辑:王力Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)水线处理引擎开始工作,提供查看各节点任务执行进程、结果以及出错信息等功能。4 流水线可视化建模工具应用4.1 流水线建模工作台平台采用拖拽式的建模方式,可使用基础节点组件进行模型新建,使用已有模板复现进行模型构建,使用已有模板进行模板实例创建。建模操作主页如图6所示,左侧为已建立模板列表,

32、中间区域为建模工作区域,包括各类型节点以及流水线模板构建图,右侧为节点配置信息,用户在该区域配置节点相关信息。建模工作区域上方提供了新建模板,模板保存,实例保存等功能,实现模板可新建,可复看,可进行实例创建。模板新建时,用户可在组件导航中选择符合数据处理模型需求的组件拖拽至建模工作区域,拖拽节点的输出链接线至其他节点的输入链接线完成数据流向。对节点进行点击,可在节点配置区域对节点基本信息进行配置保存。节点、链接线可选中按delete键进行删除。用户通过使用流水线建模工作台将整个数据处理过程自动串联起来,数据自动化驱动,减少人工操作,简化了数据处理流程,提高了工作效率。4.2 流水线模型实例流水

33、线实例创建后,用户可对流水线实例进行启动。流水线运行界面如图7所示,左侧为处理节点、数据集节点运行过程中数据变化、运行状态展示,可查看Job名称、总数量、已完成数量、运行状态。右侧为流水线实例数据流向展示,处理模块可点击查看模块任务全时刻运行进度。用户通过流水线运行界面监测数据处理各模块运行状态,完成度,便于发现错误及时处理,保证数据处理的准确性,减少数据的误差。用户可对流水线运行过程中节点全时刻运行进度 进 行 查 看,ntasks_ready 准 备 运 行 的 任 务、ntasks_running运行中的任务、ntasks_ok运行结束的任务、ntasks_app_arr运行出错的任务,

34、如图8所示。用户通过回顾各模块全时刻处理进度,便于总体分析数据,通过图表展示让数据更为直观,可提高分析进度,加快科研产出。5 结束语天文数据处理自动化流水线软件平台将使得FAST巡天快速射电暴搜索工作流程得到简化并大大提高搜索效率,能够实现科学数据处理分析的自动化、可重复、可管理,为加快科学进步提供了好的契机。本文研究天文数据处理中的流水线建模及建模中的可视化交互及可视化呈现,设计了基于流水线模式的建模工作台,定义Job、DataSet及其相互关系,采用可视化交互构建完整的Pipeline。用图形化界面管(下转第68页)图6 流水线建模工作台图7 流水线实例运行主页图8 节点运行详情65本栏目

35、责任编辑:王力数据库与大数据技术Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)引导下甲状腺结节的手术也全身处于领先位置。3.2 共病患者的疾病共存、伴随特点由于频繁项目集中包含的项目同时发生的可能性很高,因此可以从频繁项目集中了解项目之间的关系3,依据一定的支持度与置信度,可以计算出疾病ICD10的频繁项集;从上述关联规则支持度结果看,高血压、糖尿病、脑梗死三类疾病同时发生的比率最高,其次是高血压、糖尿病、冠心病,顺位第三、四组合的是高血压、脑梗死、冠心病。都是相关性较高心脑血管疾病,与相关研究中

36、慢性非传染性疾病是人健康的最大威胁,主要包括脑梗死、慢性缺血性心脏病、原发性高血压4。从置信度来看,具体的疾病集合置信度都较高的有(前项:冠心病;后项:心绞痛,其他类型)、(前项:冠心病;后项:心绞痛,其他类型、高血压)、(前项:高血压;后项:肾终末期疾病、糖尿病)、(前项:高血压;后项:脑梗死、冠心病、糖尿病)、(前项:高血压;后项:肾终末期疾病、贫血)。老年冠心病患者一般都有心绞痛的发生;高血压是冠心病发生、发展的独立危险因素,有70%冠心病患者合并高血压。高血压会促使动脉硬化恶化,增加心血管事件发生风险;而冠心病又会加重高血压病情,两种疾病相互促进,形成恶性循环5-7。有文献报道高血压患

37、者血压升高加速了动脉粥样硬化的发展,从而使急性脑梗死的发生率明显增加8,目前公认的急性脑梗死危险因素有年龄、吸烟、高血压、糖尿病等。通过共病特点分析,可以临床医师诊断与治疗提供参考,同时为社会疾病预防提供指导。本研究也存在一定的局限性,标本量主要来自某一医院,尚未覆盖一定的地域,待进一步验证。参考文献:1 刘芳.某院2018年老年共病住院患者疾病分布特点分析J.中国病案,2020,21(11):65-68.2 Cynthia M Boyd MD M,Martin Fortin MD M.Future of multimorbidity research:how should understan

38、ding of multimorbidity inform health system design?J.Public Health Reviews,2010,32(2):451-474.3 于海洋.快速挖掘最大频繁项集算法在图书馆管理中的应用J.计算机与现代化,2020(6):68-72.4 高华,韩颖,张佳莹,等.2015年2017年山西省老年病人疾病谱分析J.护理研究,2021,35(2):319-324.5 氨氯地平阿托伐他汀钙片治疗高血压合并冠心病患者血压水平及心功能的影响J/OL.中国医院药学杂志,2021:1-5.(2021-01-28).https:/ Gheorghe A,G

39、riffiths U,Murphy A,et al.The economic burden ofcardiovascular disease and hypertension in low-and middle-income countries:a systematic reviewJ.BMC Public Health,2018,18(1):975.7 Petrie J R,Guzik T J,Touyz R M.Diabetes,hypertension,and cardiovascular disease:clinical insights and vascular mechanisms

40、J.Canadian Journal of Cardiology,2018,34(5):575-584.8 中华人民共和国卫生部心血管病研究中心.中国高血压防治指南(2009 年修订版)M.北京:人民卫生出版社.【通联编辑:李雅琪】(上接第65页)理流水线模型,为数据处理全生命周期提供支持,简化了数据处理流程的管理,降低了数据分析复杂度,提升了数据处理速度和计算资源利用率,满足了FRB搜索及同类应用的计算处理需求。后期将继续完善现有软件平台,从数据处理算法种类、平台数据结构优化、可视化图表样式、自动布局管理等方面出发,为用户提供更有效的数据处理方式以及更好的视觉效果体验,让其发挥出更好的作用。

41、参考文献:1 许余云,李菂,刘志杰,等.人工智能在脉冲星候选体筛选中的应用J.天文学进展,2017,35(3):304-315.2 Niu C H,Aggarwal K,Li D,et al.A repeating fast radio burst associated with a persistent radio sourceJ.Nature,2022,606(7916):873-877.3 王磊.数据处理-流水线(Pipeline)模式EB/OL.2022-06-20.https:/ Trygve Reenska.MVCEB/OL.2021-09-24.https:/folk.unive

42、rsitetetioslo.no/trygver/themes/mvc/mvc-index.html.5 Krasner G E,Pope S T.A cookbook for using the model-viewcontroller user interface paradigm in Smalltalk-80J.Journal ofObject-Oriented Programming,1988,1(3):26-49.6 Pop D P,Altar A.Designing an MVC model for rapid web application developmentJ.Proce

43、dia Engineering,2014,69:1172-1179.7 Feng J H,Li J H.Google protocol buffers research and application in online gameC/IEEE Conference Anthology.January 1-8,2013,China.IEEE,2014:1-4.8 Mathuriya A,Kurth T,Rane V,et al.Scaling GRPC tensorflow on512 nodes of cori supercomputerEB/OL.2021-09-24.2017:arXiv:

44、1712.09388.https:/arxiv.org/abs/1712.09388.9 Batini C,Nardelli E,Tamassia R.A layout algorithm for data flowdiagramsJ.IEEE Transactions on Software Engineering,1986,SE-12(4):538-546.10 Protsko L B,Sorenson P G,Tremblay J P,et al.Towards the automatic generation of software diagramsJ.IEEE Transaction

45、s onSoftware Engineering,1991,17(1):10-21.11 Northwoodssoftware.GoJSEB/OL.2021-09-24.https:/ Li D Q,Mei H H,Shen Y,et al.ECharts:a declarative frameworkfor rapid construction of web-based visualizationJ.Visual Informatics,2018,2(2):136-146.13 张玉洁.拖拽式数据可视化工具的设计与实现D.西安:西安电子科技大学,2020.14 刘芳.基于Web的数据挖掘可视化平台研究与实现D.北京:北京邮电大学,2020.15 耿朋,陈伟,魏峻.面向Dockerfile的容器镜像构建工具J.计算机系统应用,2016,25(11):14-21.【通联编辑:谢媛媛】68

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服