收藏 分销(赏)

DB14∕T 2527-2022 云平台 人工智能建模系统框架及功能要求(山西省).pdf

上传人:曲**** 文档编号:148978 上传时间:2022-09-23 格式:PDF 页数:11 大小:256.11KB
下载 相关 举报
DB14∕T 2527-2022 云平台 人工智能建模系统框架及功能要求(山西省).pdf_第1页
第1页 / 共11页
DB14∕T 2527-2022 云平台 人工智能建模系统框架及功能要求(山西省).pdf_第2页
第2页 / 共11页
DB14∕T 2527-2022 云平台 人工智能建模系统框架及功能要求(山西省).pdf_第3页
第3页 / 共11页
DB14∕T 2527-2022 云平台 人工智能建模系统框架及功能要求(山西省).pdf_第4页
第4页 / 共11页
DB14∕T 2527-2022 云平台 人工智能建模系统框架及功能要求(山西省).pdf_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、ICS35.080CCS L 7614山西省地方标准DB14/T 25272022云平台 人工智能建模系统框架及功能要求2022-08-18 发布2022-11-18 实施山西省市场监督管理局发 布DB14/T 25272022I目次前言 . II1 范围 . 12 规范性引用文件 . 13 术语和定义 . 13.1 云平台 . 13.2 人工智能建模系统 . 13.3 算子 . 13.4 特征工程 . 14 缩略语 . 25 功能构成 . 25.1 概述 . 25.2 数据导入导出 . 25.3 数据预览与探索 . 35.4 数据预处理 . 35.5 特征工程 . 35.6 算法选择 . 4

2、5.7 模型训练与评估 . 45.8 模型管理 . 55.9 模型市场 . 55.10 工作流调度 . 6参考文献 . 7DB14/T 25272022II前言本文件按照GB/T 1.12020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。本文件由山西省工业和信息化厅提出、组织实施和监督检查。山西省市场监督管理局对文件的组织实施情况进行监督检查。本文件由山西省网络安全和大数据信息技术标准化技术委员会归口。本文件起草单位:山西云时代技术有限公司、山西省信息产业技术研究院有限公司、山西云时代政务云技术有限公司、山西数字政府建设运营有限公司。本文件主要起草人:盛佃清、王文逾、侯彦英、

3、郝俊宇、康晓丽、刘宁、申利华、李华、郑亮、王奇侠、白鹏、郭靖伟、李潞洋、赵世琛、杜军军、吕云云、张弋、杨峰光、杜亮亮、王忠民、李雨萌、孙凯凯、胡博、崔志学、肖晋飞、温静、高俊杰、付玉辉、徐流明、许兴欣、董力熇、张培玉、田垒、郑立、韩思齐。DB14/T 252720221云平台人工智能建模系统功能要求1范围本文件规定了云平台人工智能建模系统的各组件功能要求。本文件适用于云平台上人工智能建模系统及解决方案的数据处理、算法设计、模型训练、模型管理等功能要求,可作为云平台上人工智能建模系统的规划、设计、建设、评估及验收的依据。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条

4、款。 其中, 注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 5271.31-2006信息技术 词汇 第31部分:人工智能 机器学习GB/T 5271.34-2006信息技术 词汇 第34部分:人工智能 神经网络3术语和定义GB/T 5271.31-2006,GB/T 5271.34-2006界定的以及下列术语和定义适用于本文件。3.1云平台本文件所指云平台是面向全省域, 为政府、 社会团体和企事业组织提供专业化服务的一体化云服务体系。3.2人工智能建模系统为数据分析人员、业务建模人员和模型管理人员提供数据处理、模型构

5、建与训练、模型部署与管理解决方案的模型平台。3.3算子构成人工智能建模算法的计算单元。3.4特征工程利用领域知识从原始数据中提取特征的过程。DB14/T 2527202224缩略语下列缩略语适用于本文件。AI:人工智能(Artificial Intelligence)DAG:有向无环图(Directed Acyclic Graph)NLP:自然语言处理(Natural Language Processing)JDBC:Java数据库连接(Java Database Connectivity)HDFS:Hadoop分布式文件系统(Hadoop Distributed File System)SQ

6、L:结构化查询语言(Structured Query Language)API:应用程序接口(Application Programming Interface)ROC:接收者操作特征(Receiver Operating Characteristic)PR:查全率(Precision-Recall)REST: 表述性状态转移 (Representational State Transfer)5功能要求5.1概述云平台人工智能建模系统的功能框架见图1,包括数据导入导出、数据预览与探索、数据预处理、特征工程、算法选择、模型训练与评估、模型管理、模型市场、工作流调度等核心能力。图 1云平台人工智能

7、建模系统的功能框架5.2数据导入导出5.2.1数据导入支持多种数据源包括关系型数据库、Hive、HBase、ElasticSearch、HDFS、文件格式、JDBC等,同时支持数据导入时转换数据类型。数据源接入使用统一视图及规范。5.2.2数据导出DB14/T 252720223支持将结果数据导出至关系型数据库、Hive、HDFS、JDBC等,同时支持结果数据导出至数据源。5.2.3数据样例人工智能平台应提供不同类型的样例数据以供测试。5.3数据预览与探索5.3.1数据质量分析支持对脏数据,数据缺失值、异常值等的检查。5.3.2数据统计分析支持查看数据的分布情况和统计学指标。支持图形化自定义统

8、计分析数据。5.3.3数据特征分析支持在数据集合进行分布分析,对比分析,统计量分析和相关分析,为数据建模人员提供基本的特征描述。5.3.4复杂数据特征分析支持交互式分析和探索的编程环境。包括R、Python等编程环境,用于复杂的数据特征分析。5.4数据预处理5.4.1数据清洗支持按照预定义的清洗模式对全量数据进行原始无效异常数据过滤和缺失数据补齐。5.4.2数据变换提供包括数据属性转换、新属性生成在内的处理能力。5.4.3数据规约提供对基本数据属性的归一化处理能力。5.4.4自动化预处理支持数据预处理自动化,包括自动填充、自动清理、自动转换以及自动归一化等。5.4.5预处理行业模板人工智能平台

9、应提供预处理操作算子样例及常用模板。5.5特征工程5.5.1特征工程流程特征工程流程包括特征变换、特征重要性评估、特征选择、特征生成等。5.5.2特征工程自动化特征工程自动化包括自动多表扩展、自动特征变换、自动特征选择以及自动特征生成等。DB14/T 2527202245.5.3特征提取模板支持特征提取算子和模板配置。5.6算法选择5.6.1基础能力支持多种优化算法,算法参数可配置。5.6.2支持但不限于以下的算法类型特征权重、流处理、预处理、表操作、机器学习、图嵌入、验证与评估、NLP、时间序列、统计、集成学习、深度学习、图计算、图像处理、强化学习等。5.6.3自定义算法支持通过Python

10、,R等实现自定义算法,支持用户自定义持久化扩展算子库。5.6.4实用工具库提供支持子流程、添加宏、提取宏、生成宏、删除宏、循环,支持子流程的自定义封装和命名,支持自定义单机脚本算子快速实现分布式化等功能的实用工具。5.6.5算法样例库提供章节5.6.2、5.6.3所列算法的使用样例。5.7模型训练与评估5.7.1训练过程可以启动和停止训练任务,可以查看运行日志。训练过程中支持调试功能,可进行单步调试,断点调试。支持训练过程中间数据查看、导出。5.7.2资源共享支持多个用户分组管理和共享计算资源。5.7.3资源管控支持对物理资源进行虚拟化管控,可以动态进行资源的申请或释放。5.7.4复杂任务依赖

11、支持多任务之间图形化构建依赖,以构建复杂的模型训练任务及数据分析任务。5.7.5自动调参与自动建模支持自动调参和搜索网格, 包括在给定命中率和覆盖率的要求下搜索参数输出结果, 及在给定参数下搜索最优结果。支持自动建模,自动选择算法及参数。5.7.6交叉验证DB14/T 252720225支持按比例随机分配训练与测试集,支持交叉检验。5.7.7评估指标支持多种评估指标,如混淆矩阵,ROC曲线,PR曲线,加权召回率等。对于二分类,输出包括评价指标的数目表格;对于多分类,输出混淆矩阵。5.7.8评估样例库提供所有评估算子样例。5.8模型管理5.8.1模型的版本管理支持历史、新建及外部导入模型的保存和

12、版本管理,支持模型详细查看,模型结果查看。5.8.2模型导入导出支持多种模型格式。支持导出Json模型,包括聚类、分类、回归等类型。5.8.3深度学习模型管理支持深度学习模型导入导出和可视化查看,支持实验应用。5.9模型市场5.9.1模型用户管理支持管理员对其所属普通用户项目情况及权限进行管理。5.9.2模型服务上架支持任务/实验、代码、自定义镜像等在模型市场上架。5.9.3模型服务上、下线支持模型服务的上、下线与列表查看。5.9.4模型服务更新支持滚动更新及灰度更新,且灰度升级支持分配流量权重。5.9.5模型服务测试支持服务上线后的API测试。5.9.6模型服务管理支持自定义模型部署,生成相

13、应REST API,手动增加实例数量提高服务的负载均衡;可查看当前导入平台的API列表。5.9.7模型服务监控支持线上模型服务监控,可查看模型服务内容、运行状态、实例详情、资源设置等,后台可以统计API的调用情况和结果统计。DB14/T 2527202265.9.8模型服务使用API服务上线后,可通过REST API调用,传入参数并获得预测值。5.10工作流调度5.10.1任务配置支持可视化建模、代码建模、特征和模型上架、上线等任务类型。支持对单个任务进行资源配置,如可视化建模、代码建模等。5.10.2设计工作流任务定义成功后, 确定各任务彼此间的逻辑依赖关系, 任务会自上而下执行。 支持通过Cron表达式,来设置整个工作流的调度周期。5.10.3执行工作流支持对工作流进行调试,确保整体流程可执行,再进行调度。设置工作流的调度周期后,工作流会按照设置的周期定时调度。5.10.4工作流上、下线支持对工作流进行上线、下线操作。5.10.5工作流导入导出支持从外部导入工作流,支持工作流导出到本地,导入导出文件为JSON格式。5.10.6工作流详情支持查看单个工作流每次的执行时间和执行状态。支持查看工作流下的单个任务每次的执行时间、状态和日志详情。DB14/T 252720227参考文献1 国家新一代人工智能标准体系建设指南国标委联202035

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 行业资料 > 系统集成

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服