YY∕T 1833.1-2022 人工智能医疗器械质量要求和评价第1部分：术语[医药].pdf

资源描述

1、ICS 11.0 40 .99CCS C 30YY中华人民共和国医药行业标准YY/T 1833.12022人工智能医疗器械质量要求和评价第1部分:术语Artificial intelligence medical deviceQuality requirements and evaluation-Part 1 ： Terminology2022-07-01 发布2023-07-01 实施国家药品监督管理局发布YY/T 1833J2 0 2 2目次前言.ID引言.IV1 范围. 12规范性引用文件.13 术语和定义.13.1 基础技术术语.13.2 数据集术语.53.3 质量特性术语.93

2、.4 质量评价术语.113.5 应用场景术语.15附录A （资料性）评价指标计算公式说明.17参考文献.25索弓I . 26IYY/T 1833.12 0 2 2刖百本文件按照GB/T 1.12020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草“本文件是YY/T 1833人工智能医疗器械质量要求和评价的第1部分。YY/T 1833已经发布了以下部分：第1部分:术语；第2部分:数据集通用要求。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由国家药品监督管理局提出.本文件由全国人工智能医疗器械标准化技术归口单位归口。本文件起草单位：中国食

3、品药品检定研究院、解放军总医院、中国科学院深圳先进技术研究院、上海长征医院、上海联影智能医疗科技有限公司、飞利浦（中国）投资有限公司、上海西门子医疗器械有限公司、杭州依图医疗技术有限公司、腾讯医疗健康（深圳）有限公司、华为技术有限公司、广州柏视医疗科技有限公司、美中互利医疗有限公司、慧影医疗科技（北京）有限公司、北京安德医智科技有限公司、中山大学中山眼科中心、东南大学。本文件主要起草人:孟祥峰、何昆仑、郑海荣、刘士远、李佳戈、王浩、詹翊强、王晨希、萧毅、葛鑫、刘东泉、颜子夜、钱天翼、符海芳、陆遥、刘毅、柴象飞、王珊珊、周娟、张培芳、林浩添、万遂人。YY/T 1833.12 0 2 2

4、引言近年来，人工智能医疗器械不断发展，成为医疗器械标准化领域的一个新兴方向。我国已初步建立人工智能医疗器械标准体系。在该标准体系中，YY/T 1833人工智能医疗器械质量要求和评价是基础通用标准，为开展细分领域的标准化活动提供指导，拟由八个部分组成.第1部分:术语。目的在于为人工智能医疗器械的质量评价活动提供术语。第2部分:数据集通用要求。目的在于提出数据集的通用质量要求与评价方法.第3部分:数据标注通用要求。目的在于提出数据标注环节的质髭要求与评价方法.第4部分:可追溯性通用要求。目的在于提出人工智能医疗器械可追溯性的通用要求及评价方法,一第5部分:算法安全要求。目的在于规范人工智能

5、医疗器械采用的人工智能算法的安全要求与评价方法。第6部分:环境要求。目的在于规范人工智能医疗器械的运行环境条件要求与评价方法。第7部分:隐私保护要求。目的在于加强人工智能医疗器械保护受试者隐私的能力。第8部分:伦理要求。目的在于从技术层面实现人工智能伦理的要求，保护人的权益。本文件为其他部分提供基础、共性的术语。其他部分在起草过程中，可能根据需要，补充特定语境下的专用术语。YY/T 1833.12 0 2 2人工智能医疗器械质量要求和评价第1部分：术语1范围本文件界定了人工智能医疗器械质量要求和评价使用的术语和定义。本文件适用于人工智能医疗器械。2规范性引用文件本文件没有规范性引用文件.

6、3术语和定义3.1 基础技术术语3.1.1人工智能 a rtificia l in telligen ce； AI表现出与人类智能（如推理和学习）相关的各种功能的功能单元的能力。来源：GB/T 52 71.2 82 0 0 1,2 8.0 1.0 2 3.1.2人工智能医疗器械 a rtificia l in telligen ce medica l device ； AIMD采用AI技术实现其预期用途的医疗器械。注1,如采用机器学习、模式识别、规则推理等技术实现其医疗用途的独立软件。注2：如采用内嵌AI算法、AI芯片实现其医疗用途的医疗器械.3.1.3医疗器械软件 medica l devi

7、ce softwa re在集成到正在开发的医疗器械中的已开发的轨件系统,或者预期作为医疔器械使用的软件系统。注：医疔器械软件包括软件组件和独立软件，软件组件是指嵌入到医疗器械中或作为医疗器械组成部分的软件，独立软件是指具有一个或者多个医疔目的，无需医疗器械硬件即可完成自身预期目的，运行于通用计算平台的软件.来源:YY/T 0 6642 0 2 0 ,3.113.1.4模式识别 pa ttern recogn ition通过功能单元对某一对象物理或抽象的模式以及结构和配置的辨识。来源：GB/T 52 71.2 82 0 0 1,2 8.0 1.133.1.5人工神经网络 a rtificia

8、 l n eura l n etwork； ANN由加权链路且权值可调整连接的基本处理元素的网络，通过把非线性函数作用到其输入值上使每 YY/T 1833J2 0 2 2个单元产生一个值，并把它传送给其他单元或把它表示成输出值。注：也可称为神经网络.来源：GB/T 52 71.342 0 0 6,34.0 1.0 63.1.6推理 in feren ce从已知前提导出结论的方法。注1：在人工智能领域中，前提是事实或规则.注2：术语“推理”既指过程也指结果.来源：GB/T 52 71.2 82001,2 8.0 3.0 1,有修改3.1.7特征 fea ture能表达模式本质的功能或结构特点的可

9、度量属性。注：如大小、纹理、形状等。好的特征能使同类模式聚类、不同类模式分离。3.1.8机器学习 ma chin e lea rn in g功能单元通过获取新知识或技能，或通过整理已有的知识或技能来改进其性能的过程。注：也可称为自动学习.来源：GB/T 52 71.312 0 0 6,31.0 1.0 2 ,有修改3.1.9深度学习 deep lea rn in g通过训练具有多个隐层的神经网络来获得输入输出间映射关系的机器学习方法。3.1.10监督学习 supervised lea rn in g一种学习策略，获得的知识的正确性通过来自外部知识源的反馈加以测试的学习策略。注：也可称为监督式学

10、习。来源：GB/T 52 71.312006,31.0 3,0 8,有修改3.1.11无监督学习 un supervised lea rn in g一种学习策略，它在于观察井分析不同的实体以及确定某些子集能分组到一定的类别里，而无需在获得的知识上通过来自外部知识源的反馈，以实现任何正确性测试。注h 一旦形成概念，就对它给出名称，该名称就可以用于其他概念的后续学习了.注2：也可称为无师（式）学习.来源：GB/T 52 71,312 0 0 6,31.0 3.0 9,有修改3.1.12强化学习 rein forcemen t lea rn in g一种学习策略，它强调从环境状态到动作映射的过程，

11、目标是使动作从环境中获得的累积奖赏值最大。3.1.13半监督学习 sein i-supervised lea rn in g一种学习策略，它自行利用少量的具有标记信息的样本和大量没有标记的样本进行学习的框架。2YY/T 1833.12 0 2 23.1.14自监瞥学习 self-supervised lea rn in g一种学习策略，通过基于数据本身设计和建立的各种标记信息来对数据本身的特征、特性进行学习，进而把学习到的数据特征网络作为主干网络迁移到对目标任务的学习中。11.15弱监督学习 wea kly supervised lea rn in g一种学习策略，通过使用有噪声的、不完全

12、的、不精确的外部信息源进行机器学习.注：该方法减少了对标注数据质量和数量的要求.3.1.16集成学习 en sembk lea rn in g通过结合多个学习器来解决问题的一种机器学习范式。注：其常见形式是利用一个基学习算法从训练集产生多个基学习器，然后通过投票等机制将基学习器进行结合.3.1.17主动学习 a ctive lea rn in g学习过程中由学习器挑选未标记样本，并请求外界提供标记信息，其目标是使用尽可能少的查询来取得好的学习性能。3.1.18迁移学习 tra n sfer lea rn in g利用一个学习领域A上有关学习问题T(A)的知识，改进学习领域B上相关学习问题T(

13、B)的学习算法的性能.3.1.19联邦学习 federa ted lea rn in g一种从多个数据源协同建立模型的机器学习框架，本地数据访问受限，各个数据源方独立进行本地数据处理，通过交换数据模型，共同建立其学习模型，并将输出结果反馈给用户。3.1.2 0训练 tra in in g基于机器学习算法，利用训练数据，建立或改进机器学习模型参数的过程。3.1.2 1交叉畛证 cross va lida tion一种利用已知数据集获取学习器最优参数，以期望在未知数据集上获得最佳泛化性能。注：常见的有留一法和K重交又验证法。3.1.2 2过拟合 overfittin g学习器对训练样本过度学习

14、，导致训练样本中不具有普遍性的模式被学习器当作一般规律，降低了泛化性能；典型表现是训练集上的性能越高，测试集上的性能越低。3.1.2 3欠拟合 un derfittin g学习器对训练样本学习不充分，导致训练样本中包含的重要模式没有被学习器获取，降低了泛化性能；典型表现是训练集上的性能可以继续提高，测试集上的性能同时得以提高.3YY/T 1833.12 0 2 23.1.2 4前馈网络 fecdfoi v/a rd n etwork在给定层内的各人工神经元之间既没有反馈路径也没有任何路径的多层网络。注：也可称为前向传播网络、非循环网给.来源：GB/T 52 71.342006,34.0 2

15、 .2 5,有修改3.1.2 5反向传播网络 ba ck-propa ga tion n etwork一种多层网络，它使用反向传播，以便学习期间的连接权调整.注：也可称为反馈传播网络.来源；GB/T 52 71.342006,34.0 2 .30 ,有修改3,1.2 6前馈传播 feedforwa rd propa ga tion在多层网络中，从输入层朝向网络的输出逐层进行连接权调整的传播。注：也可称为前向传播。来源：GB/T 52 71.34 2 0 0 6,34.0 3.16,有修改3.1.2 7反馈传播 feedba ck propa ga tion在多层网络中，从连接权调整输出层朝向网

16、络的输入的逐层传播。注：也可称为反向传播.来源：GB/T 52 71.342 0 0 6,34.0 3.17,有修改3.1.2 8医学知识库 medica l kn owledgeba se帮助临床科研人员、医务人员等快速、便捷地获取疾病诊断、治疗、用药等全面、系统、动态的脸床医学知识的集合，也可作为临床教学及临床诊疗的辅助参考工具.3.1.2 9算法服务 a lgorithm service算法在运行状态下提供的推理服务。注：算法服务接受用户的应用请求，对输入数据进行处理，返回处理结果。3J,30云服务 cloud service通过云计算已定义的接口，部署在云端服务器上提供的一种或多种能

17、力.来源:GB/T 32 40 02 0 15,3.2 .83.1.31边缘云服务 edge cloud service通过云计算已定义的接口，部署在边缘计算设施上提供的一种或多种能力。3.1.32本地服务 loca l service部署在终端或木地计算设施上提供的一种或多种能力.YY/T 1833J2 0 2 23.1.33人工智能医疗器械生存周期模型 A1MD lifecycle model人工智能医疗器械从起始到停运的整个演进过程的框架。注1：包括需求分析、设计与开发、验证与确认、部署、运维与监测、再评价直至停运.注2：在人工智能医疗器械生存周期中，某些活动可出现在不同的过程中，个别过

18、程可重复出现.例如，为了修复系统的隐错和更新系统，需要反复实施开发过程和部署过程.3.2 数据集术语3.2 .1数据da ta信息的可再解释的形式化表示，以适用于通信、解释或处理。注，可以通过人工或自动手段处理数据.来源:GB/T 52 71.1-2 0 0 0 ,0 1-0 1-0 23.2 .2个人敏感数据 person a l sen sitive da ta一旦泄露、非法提供或滥用可能危害人身和财产安全，极易导致个人名誉、身心健康受到损害或歧视性待遇等的个人信息。注：个人敏感信息包括身份证件号码、个人生物识别信息、银行账号、通信记录和内容、财产信息、征信信息、行踪轨迹、住宿信息、

19、健康生理信息、交易信息、14岁以下（含）儿童的个人信息等.来源：GB/T 352 732020,3.2 ,有修改3.2 .3健康数据 hea lth da ta与身体或心理健康相关的个人敏感数据。注：由于目前全球规定了不同的隐私合规性法律和法规.例如，在欧洲，可能需要采取的要求和参考变更为“个人数据”和“敏感数据”，在美国，健康数据可能会变更为“受保护的健康信息PHD”,这需要不同国家或地区的制造商进一步考虑中国当地的法律或法规。来源 JEC/TR 80 0 0 1-2 -2:2012,3.7,有修改3.2 .4缺失数据 missin g da ta按照研究方案要求收集但未观测到的数据。3

20、.2 .5数据元 da ta elemen t用一组属性规定其定义、标识、表示和允许值等的数据单元。来源：W5/T 30 52 0 0 9,3.1.6,有修改326元数据 meta da ta定义和描述其他数据的数据。来源：GB/T 18391.12 0 0 9,3.2 ,163.2 .7数据质量da ta q ua lity在指定条件下使用时，数据的特性满足明确的、隐含的要求的程度。5YY/T 1833.12 0 2 2来源：GB/T 2 50 0 0 .122 0 17,4.3,有修改3.2 .8数据集da ta set具有一定主题，可以标识并可以被计算机化处理的数据集合。来源:WS/T

21、30 52 0 0 9,3.1.2329训练集 tra in in g set用于训练人工智能算法的数据集，其外部知识源可用于算法数的计算。3.2 .10调优集 tun in g set用于优化人工智能算法的数据集,其外部知识源可用于算法*参数的选择。注；为避免勺医疗器械领域所用术语“确认”进行区分，这里不使用出川人工智能领域的validation set,二者含义一致.3.2 .11测试集 ter tin g set用于测试人工智能算法性能的数据集Jt外部知识源可用千对其法的评估.3.2 .12数据生存周期da ta life cycle数据获取、存储、整合、分析、应用、呈现、归档和销毁等

22、各种:在形态演变的过程.来源：GB/T 34960 .52018,3.7J3.2 ,13数据集偏倚 da ta set bia s数据集偏离预设目标的一种系统偏羌。3.2 .14数据质量特性 da ta q ua lity cha ra cteristic对数据质量有影响的数据质量属性的类别。来源：GB/T 2 50 0 0 .12 -2 0 17,4.43.2 .15数据层次 da ta stra tifica tion从不同粗细粒度表征的数据层次结构。注：一般包含以下层级：数据元素；记录（数据元素的汇集以数据集（记录的汇集）；多数据集（数据集的汇集）.来源：GB/T 352 952017,

23、2 .1.51,有修改3.2 .16参考标准 referen ce sta n da rd筛查、诊断和治疗过程或基于标注过程建立的基准。注：参考标麻可包含疾病、生理状态或生理异常以及位置和程度等信息标笠.6YY/T 1833.12 0 2 23.2 .17金标准 gold sta n da rd筛查、诊断和治疗可依据的最佳参考标准。3.2 .18GT 值 groun d truth；GT用于和算法结果进行比对的外部知识源。3.2 .19数据清洗da ta clea n in g检测和修正数据集合中错误数据项的预处理过程。3.2 .2 0数据治理 da ta govern a n ce数据资源及

24、其应用过程中相关管控活动、绩效和风险管理的集合。来源：GB/T 34960 .52 0 18,3.13.2 .2 1数据挖掘 da ta min in g对于定量数据，通过从不同视角和维度分析、分类并总结潜在的联系和影响,以此提取模式的计算过程。来源 JSO 16439:2 0 14,3,1313.2 .2 2数据标签 da ta la bel附加到一组数据元素的标识符。来源：1SO/IEC 2382:2015,2121626,有修改3.2 .2 3数据采集 da ta a cq uisition数据由生成装置按照数据采集规范生成，以数字化格式存储并传输到目标系统的过程。3.2 .2 4数据脱

25、敏 da ta ma skin g通过去标识化或匿名化，实现对个人敏感信息的可靠保护。3225匿名化 a n on ym iza tion通过对个人信息的技术处理，使得个人信息主体无法被识别或者关联，且处理后的信息不能被复原的过程。来源：GB/T 352 732 0 2 0 ,3.143.2 .2 6去标识化 de-iden tifica tion通过对个人信息的技术处理，使其在不借助额外信息的情况下，无法识别或者关联个人信息主体的过程。注：去标识化建立在个体基础上，保留了个体颗粒度，果用假名、加密、哈希函数等技术手段替代对个人信息的标识。来源：GB/T 352 732 0 2 0 ,3

26、.157YY/T 1833.12 0 2 23.2 .2 7数据标注 da ta a n n ota tion对数据进行分析，添加外部知识的过程.3228仲裁 a rbitra tion多名标注人员对同一原始数据的标注结果不一致时用于决定最终结果的过程。3.2 .2 9图像ima ge物体通过某种成像原理而重显的影像，并可数字化。注：图像一般以多维坐标系中像素点的位置对应实体点在空间中的位置，以像素点的像素值（或颜色）对应实体点的性质.如放射影像、分子影像、热影像、显微图像等。来源：GB/T 349522017,2 .4,有修改3.2 .30图形 gra phics用来表示一个变量相对于其他

27、变量变化情况的线条图，或用以代替文字说明一个概念和思想的图解和表格。注：如生理信号、基因组图谱等.来源：GB/T 349522 0 17,2 .33.2 .31文本 text以字符、符号,字、短语、段落、句子、表格或者其他字符排列形式出现的数据，旨在表达一个意义，其解释主要以读者对某种自然语言或人工语言的了解为基础。注：如电子病历的文本内容等.来源来B/T 52 71.12 0 0 0 ,0 1.0 1.0 33232数值 n umerica l va lue量化的数值或分类，用来表示水平或状态。注：如生理状态、生化指标等.3233音频 a udio一种数字化动态媒体形态,用于描述声音及其

28、时序性质，并可进行数字人工合成。来源：GB/T 349522017,2 .5,有修改3.2 .34视频 video一种数字化动态媒体形态，用于描述运动图像，进行高速信息传送或显示瞬间的相互关系。来源：GB/T 349522 0 17,2 .61注：如内窥镜影像、超声影像等.3235多媒体 multimedia综合表现文本、图形、图像、音频和视频的信息组合。8YY/T 1833.12 0 2 2来源：GB/T 349522 0 17,2 .13.3 质量特性术语3.3.1软件质 softwa re q ua lity在规定条件下使用时，软件产品满足明确或隐含要求的能力.来源：GB/T 2 50

29、0 0 .12 0 2 1,3.423.3.2软件质量保证 softwa re q ua lity a ssura n cea）为使某项目或产品遵循已建立的技术需求提供足够的置信度，而必须采取的有计划的和有系统的全部动作的模式.b）设计以估算产品开发或制造过程的一组活动。来源：GB/T 114572006,2 .12 94,有修改3.3.3性能 performa n ce系统或部件在给定的约束条件下实现指定功能的程度。来源：GB/T 114572006,2 .1131,有修改3.3.4性能评价 performa n ce eva lua tion为确定运行目标达到了何种有效程度而对系统或系统

30、部件的技术评价.来源：GB/T 114572 0 0 6,2 .1132 13.3.5可靠性 relia bility在规定时间间隔内和规定条件下，系统或部件执行所要求功能的能力。来源：GB/T 114572 0 0 6,2 .13343.3.6完整性in tegrity保护数据准确性和完备性的性质。来源：GB/T 2 50 0 0 .122017,4.12,有修改3.3.7一致性 con sisten cya）在文档或系统或系统部件的各部分之间，一致、标准化、无矛盾的程度。b）在数据集的各阶段、部分之间，一致、标准化、无矛盾的程度。来源：GB/T 114572006,2 .32 0 ,有修改

31、3.3.8重复性 repea ta bility由同一操作员按相同的方法、使用相同的测试或测量设施、在短时间间隔内对同一测试/测量对象进行测试/测量，所获得的独立测试/测量结果间的一致程度。来源：GB/T 3358.22009,335,有修改9YY/T 1833 J2 0 2 23.3.9再现性 reproducibility由不同的操作员按相同的方法,使用不同的测试或测ift设施，对同一测试/测星对象进行观测以获得独立测试/测量结果，所获得的独立测试/测量结果间的一致程度。来源:GB/T 3358.22009,3.3.10 ,有修改】3.3.10可达性 a ccessibility组成软

32、件的各部分便于选择使用或维护的程度。来源：GB/T 114572 0 0 6,2 .2 03.3.11可得性 a va ila bilitya）软件（系统或部件）在投入使用时可操作或可访问的程度或能实现其指定系统功能的概率.b）系统正常工作时间和总的运行时间之比。c）在运行时，某一配置项实现指定功能的能力。来源:GB/T 114572006,2 .115,有修改3.3.12保瞄性 con fiden tia lity数据对未授权的个人、实体或过程不可用或不泄露的特性。来源:CR/T 29246 2017,2 .12 ,有修改33.13网络安全 cybersecurity通过采取必要措施，防范对

33、数据、模型等攻击、侵入、干扰、破坏和非法使用以及意外事故，使设备处于稳定可靠运行的状态，以及保障数据、模型等的完整性、保密性、可得性的能力。来源：GB/T 22239 2 0 19,3.1,有修改3314安全性 sa fety免除于不可接受的风险。来源：YY/T 0 3162 0 16,2 .2 0 13.3.15健壮性 robustn ess者棒性/稳健性在存在无效输入或急迫的环境条件下，系统或部件其功能正确的程度。来源来 B/T 114572006,2 .1397,有修改3316泛化能力 gen era liza bility机器学习莫法对陌生样本的适应能力.3.3.17响应时间 res

34、pon se time在给定的测试环境下，对给定数量样本进行运算并获得结果所需要的平均时间。YY/T 1833.12 0 2 23.3.18可追溯性 tra cea bility系统对其决策过程及输出进行记录的特性。3.3.19公平性 fa irn ess系统做出不涉及喜好和偏袒决策的性质。3.3.2 0可解释性 expla in a bility以人能理解的方式,对系统决策因素进行说明的能力。3.4 质置评价术语3.4.1 评价方式3.4.1.1性能测试 performa n ce testin g评价系统或部件与规定的性能需求的依从性的测试行为。来源：GB/T 114572 0 0 6,2

35、 .11353.4.1.2独立性能测试 sta n da lon e performa n ce testin g通过直接比对模型在没有外界干预的情况下产生的结果和参考标准的结果，评估人工智能医疗楣械的性能。3.4.1.3判读者性能测试 rea der performa n ce testin g通过比对判读者在独立工作和结合模型工作两种状态下判读数据的结果，评估人工智能医疗器械的性能。341.4多判读者多病例研究 multi-rea der multi-ca se study通过判读人员和病例的某种交叉组合方式开展的判读者性能研究，评估人工智能医疗器械的性能。 3.4.1.5黑盒测试 b

36、la ck-box testin g忽略系统或部件的内部机制只集中于响应所选择的输入和执行条件产生的输出的一种测试。来源：GB/T 114572 0 0 6,2 .142 ,2 .6693.4.1.6白盒测试 gla ss-box testin g侧重于系统或部件内部机制的测试。类型包括分支测试、路径测试、语句测试等。来源：GB/T 114572 0 0 6,2 .678.2 .160 43.4.1.7对抗措施coun termea sure为减小脆弱性而采用的行动、装置、过程、技术或其他措施.来源：GB/T 2 50 692 0 10 ,2 .1.411YY/T 1833 J2 0 2 23

37、.4.1.8对抗样本 a dversa ria ! sa mple基于原始数据上添加扰动达到混淆系统判别目的的新样本。3.4.1.9对抗测试 a dversa ria l test使用对抗性样本开展的测试，或采用不同目标样本分布的特选数据作为压力数据集进行的测试。3.4.2 评价指标342 .1阳性样本 positive sa mple由参考标准确定为带有某一种或几种特定特征的样本。3.4.2 .2阴性样本 n ega tive sa mple除阳性样本以外的样本.3.42 3直阳性 true positive；TP被算法判为阳性的阳性样本。342 .4假阳性 fa lse positive；

38、FP被算法判为阳性的阴性样本a3.42 5真阴性 true n ega tivejTN被算法判为阴性的阴性样本。342 .6假阴性 fa lse n ega tive；FN被算法判为阴性的阳性样本.342 .7目标区域 ta rget region根据参考标淮.从原始数据中划分出的若干个包含特定类别目标的最小数据了集（子集元素为像素、体素等兀3.42 8分割区域 segmen ta tion region从原始数据中划分出的若干个包含特定类别目标的最小数据子集（子集元素为像素、体素等）. 342 .9病变定位 lesion loca liza tion算法检出病变位置正确标识出参考标准确定的

39、病变位置。3.4.2 .10非病变定位 n on -lesion loca liza tion算法检出病变位置未能正确标识出参考标准确定的病变所在位置。12YY/T 1833.12 0 2 23.4,2 .11病变定位率 lesion loca liza tion ra te病变定位数量占由参考标准确定的全体病变数量的比例。3.4.2 .12非病变定位率 n on -lesion loca liza tion ra te非病变定位数地占全体病例数量的比例，非病变定位率可以大于1.3.4.2 .13假阳性率 fa lse positive ra te假阳性病例数量（阴性病例中包含非病变定位）占全

40、部阴性病例数量的比例.3.4.2 .14灵敏度 sen sitivity召回率（查全率）reca ll真阳性样本占全体阳性样本的比例。3.4.2 .15特异度 specificity真阴性样本占全体阴性样本的比例。3.4.2 .16漏检率 miss ra te1减去灵敏度。3.4.2 .17精确度（查准率）precision阳性预测值 positive prediction va lue真阳性样本占被算法判为阳性样本的比例。3.4.2 .18阴性预测值 n ega tive prediction va lue真阴性样本占被算法判为阴性样本的比例。3.4.2 .19准确率 a ccura cy算

41、法判断正确的样本占全体样本的比例.3.4.2 .2 0Fi 度量 F1 -mea sure召回率和精确度的调和平均数。3.4.2 .2 1约登指数 Youden in dex灵敏度与特异度之和减去1。3.4.2 .2 2受试者操作特征曲线 receiver opera tin g cha ra cteristics curve；ROC curve以假阳性率为横坐标、真阳性率为纵坐标，根据算法在不同阈值设定下对于给定的测试集得到的一系列结果绘制的曲线.13YY/T 1833.12 0 2 23.4.2 .2 3自由响应受试者操作特征曲线 freerespon se receivci opera

42、 tin g cha ra cteristics curve；FROC curve以非病变定位率为横坐标、病变定位率为纵坐标，根据”法在不同阈值设定下对于给定的测试集得到的一系列结果绘制的曲线。3.42 2 4候选自由受试者操作特征曲线 a ltern a tive free receiYCi o,白上；g cha ra cierktics curve；A1?ROC curve以假阳性率为横坐标、病变定位率为纵坐标，根据算法在不同周优设定下对于给定的测试集得到的一系列结果绘制的曲线。3.4.2 .2 5精确度-召回率曲线 precision -reca ll curve； P-R cur

43、vr以召回率为横坐标、精确度为纵坐标,根据算法在不位设定下对于给定的测试集得到的一系列结果绘制的曲线。3.4.2 .2 6曲线下面积 a rea un der curve；AUC曲线下与坐标轴围成的积分面积。3.4.2 .2 7平均精确度 a vera ge precision ；AP精确度-召回率曲线下与坐标轴围成的积分面积。3.4.2 .2 8平均精确度均值 mea n a vera ge precision；MAP在多目标检测问题上，算法对于各类目标的平均精确度的平均值.3.42 2 9交并比 in tersection over un ion；IoU分割区域与目标区域的交集占分割区域

44、与目标区域井煲的比例。注：也可称为Jaccard系数。3.4.2 .30Dice 系数 Dice coefficien t分割区域与目标区域的交集占分割区域与目标区域平均值的比例。342 .31中心点距离 cen tra l dista n ce分割区域中心与目标区域中心的距离，该指标反映两个集合的接近程度。3.4.2 .32混淆矩阵 con fusion ma trix一种矩阵，它按一组规则记录试探性实例的正确分类和不正确分类的个数.注1；通常矩阵的列代表人工智能的分类结果，而矩阵的行代表参考标度的分类结果，附录A给;。示例.注2：也可称为含混矩阵.L来源：GB/T 52 71.312006

45、,31.0 2 .18,有修改3.4.2 .33Ka ppa 系数 Ka ppa coefficien t一种用于评价结果一致性的指标。14YY/T 1833.12 0 2 23.42 34信噪比 sign a !-to-n oise ra tiojSNR信号平均功率水平与噪声平均功率水平的比值。342 .35峰值信噪比 pea k sign n l-to-n oisc ra tio信号最大可能功率水平与噪声平均功率水平的比值，3.4.2 .36结构相似性 structura l simila rity一种衡量:两幅图像相似度的指标。3.4.2 .37余弦相似度 cosin e simila

46、rity通过测鼠两个向圻的夹角的余弦值来度Ill它们之间的相似性。3.42 38困惑度 perplexity度量概率分布或概率模型的预测结果与样本的契合程度，困惑度越低则契合越准确。3.4.2 .39字错率 word error ra te将识别*来的字辐要进行修改的字数与总字数的比值。3.4.2 .40交叉嫡 cross-en irojiy一种度量两个概率公布之间差异的指标。3.42 41互信息 mutua l in fon n a tion对两个随机变量间相互依赖性的量度。3.4.2 .42服务可用性 service a va ila bility服务客户发起服务请求后，服务可访问的时间占

47、总服务时间的比例。注：服务可用性的计算是在一系列预定义的时间段中，服务可用时间之和占预定义时间段之和的比例，可排除允许的服务不可用时间。3.5应用场景术语3.5.1计算机辅助 computer-a ided涉及使用计算机完成部分工作的技术或过程.来源：ISO/IEC 2 382 :2 0 15,2 12 13953.5.2计算机辅助诊断 computer-a ided dia gn osis辅助判断患者是否患病、疾病的类型、/1K重程度、发展阶段干预措施等。注：计算机辅助诊断旨在提供除计算机辅助检测结果之上的额外信息，这些信息包含对患者是否患病、疾病的类曳、严重程度、发展阶段、干预措施等作

48、出的判断。15YY/T 1833.12 0 2 2353计算机辅助检测 computeia ided detection通过检测、标记、强调或其他方式辅助医务人员注意医疗数据的可能异常情况。其结果供医务人员参考。3.5.4计算机辅助分诊 computer-a ided tria ge自动分析医疗数据、给出初始解秫和鉴别分类、轴地医务人员确定患者优先级。注：导诊不属于计算机辅助分诊。355临床决策支持 clin ica l decision support根据临床知识和患者数据产生辅助决策的建议，该建议由医务人员使用。注：在不同的国家和地区，临床决策支持系统可能不属于废疗器械。3.5.6患者决

49、策辅助 pa tien t decision a ssista n t向患者提供建议或辅助决策，该决策由非医务人员使用，结果仅供参考。注：在不同的国家和地区，患者决策辅助系统可能不属于医疗器械.357计算机视觉 computer vision人工视觉 a rtificia l vision功能单元获取、处理和解释可视数据的能力。来源 rGB/T 52 71.2 82 0 0 1,2 8.0 1.19358语音识别 speech recogn ition自动语音识别 a utoma tic speech recogn ition jASR通过功能单元对人的语音所表示信息的感知与分析。来源：GB/

50、T 52 71.2 82 0 0 1,2 8.0 1.15359自然语言处理 n a tura l la n gua ge processin g自然语言理解和生成及其衍生技术，以从文本化的人类语言中获取有意义的信息。3510知识图谱 kn owledge gra ph将海量知识及其相互联系组织在一张大图中，用于知识的管理、搜索和服务。3.5.11医学图像处理 medica l ima ge processin g一类对医学图像进行处理的方法。注：包括图像重建、成像加速、图像增演、图像恢复（降噪、去伪影）、图像分割、图像配准、图像识别、图像分类目标检测、图像映射、图像可视化等,根据医疗器械应

展开阅读全文

YY∕T 1833.1-2022 人工智能医疗器械 质量要求和评价 第1部分：术语[医药].pdf

YY∕T 1833.1-2022 人工智能医疗器械质量要求和评价第1部分：术语[医药].pdf