1、收稿日期:2023-01-05摇 摇 摇 摇 摇 摇 修回日期:2023-05-09基金项目:国家自然科学基金地区项目(62062050)作者简介:陈宇斌(1977-),男,副教授,硕导,研究方向为物联网及高性能计算;通讯作者:崔玉红(1997-),女,硕士研究生,研究方向为物联网与大数据;梁启军(1969-),男,副教授,硕导,博士,研究方向为中西医结合理论和临床、中医药防治肺系疾病、中医药防治恶性肿瘤。基于光电信号生理参数预测研究综述陈宇斌1,2,崔玉红1,2,梁启军3,邓皓明1,2(1.南昌航空大学 软件学院,江西 南昌 330063;2.物联网与大数据实验室,江西 南昌 330063;
2、3.江西中医药大学附属医院肺病科,江西 南昌 330006)摘摇 要:由于光电信号(PPG)传感器具有身形小巧、佩戴方便等特点,基于其的研究备受欢迎。该文旨在阐述 PPG 信号在生理参数预测中的应用价值,并介绍传统机器学习算法和深度学习算法在各种生理参数上的研究进展。PPG 采集的便利性将有助于多场所健康监测和疾病预防的应用。通过总结近年来 PPG 在各种生理参数估计方面的研究成果,提出了不同的生理参数的估计算法,推动了诊断方式的发展。主要从 3 个方面展开:首先,对包含 PPG 的现有数据集进行整理,以展示不同数据集的信号数量以及所包含的其他种类信号,帮助研究人员查找和利用数据集;其次,对数
3、据预处理方式进行概括,分析了不同预处理方法的优缺点,并提出改进方法以减少 PPG 信号在采集过程中受到的外界干扰;最后,对不同生理参数的预测算法进行了比较和分析,分模块概括介绍了不同生理参数的预测算法。关键词:PPG;机器学习;生理参数;健康监测;预测中图分类号:TP311摇 摇 摇 摇 摇 摇 摇 文献标识码:A摇 摇 摇 摇 摇 摇 文章编号:1673-629X(2023)12-0023-09doi:10.3969/j.issn.1673-629X.2023.12.004A Review of Prediction of Physiological Parameters Based onP
4、hotoplethysmographyCHEN Yu-bin1,2,CUI Yu-hong1,2,LIANG Qi-jun3,DENG Hao-ming1,2(1.School of Software,Nanchang Hangkong University,Nanchang 330063,China;2.Internet of Things and Big Data Laboratory,Nanchang 330063,China;3.Pulmonology,Affiliated Hospital of Jiangxi University of Traditional Chinese Me
5、dicine,Nanchang 330006,China)Abstract:The research based on photoplethysmography(PPG)sensors is particularly well-liked due to its properties,such as small sizeand ease of wear.We seek to demonstrate the usefulness of PPG signal in the prediction of physiological parameters and introduce the re鄄sear
6、ch progress of traditional machine learning algorithms and deep learning algorithms on various physiological parameters.The use ofmulti-site disease prevention and health monitoring will be made easier thanks to the convenience of PPG collecting.We provide severalphysiological parameter estimation a
7、lgorithms by summarizing the research findings of PPG in recent years,which support theadvancement of diagnostic techniques.This paper is mainly carried out from three aspects.Firstly,the existing datasets containing PPGare sorted out to show the number of signals in different datasets and other typ
8、es of signals included,to help researchers find and usedatasets.Secondly,the data preprocessing methods are summarized,the advantages and disadvantages of different preprocessing methodsare analyzed,and an improved method is proposed to reduce the external interference received by the PPG signal dur
9、ing the acquisitionprocess.Finally,the prediction algorithms of different physiological parameters are compared,analyzed and summarized by sub-mod鄄ules.Key words:photoplethysmography;machine learning;physiological parameter;health monitoring;prediction0摇 引摇 言基于光电容积(PPG)的脉搏采集设备成本低廉、外观小巧、携带方便,被广泛应用于血压
10、、心率、房颤、呼吸频率等生理参数的采集工作中。PPG 信号通过第 33 卷摇 第 12 期2023 年 12 月摇 摇 摇 摇 摇 摇 摇 摇 摇 摇计 算 机 技 术 与 发 展COMPUTER TECHNOLOGY AND DEVELOPMENT摇 摇 摇 摇 摇 摇 摇 摇 摇 摇Vol.33摇 No.12Dec.摇 2023对生理参数的预测,直观地反映身体状况,在日常监测和辅助医生诊断方面大有可为。基于 PPG 的血压预测1-3、心 率 预 测4-6、房 颤 预 测7-8、呼 吸 频 率 预测9-11的研究越来越多。PPG 主要传达了与心脏脉动同步的血液体积变化的信息,它可以简单地使用
11、接触式指夹或可穿戴式传感器来测量。此外,它还可以通过提供远程 PPG 信号的摄像头进行远程估计。无论是接触式还是远程PPG 信号,已经证明 PPG 信号可以用来估计重要的生理生命体征,如血压(BP)1214、心率、房颤、呼吸频率、氧饱和度和血红蛋白水平,甚至多电极心电图(ECG)信号,也可以通过 PPG 信号推断出来。由于生物医学数据集的公开可用性,通过深度学习模型评估各种生理参数才得以推广。然而,在收集和归档时忽略信号质量,所以在进一步部署前需要进行有效的清理。因此,许多技术被引入到数据清理和异常/伪装检测中1517。1摇 数据集机器学习需要大量的数据来训练模型,尤其是训练深度网络时。数据集
12、是实验的一部分,丰富的数据能增强模型的泛化能力,提高实验的鲁棒性。在进行机器学习时,数据集一般会划分为训练集和测试集,很多时候还会划分出验证集。PPG 是借助光电手段检测血液容积变化的一种无创检测办法。每次心跳时,血管的收缩和扩张都会影响光的透射或是光的反射。一定波长的光束照射到指端皮肤表面,光线透过皮肤组织然后反射到光敏传感器,光照会有一定的衰减。正是由于动脉对光的吸收有变化而其他组织对光的吸收基本不变,把光信号转换成电信号,得到的信号就可以分为直流信号和交流信号。提取其中的交流信号,就能反映血液流动的特点。相比于心电图信号,PPG 可以进行长时间连续监测,具有成本低,易获取且在采集过程中受
13、试者不会感觉到身体异样等特点,所以近年来对于 PPG 的研究逐渐盛行起来。PPG 数据集从是否可以被直接获取的角度分为公开数据集和非公开数据集。公开数据集满足科研人员对大量实验数据的需求,推动机器学习与医学领域的结合。非公开数据集数据容量相对较少,一般由实验室自主寻求实验合作者,根据实验的特性选择合适受试者进行数据采集。1.1摇 公开数据集从文献中了解到 PPG 数据集由公开数据集和非公开数据集组成,公开数据集可以直接下载使用,非公开数据集属于实验室私有。就目前公开的 PPG 数据集而言,MIMIC 是包含参与者数量最多的数据集,其中 MIMIC II 的数据是 2001 2008 年间贝斯以
14、色列迪康医学中心重症监护室中病人的医疗数据,其中包括26 870 名成人住院者。MIMIC III 在 MIMIC II 基础上扩充数据集容量,它涵盖 2001 年 6 月 2012 年 10 月重症监护室 病 人 数 据,包 括 53 423 名 成 人 患 者。MIMIC IV 在 MIMIC III 的基础上增加了 2012 年到2018 年的重症监护病房的数据,与前两个 MIMIC 不同的是采用模块化方法进行数据组织,突出数据的来源并促进不同数据源的单独和组合使用。MIMIC18作为一个免费公开的数据库,包含了大量 PPG 信号和动脉血压信号。该数据集包含 12 000 条不同长度的记
15、录。每条记录包括 ABP(有创动脉血压)、PPG(来自指尖的光体积变化描记图)和 ECG(来自通道 II 的心电图)信号。数据采样频率为 125 Hz,以 8 位精度记录。昆士兰大学生命体征数据集(The University ofQueensland Vital Signs Dataset)涵盖了更广泛的生命体征。大多数病例包括来自心电图仪、脉搏血氧仪、二氧化碳图、无创动脉血压监测仪、气道流量和压力监测仪的数据,在少数情况下,还包括从 Y 型肺活量计、脑电图监测仪和动脉血压监测仪采集的数据。该数据集记录了澳大利亚皇家阿德莱德医院接受麻醉的 32 名手术患者,持续时间从 13 分钟到 5 小时
16、不等19。部分研究利用了昆士兰大学生命体征数据库作为实验的部分数据集对血压进行评估20-21。IEEE 信号处理杯(SPC)数据集在许多研究中被使用22-24,该数据集记录了持续 5 分钟的 PPG 信号,同时记录了手腕处的三轴加速度信号以及心电信号。数据集采集过程中 20 名受试者进行 3 种类型的活动。首先,受试者 1 12 执行在跑步机上以以下速度行走或奔跑:1 2 km/h,持续 0.5 分钟,6 8 km/h,持续 1分钟,12 15 km/h,持续1 分钟,6 8 km/h,持续1 分钟,12 15 km/h,持续 1 分钟,1 2 km/h,持续 0.5 分钟。受试者用带有腕带的
17、手拉衣服,在额头上擦汗,然后在跑步机上按下按钮。第二,由受试者 14,15,18 和20 进行前臂/上臂练习,例如,握手、伸展、推、跑步、跳跃、跳和俯卧撑。最后,由受试者 15,16,17,18 和 19执行涉及强烈的手臂运动,例如拳击。WESAD 是一个多模态的数据集,具有生理和运动的数据,可用于可穿戴式压力和影响检测。该数据集是用腕戴式设备收集 PPG、加速度计、皮肤电活动和体温,胸戴式设备收集心电图、加速计、肌电图、呼吸和体温。15 名受试者参加了数据的收集,每人的数据采集时间约为 100 分钟。数据集记录的目的是检测和区分不同的情感状态(中性、压力、娱乐)。因此,与 SPC不同,WES
18、AD 是在受试者久坐的状态下采集的25。42摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 计算机技术与发展摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 33 卷健康志愿者构建的 Vortal 包含从 18 39 岁年轻受试者和 70 岁以上老年受试者中获得的 ECG,PPG,阻抗呼吸描记(IP)和参考口鼻压力信号26。在仰卧休息时从每个受试者处采集大约 10 分钟的数据。此外,在步行、跑步和仰卧时从年轻受试者身上采集数据,然后待状态平稳时再次采集年轻受试者的数据。CapnoBase 包含 PPG 记录和二氧化碳图数据27,均以
19、 300 Hz 采样。数据集中的病例是从选择性手术和常规麻醉期间收集的大量生理信号中随机选择的。该数据集包含 29 名儿科和 13 名成人患者的 42 段 8分钟的持续时间记录,其中包含自主呼吸和受控呼吸下的高质量记录。本数据集将二氧化碳波形图作为CapnoBase 的黄金标准,同时研究助理手动标记了呼吸周期,并且根据连续呼吸之间的时间计算了参考呼吸率值。BIDMC 是从 MIMIC-II 资源中提取的28,由 53名成人重症监护患者的 PPG 记录和同步 IP 呼吸信号组成,记录时间约为8 分钟,采样率均为125 Hz。每条记录的 IP 波形作为参考呼吸,其中 IP 信号中的每个呼吸周期由两
20、名研究助理独立手动注释,两组注释都用于计算参考呼吸频率值。PPGDalia 包括 8 种不同的活动29,这些活动在日常生活中进行,包括低强度的驾驶、中等强度的步行和高强度手臂运动的桌上足球活动。同时进行周期性的步行或下楼梯和非周期性体育活动进食或桌上足球。此外,为了产生高度可变的心率,选择需要不同体力的活动开车与上楼梯。该数据集有 15 名参与者,每位参与者接受 150 分钟的数据监测。数据分别由胸戴式和腕带式设备记录,其中胸戴式设备采集心电信号、三轴加速度、呼吸等数据,腕带式设备采集 PPG、三轴加速度、皮肤电活动、体温等数据。除了通过参与者采集数据这一方式外,还可以通过算法模拟生理参数,合
21、成数据集。在文献30中包含大约 15 小时的 PPG 数据。来自合成数据集的数据是根据理想化 PPG 使用基线漂移、振幅调制和频率调制来调制的。1.2摇 非公开数据集除了公开数据集,还有实验室收集的数据,通常这部分数据是不公开的。这类数据的采集设备可能是实验室设计的设备,也可能是市面上封装好的设备。指环状可穿戴设备(CART)已被开发用于收集和分析来自手指的 PPG 信号31。使用嵌入内部的高强度绿色发光二极管和光电二极管,基于反射法测量。通过CART 收集受试者 PPG 信号可以与研究所用的智能手机直接相连接。Chan 等人详细描述的独立数据集是在普通门诊使用智能手机从 1 013 名参与者
22、中获取的 3 039 个PPG 波形数据32。PPG 波形的采样频率为 30 Hz,测量时间持续 17 s。表 1摇 公开数据集参与者数量比较数据集信号参与者样本数量MIMICABP,PPG,ECG61 532 名12 000 条TUQVSDPPG,ECG,CO2等32 名3 480 minSPCPPG20 名100 minWESAD脉搏、心电、呼吸15 名约 1 500 minVortalPPG,ECG,IP39 名390 minCapnoBasePPG,ECG,CO242 名336 minBIDMCPPG,ECG53 名约 424 minPPGDaliaPPG,ECG,呼吸等15 名2 1
23、60 min摇 摇 临床医生注释数据集(clinician-annotated)由 402个连续的 PPG 记录组成33,这些记录来自 29 个自由生活的受试者。每个连续 PPG 记录平均为 8 小时。在这 29 名受试者中,13 人在整个记录过程中都有持续的房颤,2 人有持续的正常窦性心律,其余 14 人显示出随时间变化的心率,包括除房颤和窦性心律意外的心律失常。NSR 数据集由 341 份连续的 PPG 记录组成,这些记录来自 53 名健康的自由生活的受试者。这两个数据集都是由三星的穿戴设备以 20 Hz 的采样频率收集。使用有监督的深度学习方法需要为数据提供标签,大部分实验在估计血压时使
24、用动脉血压(ABP)来标注。而对于心率评估和房颤评估而言,标签一般由ECG 来标注。用于呼吸频率估计的数据集不同,标注信号会跟随数据集发生改变。BIDMC 用胸阻抗标注,CapnoBase 用二氧化碳图标注,Vortal 使用阻抗肺图和口鼻压力信号标注。2摇 PPG 信号预处理对于深度学习而言,预处理所花费的精力是相对较少的。在数据信噪比较高的情况下无需做任何预处理,可以将原始的 PPG 信号作为深度学习模型的输入,但 PPG 信号受到噪声影响时需要进行预处理。数据预处理阶段对噪声过滤的操作方法非常丰富34。例如:自适应滤波35、基于小波的去噪、独立分量分析36、经验模态分解、时频分析、频谱减
25、法37。光电信号与噪声信号拟合在一起变成带有噪声的信号,在采集 PPG 信号的过程中因为噪声信号是低频的,所以可以根据小波变换的特性将光电信号和噪声信号分解开。小波变换是将分解系数设置为零来消除低频率和高频率分量的,软阈值小波变换被广泛应用于小波去噪。使用小波变换的预处理方式可能会导致信号中信52摇 第 12 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 陈宇斌等:基于光电信号生理参数预测研究综述息丢失,从而对模型的分类性能产生极大的影响。一些研究尝试将 PPG 转换成二维灰度图。虽然灰度图保持了原始数据的完整性,但信号中的频率信息却没有得到充分反映。傅里叶变换(FT)将信号从时域转换到频域,
26、将信号所包含的频率信息作为一个整体。传统傅里叶变换(FFT)通过带通滤波器消除特定频率。然而,此方法忽略了时域信息。时频分析可以克服上述数据处理方法的缺点。时间-频率分析的基本思想是设计一个时间和频率的联合函数38,同时描述信号在不同时间、频率的能量密度或强度。将时间和频率结合起来,有利于对信号进行全面处理。基于频谱方法的核心思想是区分周期性的心率产生信号与运动产生信号,由运动衍生的时间-频率频谱来支持。例如,基于同时记录的加速度信号来获取相对干净的信号。基于这种频谱分析,最近开发了几种方 法,如 IMAT39,SpaMa40,WFPV41和 MC-SMD42。然而,从时频频谱中提取心率在目前
27、的方法中是很麻烦的,因为它们是高度参数化的,并且是为特定场景量身定做的。将深度学习方法用于信号质量的评估已经受到广泛关注。在相关文献中使用粗略清理和精细清理分步方法对数据进行预处理。首先,粗略清理利用温和阈值方法排除具有突出异常的信号,然后,精细清理使用PCA 阈值法对数据进行进一步清理43。模型输入有所不同,除了将原始数据作为输入外,还可以将原始数据转化为图片作为输入。基于时间序列的深度学习模型由完全卷积块、shuffle 层、注意力LSTM 层和全连接层串联而成,其中完全卷机块由 3个时间卷积块组成。基于图像的深度学习网络包括VGG19,Xception,ResNet18 和 ResNet
28、50。为了分析训练集大小对分类性能的影响,分别使用 10%,50%,100%的原始数据作为模型输入,对基于特征的 SVM分类器、基于时间序列的深度学习模型和基于图像的深度学习模型进行比较。在 10%数据时 SVM 率先展现良好的准确率,随着数据量的增加 ResNet18 展现出最佳的性能44。同样将图片作为输入的还有具有卷积层、激活层、dropout、最大池层、全连接层的网络架构45以及由 LSTM、Bi-LSTM、卷积层、密度层堆叠的网络架构46。将原始信号转变成图片提取特征具有不错的实验效果。采集过程中受到噪声干扰,容易产生不符合范围的生理信号,对于不同的生理参数的估计,使用阈值法排除质量
29、较差的 PPG 信号周期。在保持数据质量的情况下对数据进行下采样来减少模型的计算复杂度。医学信号非常难获取,并且标签需要有经验的医生标注,所以能够被研究使用的数据较少,而深度学习模型的训练需要大量数据,所以可以通过数据扩充来增加数据数量38。数据扩充通过 3 个基本过程来实现,分别为缩放、添加随机高斯噪声以及随机改变振幅。缩放是指将 PPG 数据乘以从正态分布中获得的随机标度器。添加随机高斯噪声是指将 PPG 中的每个数据点与从正态分布中随机获得的不同数值相加。随机改变振幅是指将 PPG 的数据点与随机产生的高斯过程回归曲线相乘。周期分割能够丰富数据集,一些实验在存在伪影和失真的情况下提供准确
30、的 PPG 节拍分割47-48。使用峰值检测法将单个脉冲分离出来完成周期分割,使用动态时间扭曲、时间上的零填充和频率上的插值方法填充获得相同的特征长度49。3摇 基于 PPG 的生理参数预测即使在技术进步的今天,心血管疾病仍然是发病率和死亡率最具威胁性的原因之一,严重损害了老龄人口的健康。因此,持续的监测是必不可少的。然而,随着患者数量的不断增加,专业的医生数量不能满足患者需求,所以自动化监测方法似乎是唯一可行的应对危机方法。基于 PPG 的生理参数预测被广泛使用。3.1摇 血摇 压卷积神经网络(CNN)最初是为捕捉具有可变性的二维数据设计的。后来的研究证明卷积神经网络在一维数据上也表现良好。
31、CNN 从输入中提取最佳特征集,长短期记忆(LSTM)网络捕获提取功能中的时间相关性,两者结合可以创造更具鲁棒性的网络结构。CNN 与由两个相同的 LSTM 模块串联成的 LSTM 网络堆叠在一起形成深度学习模型50。运用上述模型对比不同数据集预测的性能,在 MIMIC-II 中随机抽取的 20 名受试者中,对收缩压(SBP)和舒张压(DBP)值的预测误差分别为 3.70依3.07 mmHg 和 2.02依1.76 mmHg。在UQVSD 上,SBP 和 DBP 的预测误差分别为 3.70 依3.07mmHg 和 2.02依1.76 mmHg。用 LSTM 和 GRU 单元取代传统的循环神经网
32、络(RNN)单元,可以更好地解决深度神经网络训练过程中出现的梯度消失问题。皮尔逊相关系数评估每对特征之间的线性关系,最大信息系数评估特征和血压之间的非线性关系。经过以上两种相关性评估,可以将52 个输入特征减少至 24 个。双向层有助于网络通过按前后顺序处理输入序列来捕捉更多信息。由一个双向 RNN 层(Bi-RNN)、n 个单向 RNN(uni-RNN)层和一个注意层组成的模型预测血压。为了增强训练网络重要信息的隐藏状态的能力,利用注意力机制来进一62摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 计算机技术与发展摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
33、 摇 摇 摇 摇 摇 摇 摇 第 33 卷步提高模型的性能51。基于 PPG 的血压诊断算法性能比较如表 2 所示。表 2摇 基于 PPG 的血压诊断算法性能比较文献数据集算法SBP(MAE依SD)DBP(MAE依SD)Tazar 等50MIMICII/UQVSDCNN+LSTM(2)+MLP3.70依3.072.02依1.76El-Hajj 等51MIMICIIBi-RNN+uni-RNN+attention4.51依7.812.6依4.41Ghosh 等52MIMICCatBoost5.37依8.692.96依4.39Huang 等54UQVSDMLP-BP-lstm2.47依3.522.
34、13依3.07摇 摇 CatBoost 是一种以对称决策树为基学习器实现的梯度提升决策树(GBDT)框架。首先使用半经典信号分析技术重构算法,这样可以平衡重建复杂性和准确性,然后将重建信号的光谱特征、PPG 和二阶导数的形态特征作为 CatBoost 监督算法输入预测血压。该方法的收缩压和舒张压的平均绝对误差分别为 5.37mmHg 和 2.96 mmHg52。MLP-Mixer 包含两种类型的层53,一种是将多层感知机独立应用于图像块,另一种是跨块应用多层感知机,这是一种完全基于多层感知器的架构。MLP-BP-lstm 由 LSTM、MLP-Mixer、卷积层全连接层构成54,此网络能够预测
35、的舒张压平均绝对误差为 2.13依3.07,收缩压平均绝对误差为 3.52依5.1。3.2摇 心摇 率相比于心电图测量设备,PPG 采集设备具有明显的优势,它外形小巧,成本低廉,是可穿戴设备的流行选择。与传统的心电图数据相比,基于 PPG 信号的心率估计更具挑战性。用户的身体活动容易引起运动伪影,从而导致 PPG 信号的质量降低。为了提高准确率,研究人员对训练模型进行改进,以期获取更加有利于心率预测的模型。在文献55中提出一个基于多类和非统一多标签分类的 9 层深度神经网络用于估计心率,该网络由一个二维卷积层、一个一维卷积层、一个扁平化层、一个连接层、一个全连接层、两个 LSTM 层、一个全连
36、接层、一个 softmax 激活层按顺序堆叠而成。后续提出了一个由 16 个卷积层堆叠而成的网络架构,使用基于频谱分析的校准来估计最终的 HR。上述方法在 IEEE信号处理杯训练数据集上实现了平均 1.98 bpm 的绝对误差56。基于 PPG 的心率诊断算法性能比较如表 3 所示。表 3摇 基于 PPG 的心率诊断算法性能比较文献数据集算法平均绝对误差/bpmChung 等55ISPC+BAMI-ICNN(2)+LSTM(2)1.46Chang 等56SPCCNN1.98Chang 等57SPCDCNN1.61摇 摇 DeepHeart 具有基于深度学习的去噪和基于频谱分析的校准功能。该模型
37、首先从心电图信号生成干净的 PPG 信号,使用受污染的 PPG 信号及其相应的干净PPG 信号训练一组去噪卷积神经网络(DCNN)。然后,受污染的 PPG 信号被一组 DCNN 去噪,并执行基于频谱分析的校准以估计最终的 HR。DCNN 由16 个卷积层堆叠而成,在第 1 层后进行激活操作,第 2 到第15 层卷积操作后进行批量归一化和激活,第 16 层卷积操作后输出57。3.3摇 房摇 颤心房颤动(AF)是中风的主要原因,它会增加心肌梗塞、慢性肾病、痴呆和死亡的风险。临床上隐匿性AF 经常在早期时不容易被感知,因此,需要准确检测无症状 AF 的方法。在过去的几年里,基于 PPG 的房颤检测已
38、经得到了重视。早期尝试利用手工制作的关于 PPG 心跳间期的特征进行检测。关于基于 PPG 的房颤检测算法的工作主要依赖于明确的规则和手工制作的特征,这些特征来自 PPG 波形的间隔序列,目的是捕捉脉搏不规则性,这也是房颤的标志。判断心房颤动的方法包括变异系数58、样本熵系数59、归一化连续差异均方根和香农熵60、庞加莱绘图模式61和使用 SVM 的自相关性分析。最近提出基于 PPG 的深度神经网络检测房颤62。许 多 著 名 的 深 度 学 习 模 型,如 VGGNet63,GoogLeNet64和 Microsoft ResNet 都在国际分类比赛中取得了优异的成绩,它们提供了许多解决问题
39、的方法。CNN 在提取特征方面展现优势,在参数相同的情况下,依靠分组卷积展现比其他先进卷积网络更好的能力。分组卷积的每个区块由 3 个卷积层组成,首先使用核大小为 1 的卷积瓶颈层来减少特征图的数量,然后使用核大小为 9 的分组卷积层在每个区块中提供更多的表达能力,最后使用内核大小为 1 的卷积层恢复原始特征图的数量。该网络的 16 个块被分组为 4个阶段,每个阶段分别包含 3,4,6 和 3 个块。特征图在每个阶段的第一个块的分组卷积层处进行下采样。基于 PPG 的房颤诊断算法性能比较如表 4 所示。72摇 第 12 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 陈宇斌等:基于光电信号生理参
40、数预测研究综述表 4摇 基于 PPG 的房颤诊断算法性能比较文献数据集算法性能Aliamiri 等62privateCNN+RNN(GRU)0.98(acc)Aschbacher 等65privateCNN+LSTM0.985(sen)Nguyen 等66MIMIC III2D-CNN0.984(acc)摇 摇在文献65 中提出的模型涉及多个卷积块、LSTM 层和扁平化层。每个卷积块中包含一个卷积层和一个最大池化层。从测试数据集中发现使用原始PPG 波形作为输入的深度学习算法比单独使用 PPG衍生的心率数据的机器学习算法更优。另外,使用密度层和瓶颈层有利于提高计算效率,增强模型紧凑性。2D-C
41、NN 包含四个卷积层和三个密度层。此网络的输入是使用心电信号的连续 RR 间隔或 PPG 的峰值间隔建立的庞加莱图像,训练好的权重用于训练PPG 数据集,使用神经网络的最后三个密集层对模型进行微调66。3.4摇 呼吸频率呼吸频率(RR)是呼吸功能障碍的重要诊断标志。异常升高的 RR 是心脏骤停的良好预测指标,并且与住院患者死亡率高度相关。因此,监测 RR 对于评估患者在医院和家庭或社区环境中的健康状况至关重要。传统的呼吸测量是通过使用肺活量计、肺图或腹部肌电图进行的。这些测量方式对于在普通病房和家庭环境中的患者来说是非常麻烦和昂贵的。PPG 传感器集成的可穿戴设备因其普遍的便利性和简单性越来越
42、多的被应用于临床医学。当前基于 PPG 的 RR 估计方法严重依赖手工规则和针对特定设置调整的参数。选择最优超参数对于深度学习模型改进至关重要,贝叶斯优化算法已在各种机器学习模型中的超参数调优中取得成功,包括 ResNet 块的数量、滤波器大小、卷积层的内核大小、卷积层的步长和最大池化层、第一致密层等超参数的选择。设计出由五个 ResNet块、一个最大池化层、一个扁平化层和三个具有减少单元数量的致密层构成的网络架构识别呼吸频率。每个ResNet 块包含三个卷积层、一个合并层和一个激活层67。采用贝叶斯优化算法优化卷积层的内核大小、滤波器大小和步幅大小,提高预测准确率。基于 PPG 的呼吸频率算
43、法性能比较如表 5 所示。表 5摇 基于 PPG 的呼吸频率算法性能比较文献数据集模型性能Bian 等67合成数据集ResNet2.5(MAE)Ravichandran 等68VortalRespNet0.145(MSE)Osathitporn 等69非公开数据集RRWaveNet1.07(MAE)摇 摇 呼吸频率提供了大量的诊断依据,从心电图和PPG 中提取有关呼吸模式的信息可以对睡眠状况和其他慢性呼吸系统疾病进行更全面的评估。相关研究按照全卷积编码器-解码器的拓扑结构设计架构。编码器部分使用 PPG 信号作为输入,通过下采样产生特征向量。解码器部分使用产生的特征向量作为其输入,并通过上采样
44、产生输出,从而预测呼吸信号。编码器部分被分为 8 级,一维卷积运算被用来对输入特征下采样。为了提高训练效率,使用分层卷积法下采样。每个编码器级别的输出被提供给扩张的残差起始块。扩张的残差起始块的使用提供了一个更大的接收场并且没有显著增加参数。此外,在块内使用残差连接是为了减少梯度消失所带来的影响,并缩短训练期间的收敛时间。解码器部分利用解码器块的特征图与其相应的编码器对之间的特征连接。在进行卷积和稀释残差卷积操作后,解码器的每一级使用去卷积操作进行上采样。然后在解码器的最后一级,进行卷积运算,将特征通道映射到所需数量的输出通道68。RRWaveNet 由多尺度卷积、深度时空残差块和呼吸率估计器
45、三个模块组成。多尺度卷积模块采用三个分支并行的多尺度卷积来捕获不同分辨率下的信号特征。三个卷积层包含不同的滤波器大小,它们独立学习每个卷积分辨率的适当权重。每个分支卷积层后面是批量归一化层、ReLU 激活层和最大池化层。来自三个分支的三个相同大小的张量在该模块的末尾连接,产生一个张量。深度时空残差块由八个残差块串联而成。每个残差块包含五层,两组一维卷积层和一个批量归一化层,中间有一个激活层。呼吸率估计器放置在最后一个模块的开头,全局平均池化层将残差块的输出转换回一维形状,然后三组激活层和全连接层将张量压缩到 1,最后对呼吸频率进行评估69。4摇 研究的不足与未来发展的方向为了预测血压、心率、房
46、颤、呼吸频率等生理参数,需要一个足够容量的数据集用于模型训练。数据集的类型和数量种类多样化可以提高模型的鲁棒性和泛化能力,从而提高在预测过程中生理参数的准确性。因此,数据集是整个训练过程的基础。然而,医学数据集的缺乏影响了实验研究的进展。深度学习不需要人工手动提取特征,可以自主提取时域、频域和非线性特征,从而实现端到端的生理参数预测。但是,预测准确性仍有待提高。对于数据不足的问题,可以使用公开数据集来解决。充足的数据集可以促进端到端生理参数预测方向的研究。此外,还可以加强在模型架构上的研究,以提高模型的预测准确性。由于 PPG 采集设备具有价格82摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
47、 摇 摇 摇 摇 摇 摇 摇 摇 摇 计算机技术与发展摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 33 卷低廉、易携带等特点,未来基于 PPG 穿戴设备会在日常疾病监测和辅助医疗诊断方面广泛应用。5摇 结束语该文概括了基于 PPG 信号的生理参数预测算法的比较。尽管基于 PPG 的诊断方式已经成为主要研究方向,并且有着较高的准确率,但是仍然无法完全满足临床需求,这需要更加丰富的数据集作为支撑。数据集的收集来之不易,希望通过研究者的共同努力增加数据多样性,满足各种生理特征的研究。近些年来单一算法和多算法融合都取得不错的成绩,希望在未来研究人员能够开发更不惧局限性的
48、算法,将基于PPG 信号的诊断方式变得更加通用化。参考文献:1摇 李欣悦,葛摇 慧.基于卷积神经网络的单路 PPG 信号的连续动脉血压测量算法J.计算机应用与软件,2022,39(2):108-112.2摇 彭摇 莉,宋摇 鑫,鄢苏鹏,等.基于前额和手指 PPG 特征参数的无创血压检测性能比较J.中国医疗设备,2022,37(12):24-29.3摇 蒲彦安.基于 PPG 信号的无创连续血压预测方法研究D.重庆:西南大学,2022.4摇 腾讯美国有限责任公司.基于远程光体积描记的心率测量:中国,202110760336.8P.2022-05-27.5摇 安徽大学.一种基于 PPG 信号的心率估
49、计方法、电子设备及存储介质:中国,202210055542.3P.2022-04-26.6摇 刘摇栋.基于 PPG 信号的心率估计方法研究D.武汉:华中师范大学,2022.7摇 张摇姁,杨学志,刘雪南,等.视频脉搏特征的非接触房颤检测J/OL.(2022-03-24)2023-04-18.http:/ 陈摇静,杨学志,陈摇鲸,等.采用自注意力抗干扰网络的视频房颤检测J/OL.(2022-09-14)2023-04-18.ht鄄tp:/ 34.T.20220913.1822.006.html.9摇 刘摇 畅,朱健铭,李世勇,等.基于 STM32 的生命体征监测系统设计J.信息技术与信息化,202
50、2(6):28-31.10 黄益平,陈真诚,梁永波,等.基于脉搏波的呼吸频率计算方法J.中国医学物理学杂志,2021,38(9):1124-1128.11 刘摇 畅.基于 PPG 信号的呼吸频率提取系统设计D.桂林:桂林电子科技大学,2022.12 HSU Y C,LI Y H,CHANG C C,et al.Generalized deepneural network model for cuffless blood pressure estimationwith photoplethysmogram signal onlyJ.Sensors,2020,20(19):5668.13 IBTE