作       者:李佳欣,王涵,范平

作者单位:新疆医科大学第一附属医院心内科(李佳欣,王涵),心功能科(范平)

作者简介:李佳欣,主要从事心血管疾病研究。

通信作者:范平,E-mail: [email protected]

基金项目:新疆维吾尔自治区卫生健康科技计划项目(2025001MXJCSYJSTGXM650030286)

摘要

阵发性心房颤动(paroxysmal atrial fibrillation,PAF)是一种发病率和死亡率均较高的心律失常,其特征为心房颤动短暂发作并自发终止。尤其在隐源性脑卒中或短暂脑缺血患者中,PAF的检出率更高,若不及时发现,则会进一步增加脑卒中和心力衰竭的风险。由于PAF常为无症状或隐性发作,因此早期筛查和管理是预防相关并发症的关键。人工智能技术在医疗领域的应用,为PAF的诊断提供了新的工具和方法。本文对近年来人工智能技术在辅助PAF筛查、预测、诊断和管理领域的相关研究及实际应用价值进行综述,并探讨了其在PAF领域的应用前景以及挑战。

关键词

人工智能;阵发性心房颤动;心电图;深度学习;机器学习

引用格式

李佳欣,王涵,范平. 人工智能在阵发性心房颤动诊断中的研究进展[J]. 实用心电与临床诊疗, 2025, 34(5): 641-648.

DOI:10.13308/j.issn.2097-5716.2025.05.004

      心房颤动(简称房颤)是全球最常见的持续性心律失常,影响全球数百万人,其发病率随着年龄的增长而升高。虽然房颤本身很少致命,但它增加了心力衰竭和血栓栓塞等并发症的风险,故其发病率和死亡率均较高。阵发性房颤(paroxysmal atrial fibrillation,PAF)作为房颤中常见的类型之一,若未得到及时控制,则会进一步升高相关的并发症发生率和死亡率。因此,为了加强疾病管理、减轻疾病负担以及提高患者的生存率,早期识别和诊断PAF至关重要。目前诊断房颤的方法有心脏查体和心电图检查等,其中12导联心电图是房颤诊断的金标准。然而,因PAF具有可变性、隐匿性以及无症状的临床特点,仅依赖传统的常规12导联心电图和24 h动态心电图的筛查很可能造成PAF的患病率被低估。此外,面对大量的心电图数据,临床医生的解读任务繁重且耗时,诊断结果也易受个人专业知识储备及临床经验的影响,容易造成PAF的漏诊和误诊。

      随着人工智能技术的迭代更新,越来越多的研究将人工智能技术用于优化PAF的诊断,不断展现出其在PAF诊断领域的巨大潜力。人工智能有望突破临床医生使用传统诊断方法的局限性,成为识别PAF的辅助工具。研究表明,基于心电图分析的人工智能在提高诊断准确性和缩短诊断时间方面表现出良好的性能。还有研究表明,基于光电体积描记法(photoplethysmography,PPG)的智能穿戴设备能够实时监测与预警房颤等心脏不良事件,对于指导PAF筛查具有重要参考价值。

1  PAF的人工智能心电图诊断

      人工智能是指能够模拟人类智能,以执行诸如模式识别、决策制定等通常需要人类智慧才能完成的任务的计算机系统。人工智能有多个子领域或学科,目前,大多数研究采用机器学习来探索人工智能在PAF诊断中的性能。机器学习是人工智能的重要分支之一,通过多参数和非线性算法的开发从数据集中学习,以提供预测结果,尤其在检测数据中的非线性关系方面具有优势。此外,深度学习是机器学习中衍生出的新领域,专注于构建与人脑结构和功能相似的神经网络,通过在输出层之前添加许多“隐藏”层来对数据集中复杂的关系进行建模,广泛应用于分类和回归等问题中。

1.1  机器学习模型

      传统的机器学习模型能够通过带或不带标签的心电图数据识别出特定的模式,从而输出结果。ZHANG等采用3种机器学习算法构建了一个识别PAF和持续性房颤的模型,分析了1 600例患者的心电图数据。结果表明,该模型在预测PAF上表现良好,准确率80.1%,敏感性71.6%,特异性85.1%,AUC值为0.870(95%CI 0.858~0.882)。PETRE.NAS等基于RR间期不规则性、P波缺失、F波存在和噪声水平4个参数,开发了一个结合回声状态网络和模糊逻辑分类器的方法以检测PAF。该研究选取100条真实数据并结合节律、波形信号建模,得到一个可用的模拟PAF发作的数据库,用于评估检测器性能。研究表明,该方法可以检测出少至5次心搏的房颤发作,准确率88%,敏感性100%,特异性76%。因该模型的输入内容包含已知的心电图特征,故其输出结果具有可解释性。CREASY等使用复杂性算法结合机器学习技术分析了10 s的12导联心电图信号,以预测既往检测到房颤发作但后来恢复正常窦性心律的患者。结果显示,采样频率125 Hz的心电图信号用于诊断处于窦性心律的PAF准确率最高,达69%,是复杂性分析的最佳采样频率;与其他导联相比,基于V6导联的机器学习模型性能最高。上述研究表明,机器学习模型有可能用于辅助检测PAF,通过输入不同的心电图参数或采样频率有助于探索模型的最佳性能。

1.2  深度学习模型

      与传统的机器学习相比,深度学习可以自动提取心电图特征、识别复杂模式并进行分类,从而辅助临床医生区分不同的心律失常类型。随着技术的不断进展,深度学习成为近年来该研究领域的主流方向。深度学习模型包括卷积神经网络(convolutional neural network,CNN)、深度神经网络(deep neural network,DNN)、循环神经网络、生成对抗网络和混合神经网络等。

      CNN是在心电图信号分析中应用最广泛的深度学习模型之一。刘风雅等通过Physionet 2021和CPSC 2021公开数据库训练了一种基于注意力机制的CNN,该模型首先通过CNN提取心电图特征,然后由注意力机制协助CNN专注于重点信息部分,最后输入用于联系二者信息的双向门控循环单元,以实现从动态心电图中精准检测PAF。结果显示,该模型的准确率、敏感性和特异性分别为98.5%、96.9%和98.6%。该算法能够有效检测PAF,具有潜在的临床应用价值。DHANANJAY等基于深度学习模型开发了一种六层二维CNN模型,以自动分析心电图来区分PAF、持续性房颤和非房颤节律。该研究纳入了296 898份心电图,将其按0.70、0.15、0.15的比例分别用于训练、验证、测试。结果显示,该模型区分PAF、持续性房颤和非房颤节律的准确率为0.98,敏感性为0.98,特异性为0.97。该研究表明,CNN能够有效区分不同心电图节律,展现出其在辅助诊断房颤领域中的应用前景。ZHOU等基于2 192例患者窦性心律期间的5 688份传统印刷12导联心电图,开发了一种经过多维混合缩放方法优化的CNN模型(EfficientNet-V2),以检测PAF。输入经小程序数字化的印刷心电图数据后,EfficientNet-V2表现出较强的性能:敏感性87.5%,特异性66.7%,准确率78.6%,F1为0.824。该研究首次基于印刷心电图,证实了人工智能模型在真实临床环境中极具潜力,可成为PAF的可靠筛查工具。TZOU等纳入了8例PAF患者的心电图数据,该数据记录了患者高频率的心电信号(包含177次房颤发作和52 432个P波段),基于CNN并结合P波特征和皮肤交感神经活动开发了一个新的网络模型(MVPNet),以准确预测PAF。该MVPNet模型检测房颤发作的准确率为89%,敏感性为88%,特异性为89%,AUC值为0.94,其性能优于现有的房颤风险评估模型,有望应用于临床场景。

      近年来,DNN在PAF诊断领域也表现出了较好的应用前景,JIN等基于318 321例患者的552 372份心电图训练了一个DNN,以从正常窦性心律中识别房颤发作,并尝试采用可解释的人工智能技术来识别深度学习模型输出结果背后的推理证据。结果显示,该模型的敏感性为72.2%,特异性为90.6%,AUC值为0.905,F1为0.542,且表明T波的附近(包括ST段和S峰)显著影响DNN诊断PAF的能力。该研究表明深度学习模型能够从窦性心律心电图中有效识别微小的房颤特征,以检测出潜在的PAF。GRUWEZ等从142 310例患者的494 042个12导联窦性心律心电图数据集中训练并验证了一个DNN,以识别PAF;结果显示,该深度学习模型的准确率为78.1%,敏感性为78.9%,特异性为78.0%,AUC值为0.87,且在包含70 172份心电图的外部验证集中性能稳定。此外,该研究还发现,该模型输出结果与Ⅱ导联和V1导联的P波幅度和持续时间相关联,而上述导联是临床常规心电图分析中最常用于评估P波的导联。该研究通过增加外部验证集的方式,证明了模型用于检测潜在PAF患者的可行性,是指导临床工作实施的重要补充。

【专题笔谈】人工智能在阵发性心房颤动诊断中的研究进展

      除上述单独应用单一的深度学习模型外,研究者们也探索了用于检测PAF的混合神经网络。ASADI等结合生成对抗网络和CNN架构搜索开发了一个新型深度学习模型,提出了一种新的数据预处理方法来提高检测性能,该研究基于经认证的PAF合成样本测试模型性能;结果显示,该模型的准确率、敏感性及特异性均高达99.0%,与最先进的自动化机器学习方法ResNet-18和Auto-Sklearn相比,该模型的精度分别提高了2.2%和6.1%。WEN等基于公开数据库(包含105名参与者的1 436份动态心电图)提出了一种能提高自动对焦检测性能的新型模型集成方法并进行了验证,为解决从动态心电图检测PAF的问题提出了一种有效的方案。上述模型的对比见表1。

2  智能可穿戴设备与PAF识别

      随着人工智能技术的不断创新,智能可穿戴设备已被广泛应用于临床实践。如今,面向消费者的智能可穿戴设备层出不穷,如健身手环、智能手表、智能戒指和腕带等。这些智能可穿戴设备既可以单独使用,也可搭配智能手机等设备使用。传统的心电图监测方式,例如心电图贴片、胸带监护仪和心脏植入性电子装置等虽然可以连续监测心律,但其功能有限且需长期佩戴,给患者造成不便。相较于传统的心电监测设备而言,智能可穿戴设备除了可以进行长期连续的心律监测之外,还具有监测血压、体温、血氧饱和度、能量消耗、压力和睡眠质量等多种功能,并且具有轻巧、便携的特点,因而备受人们青睐。其中,用于监测心电信号的智能可穿戴设备应用最广,正逐步成为心血管健康监测与早期疾病诊断的可靠工具。这些设备主要通过心电图或PPG信号获取心跳间隔,并使用算法对心律进行分类,以实现对心率和心律的监测。近年来的研究不断证实了这些设备检测PAF的有效性,为该疾病的筛查开辟了新途径。

      GUO等使用带有PPG技术的智能设备对我国≥18岁人群进行了房颤的筛查,在187 912名受试者中,有424名收到了“疑似房颤发作”的通知。经过随访和全面评估(临床评估、常规心电图和24 h动态心电图复检),其中227名被证实患有房颤。基于智能可穿戴设备的PPG算法可能有助于识别患有PAF但未确诊的个体。LUBITZ等在455 699名既往无房颤病史的参与者中评估了一种基于可穿戴Fitbit设备的PPG算法的预测性能,其中有1 057名参与者收到了“不规则心律检测(定义为11次连续不规则转速图)”通知并接受了1周的动态心电图贴片监测,结果显示,有340人(32.2%)出现了房颤发作,该PPG算法对≥65岁参与者不规则心律检测的阳性预测值为97.0%(95%CI 91.4%~99.4%)。余莎莎等通过与24 h动态心电图结果进行比较,检验了基于PPG的智能穿戴设备(OPPO Watch)识别房颤(包括PAF)的性能,结果显示,该OPPO Watch检测房颤的性能良好:准确率为95.4%,敏感性为99.3%,特异性为81.5%,与动态心电图检测结果具有高度一致性。AVRAM等则研究了一款兼有PPG和心电图功能的智能手表(三星Galaxy Watch Active 2),在204名参与者(其中包含PAF患者159例,占77%)中验证了该智能手表对房颤的检测性能。结果显示,PPG算法的敏感性为87.8%,特异性为97.4%;心电图算法的敏感性为98.9%,特异性为99.3%;结合心电图的新型PPG算法优于单独使用PPG算法的性能,敏感性为96.9%,特异性为99.3%。上述研究证明,结合心电图和(或)PPG技术的智能可穿戴设备有可能成为早期识别PAF的辅助工具。

3  人工智能参与PAF管理

3.1  PAF患病风险预测

      临床常用的房颤风险预测工具,如CHARGE-AF风险评分依赖于多种临床风险因素,故其应用容易受到患者临床数据收集质量的影响,有错误分层的风险。研究表明,与CHARGE-AF风险评分相比,人工智能模型能够通过迭代调整来减少预测误差,与临床风险评分性能相当甚至更优。HILL等基于23 745名无房颤病史参与者的年龄、性别、种族、吸烟状态等临床变量,开发了一种预测未来5年房颤发生率的机器学习算法(PULSE-AI),以识别既往无房颤病史的高风险人群,再通过对该人群进行为期2周的家庭心电图监测,以检验模型的性能。结果显示,结合临床变量的机器学习模型的AUC值为0.870,显著优于CHARGE-AF风险评分(0.725)。KHURSHID等基于45 770人的100 954份12导联心电图训练了一个CNN模型(ECG-AI),以预测未来5年房颤发生的风险,结果显示,在3个独立测试集(内部1个、外部2个)中,ECG-AI的AUC值分别为0.823、0.747和0.705,与传统的CHARGE-AF(AUC值为0.802)评分模型性能相当,而结合ECG-AI和CHARGE-AF临床风险评分的模型(CH-AI)显著优于单独使用CHARGE-AF(P<0.05),其AUC值得到了进一步提高(0.838、0.777、0.746)。由此可见,人工智能在房颤风险预测领域拥有广阔前景,通过结合人工智能,只针对患房颤风险较高的人群进行筛查,可以提高房颤系统筛查的获益和效率。

      HYGRELL等基于14 831例≥65岁患者的478 963份单导联心电图开发、训练并验证了一个CNN模型,以预测近期发生PAF的风险;结果显示,该模型的AUC值为0.80,且在年龄分布越广的验证集中性能越好。HAN等纳入了664 065份正常窦性心律的12导联心电图,开发了一种基于CNN的人工智能模型(AI-ECG-AF),以预测未来1年发生PAF的高风险人群,结果显示,AI-ECG-AF的AUC值为0.784。上述研究表明,人工智能能够从窦性心律的单导联或12导联心电图中预测PAF。

      还有研究者结合临床指标探索人工智能模型预测PAF的性能,BAEK等基于50 000份12导联心电图、实验室检查及超声心动图开发了一个结合CNN和双向长短期记忆神经网络(BiLSTM)的集合模型,以预测近期发生PAF的风险,结果显示,该模型的AUC值为0.80(95%CI 0.78~0.83),在预测PAF方面性能良好。基于动态心电图的人工智能模型也得到了探索,李盼盼等基于310例PAF患者的24 h动态心电图数据开发了一个CNN集成模型,以预测未来5 min患者发生PAF的风险,结果显示,该集成模型的AUC值为0.94(95%CI 0.880~0.999),显著高于临床预测模型(0.85)和HARMS2-AF评分(0.66)。上述模型对比见表2。

3.2  手术治疗与术后复发预测

      肺静脉隔离术是房颤导管消融治疗的基石,是治疗房颤的有效方法之一。人工智能技术在肺静脉隔离术治疗房颤上发挥了巨大的作用。RILLIG等纳入了200例PAF患者,随机平均分为两组,第一组使用机器人导航进行环肺静脉隔离术消融,另外一组手动消融,比较两组的治疗效果。结果表明,使用机器人导航技术进行环肺静脉隔离消融的成功率与手动消融相当,且两种方式的术后并发症发生率相近,但随着机器人导航技术的经验增加,其成功率将会提高。DUNCAN等在进行PAF消融术时,比较了Hansen机器人导航与手动消融两种方法的消融效果,结果表明,使用机器人导航技术进行肺静脉隔离术比手动消融信号衰减更显著,且在相同的消融效果下,机器人导航所花费的时间更短。HLIVK等对100例接受机器人导航引导下导管消融的患者进行中期随访的结果表明,在机器人导航技术支持下,PAF患者导管消融术具有高成功率和高安全性。

      尽管对PAF发病机制的认识有所深化,但复发仍是导管消融术后的主要挑战,因此,准确预测PAF复发对患者的管理很重要。人工智能在增强PAF复发预测方面能发挥至关重要的作用。SHADE等对35例接受肺静脉隔离术治疗的PAF患者进行了回顾性研究,该研究开发了一个机器学习分类器,以基于对患者术前晚期钆增强磁共振成像(LGE-MRI)数据的分析来预测房颤复发风险,结果表明,该机器学习分类器检测PAF复发的敏感性为82%,特异性为89%,AUC值为0.82。LIU等基于人工智能辅助的消融前计算机断层扫描图像和消融前临床数据,开发了一种机器学习模型,以预测导管消融后1年房颤的复发情况。该研究共招募了638例药物难治性PAF患者接受消融,结果显示该机器学习模型显著提高了预测性能,最高AUC值为0.76(敏感性为86.7%,特异性为51.0%)。该研究表明,在消融前使用人工智能技术能够辅助预测PAF患者的复发。

3.3  随访管理

      随着智能手机等设备的普及,移动健康技术被广泛用于解决房颤的综合管理问题。使用基于人工智能的移动健康技术对房颤患者进行综合管理,能够减少房颤相关不良事件的发生。GUO等纳入了我国40个城市注册的18岁以上房颤患者,其中1 646例接受基于移动房颤应用程序(包含房颤优化医疗路径——ABC路径)的综合护理,1 678例接受常规护理。随访结果显示,接受移动房颤应用程序的干预组“缺血性脑卒中/系统性血栓栓塞、死亡和再住院”综合发生率和再住院率分别为1.9%和1.2%,明显低于常规护理组的6.0%和4.5%。该研究表明,在移动健康技术的支持下,房颤的综合护理方法降低了再住院率和临床不良事件的风险发生率,优化了房颤患者的管理。FOTI等研究了基于人工智能增强的植入式循环记录器(implantable loop recorder,ILR),通过其持续监测功能来检测房颤复发,并为后续用药调整提供依据。该研究纳入了在4家医院接受肺静脉隔离术治疗的91例PAF或持续性房颤患者,所有患者都植入了可插入式ILR进行远程连续监测,结果显示,人工智能算法将房颤复发的假阳性率降低了21%,并调整了后期的治疗方案:36例患者停止使用抗心律失常药,8例患者进行了再次消融。由此可见,人工智能在PAF患者的后期随访中发挥了重要作用,通过远程实时持续监测,可降低PAF患者的并发症风险,有利于及时调整药物治疗方案,节约了时间与经济成本。

4  前景与挑战

      人工智能在PAF诊断领域中存在许多优势。1) 指导筛查:相较于医生解读心电图而言,人工智能可以从窦性心律心电图信号中识别出微小的特征性差异,以预测潜在的PAF高风险患者。KHURSHID等的研究表明,因人工智能能够识别出细微的心电图特征,所以对房颤高风险人群进行严密的监测可有效提高PAF的检出率,为临床精准筛查PAF提供了可能性。2) 成本效益高:目前,欧洲房颤管理指南与我国房颤诊断与治疗指南均建议通过脉搏触诊和心电图对所有≥65岁的就诊人群进行房颤机会性筛查,对房颤高危人群则考虑通过定期或连续心电监测进行系统性筛查。在大规模房颤筛查,尤其是在要求长时程监测与控制成本的情况下,基于PPG的智能穿戴设备相较于传统心电图,可能展现出更高的应用价值与成本效益。3) 指导用药:如FOTI等的人工智能增强的ILR可预测房颤复发,其预测结果可以指导临床对房颤复发的高危患者制定个性化的治疗策略,以降低房颤复发的可能。

      尽管人工智能技术有上述优势,但将人工智能辅助诊断PAF应用于临床实践的局限性也非常突出。1) 数据的质量问题:用于开发人工智能模型的数据质量是开发者或研究人员首要考虑的问题,如果用于人工智能模型开发的数据本身就存在一定偏差,如数据噪声、数据集过小或过大,抑或是数据集选择偏差,即使模型具有高准确率、敏感性和特异性,也会导致其代表性、普适性较差而难以推广至临床。2) 决策的可解释性问题,即“黑匣子”问题:缺乏决策的可解释性也是许多模型无法推广至临床的原因之一。虽然人工智能模型能够根据数据集给出决策,但其决策过程往往是未知的,一旦系统发生错误,如诊断错误,就可能会对患者产生严重的影响,甚至危及生命,从而导致医疗事故,这也致使临床医生无法完全信任人工智能模型。近年来,已陆续有研究专注于突破此局限,如ZHANG等和TZOU等开发的模型就加入了决策可解释性的人工智能技术。3) 临床收益问题:人工智能模型用于PAF诊断的准确性、敏感性、特异性、假阴性率和假阳性率会对整个医疗卫生系统产生重大影响。如假阳性率高的智能穿戴设备不仅会引发患者焦虑,还会导致过度使用医疗保健资源,因此,优化人工智能算法至关重要。4) 伦理问题:用于人工智能模型开发的数据集往往包含患者的姓名、联系方式和疾病信息等隐私,为保障人工智能应用于医学领域的安全性,保护患者隐私和防止患者信息被泄露,亟需建立健全法律法规和医学伦理规范。

5  小结

      人工智能技术在诊断、预测和管理PAF方面具有一定潜力。除常用的单导联和12导联心电图外,研究人员对基于24 h动态心电图、印刷版心电图的人工智能模型也开展了探索。人工智能模型的偏见和伦理问题,限制了其在临床中实现PAF全自动诊断的应用。相较于单独应用人工智能,将其与临床医生相结合的模式似乎更加可靠,也更容易被接受。这种模式能够弥补人工智能模型开发与临床应用之间的差距,有效促进人工智能模型在临床PAF筛查中的应用,有望指导和辅助临床医生对PAF进行有效且便捷的筛查。就当前研究而言,提高人工智能决策的可解释性仍是研究重点。可解释性人工智能技术不仅能增强人工智能在医疗保健中的可信度,而且还能促进医疗专业人员对人工智能决策的接受度。未来的研究有待在临床实践中进一步验证、全面评估并优化人工智能技术的应用性能。

    排版:李政萍

    统筹:顾   艳

    审核:徐云峰