肝衰竭是一类由多种因素导致的严重临床综合征,基于基础肝病病史、起病特点及病情进展速度,肝衰竭分为4类:急性肝衰竭(ALF)、亚急性肝衰竭、慢加急性(亚急性)肝衰竭[ACLF或SACLF]和慢性肝衰竭。目前,国内外对亚急性肝衰竭及慢性肝衰竭的定义与分类仍存在较大争议,因此本文将重点围绕ALF与ACLF进行阐述。二者均具有起病急骤、病情进展迅速、短期病死率高及预后极差等特点,不仅严重威胁患者生命安全,也给医疗体系带来沉重负担。如何实现ALF与ACLF的早期识别与精准风险分层,已成为肝病学领域亟待解决的重要挑战与研究热点。近年来,人工智能(AI)技术的快速发展为肝衰竭预警体系的构建提供了新的契机。依托机器学习和深度学习等方法,AI能够整合临床、生化、影像及多组学等多维度数据,实现疾病进展的动态监测与个体化风险预测。本文将系统综述基于AI的肝衰竭预警及预后研究进展,以期为优化肝衰竭的诊治模式提供参考。
1肝衰竭的定义和诊断标准
肝衰竭是一类临床常见且预后极差的严重肝病综合征,其中以ALF和ACLF最具代表性。二者均以严重的肝功能障碍为主要特征,但在发病机制、临床表现及诊断标准等方面存在显著差异。下文将分别对ALF与ACLF的定义及诊断标准进行阐述。
1.1 ALF的定义和诊断标准
ALF是指在无基础肝病史的情况下,急性起病并在4周以内出现以Ⅱ级及以上肝性脑病(HE)为特征的肝衰竭。其临床诊断标准主要包括:(1)乏力厌食、腹胀、恶心及呕吐等严重消化道症状;(2)凝血功能障碍,国际标准化比值(INR)≥1.5或凝血酶原活动度≤40%,并排除其他原因所致;(3)TBil水平进行性升高。
1.2 ACLF的定义和诊断标准
ACLF是指在慢性肝病基础上出现的急性肝功能恶化,以肝脏和/或肝外器官衰竭和短期高病死率为主要特征的复杂综合征。近年来,东西方学者基于不同病因和临床表型,提出了多种ACLF的定义和诊断标准,主要包括中国重型乙型病毒性肝炎研究小组ACLF标准(COSSH-ACLF)、欧洲肝病学会ACLF标准(EASL-ACLF)、北美终末期肝病研究联盟ACLF(NACSELD-ACLF)诊断标准、亚太肝病学会专家共识(APASL-ACLF)。上述四大标准均被收录至2023年欧洲发布的《慢加急性肝衰竭临床实践指南》和2024年美国发布的《慢加急性肝衰竭和危重肝硬化患者管理实践指南》,2024版《中国肝衰竭诊治指南》系统采纳了COSSH-ACLF诊断标准及其预警与预后体系。
COSSH-ACLF标准最初基于HBV相关ACLF(HBV-ACLF)人群建立,通过对肝脏、凝血、脑、肾、呼吸及循环六大器官系统的功能进行综合评估。近期国际多中心研究证实,该标准同样适用于西方酒精性肝病等非乙型肝炎人群ACLF患者(无论是否合并肝硬化),并在短期预后预测中表现出极高可靠性。该标准以28天病死率≥15%为诊断阈值,并根据器官衰竭数量将患者分为ACLF-1、ACLF-2和ACLF-3共3个严重程度等级,能够有效识别高危人群并指导早期干预。EASL-ACLF标准的整体框架与COSSH标准类似,主要针对酒精性肝病相关肝硬化患者。然而研究发现,该标准可能漏诊部分高危人群,如非肝硬化慢性肝病合并器官衰竭的患者或肝衰竭只合并INR升高的患者,此类漏诊患者的28天病死率>15%。APASL-ACLF标准认为ACLF是在慢性肝病基础上出现黄疸(TBil≥5 mg/dL)和凝血功能障碍(INR≥1.5),伴随4周内出现腹水或HE,且没有出现过既往失代偿。NACSELD-ACLF标准将ACLF定义为在肝硬化急性失代偿的基础上合并感染,并出现≥2个肝外器官(肾脏、呼吸、循环和脑)功能衰竭的综合征。该标准未将肝脏及凝血功能纳入评估范围,其研究人群主要为酒精性及HCV相关失代偿期肝硬化患者。由于符合该标准的患者往往短期病死率极高、临床救治窗口极短,因此该标准在国内外的应用较少。
2AI在疾病预测及预警中的应用
在医学实践中,如何实现疾病的早期识别与精准风险评估始终是临床管理的核心挑战。肝衰竭作为一种进展迅速且病死率高的疾病,其早期预警和风险评估尤为重要。然而,传统预测方法往往依赖临床经验和既有评分体系,预测能力存在局限。随着医学大数据和计算技术的发展,AI在医学领域的应用逐渐展现出巨大潜力。
AI的概念最早由约翰·麦卡锡于1955年提出,用以描述通过计算机执行通常需要人类进行推理与问题解决的多种技术。现代AI的应用通常融合多种技术以实现特定目标,其在医学领域的应用亦是如此。AI算法体系主要可分为监督学习、无监督学习以及强化学习三大类机器学习技术。其中,深度学习是实现这些学习范式的重要技术。监督学习通过已标注的数据构建预测模型,常见算法包括逻辑回归、支持向量机及随机森林等。无监督学习则需要在缺乏标签的数据中发现潜在结构或规律,包括K均值聚类、潜在类别模型及主成分分析等,用于完成数据降维、聚类和特征提取等任务。深度学习是神经网络发展的高级阶段,通过多层结构自动提取数据特征,包括人工神经网络、卷积神经网络及循环神经网络等。需要指出的是,这些算法之间并非完全独立,实践中可以根据具体任务灵活组合(表1)。
AI技术凭借其强大的模式识别和预测能力,能够从高维、多模态的医疗大数据中挖掘具有潜在临床价值的信息。在肝衰竭的管理中,AI可有效整合实验室指标、影像数据及电子健康记录,实现早期风险预测和个性化治疗方案推荐,从而为临床诊断、治疗优化及患者全周期管理带来范式变革。基于这些技术优势,AI技术已逐步应用于肝衰竭的早期预警模型研究,为进一步探索奠定了坚实基础。
3AI在肝衰竭预警及预后预测中的应用
肝衰竭的早期预警及预后评估模型最初多基于小规模临床数据和传统统计学方法构建。近年来,随着医学大数据和计算技术的发展,AI被逐步引入肝衰竭领域,AI能够在更高维度、多模态的数据中自动提取复杂特征,突破传统统计学模型的局限,进一步提升预测的准确性和稳定性。基于AI的肝衰竭预警预测模型在临床实践中展现出良好效能,已被应用于患者风险分层、肝移植优先级决策以及优化床旁管理方案等方面。以COSSH诊断标准及评分模型为例,图1展示了ACLF从诊断、风险评估、动态监测到管理决策的整体流程。
图1 ACLF临床预警及预后评估工作流程图(以COSSH诊断标准及评分模型为例)
3.1 ALF预后模型
针对ALF患者的短期预后评估,研究者们已开发出多种评分模型,包括King’s College标准(KCC)、终末期肝病模型(MELD)、急性肝衰竭研究组预后指数(ALFSG-PI)及药物诱发急性肝衰竭模型(DIALF-5),为临床床旁决策提供支持。
3.1.1 KCC标准及MELD模型
Anand等基于145例暴发性肝衰竭患者数据,通过逻辑回归和多变量分析验证并优化了KCC标准。研究发现,KCC标准在对乙酰氨基酚(APAP)相关暴发性肝衰竭中具有较高的阳性预测值,同时进一步识别出白细胞>20×109/L、血钾>5.5 mmol/L及凝血酶原时间持续升高为死亡的独立预测因子,为床旁肝移植决策提供依据。Kamath等通过分析4组不同终末期肝病患者的数据,综合利用Cox比例风险回归与逻辑回归方法,成功构建并验证了MELD评分。该评分对3个月病死率的预测性能优于Child-Turcotte-Pugh评分。MELD评分不仅可以量化死亡风险,还可用于指导肝移植器官分配,已成为终末期肝病管理的常用工具。
3.1.2 ALFSG-PI及DIALF-5模型
Koch等基于1 974例ALF患者数据,利用多变量逻辑回归构建了ALFSG-PI模型,用于预测21天无移植生存率验证发现其预测性能优于KCC标准和MELD评分,可床旁快速识别无需肝移植即可存活的患者,从而优化器官分配。Han等通过分析中国5个中心482例非APAP药物诱发的ALF患者数据,通过Cox比例风险回归构建了DIALF-5模型。该模型在预测21天无移植生存率方面表现优异,优于MELD评分和KCC标准,可为非APAP性ALF患者提供个体化床旁预后评估。
ALF预后模型各具特点,KCC标准适合APAP相关ALF床旁决策,MELD评分可量化死亡风险并指导肝移植,ALFSG-PI和DIALF-5模型适合非APAP性ALF患者,预测更精准。
3.2 ACLF预警及预后模型
由于ACLF病理机制复杂且异质性高,不同地区的诊断标准存在差异,相应的预测模型也呈现多样化。
3.2.1 中国COSSH系列模型
基于全国21家肝病中心的大规模前瞻性COSSH队列研究,中国学者应用机器学习方法在COSSH标准基础上构建了ACLF的预警及预后模型体系,以更精准地描述疾病特征及评估短期预后风险。
Wu等共纳入1 322例HBV相关慢性肝病急性失代偿患者,利用临床与随访数据,结合Cox比例风险回归与多变量建模,建立了针对短期死亡风险的COSSH-ACLF评分。Li等共纳入2 409例HBV相关慢性肝病急性失代偿患者,结合传统统计学分析与机器学习方法,开发并验证了COSSH-ACLF Ⅱ评分。研究者采用单变量竞争风险回归初步筛选与28天病死率相关的临床指标,随之利用LASSO回归进行变量选择,最后通过多变量竞争风险回归模型,进一步优化各变量的权重,生成最终的评分公式。进一步研究明确表明,COSSH-ACLF和COSSH-ACLF Ⅱ评分在各类病因的ACLF患者中均能可靠预测短期预后,可为临床决策提供关键依据。
Luo等基于COSSH队列开发了用于预测HBV-ACLF发病风险的COSSH-onset-ACLF评分。该研究共纳入1 373例HBV相关慢性肝病急性失代偿患者,采用LASSO-Cox回归结合OPLS-DA(正交偏最小二乘判别分析)筛选出TBil、INR、ALT和铁蛋白4个关键预测因子,并据此构建了疾病进展预测模型。该模型预测7、14和28天ACLF发病风险的准确性显著优于慢性肝衰竭联盟(CLIF-C)ACLF评分。此外,通过设定6.3分的风险分层阈值,该模型能够有效识别高风险患者,为临床早期干预提供了有力工具。
3.2.2 欧洲EASL系列模型
欧洲CANONIC研究(涵盖29个中心、1 343例肝硬化急性失代偿患者)基于逻辑回归开发了简化的器官功能评分(CLIF-OF),用于诊断器官衰竭及ACLF分级。随后,在此基础上通过竞争风险模型整合CLIF-OF、年龄和白细胞计数等独立预测因子,建立了CLIF-C ACLF评分,该评分在短期死亡预测方面优于MELD和Child-Turcotte-Pugh评分,为临床早期干预和风险分层提供了参考。
基于CANONIC和PREDICT队列的数据分析,研究者进一步将代谢组学与临床数据相结合,利用非靶向代谢组学筛选变量,并利用Cox比例风险回归和竞争风险回归建立了慢性肝衰竭联盟-代谢组学预后模型(CLIF-C MET)。该模型在预测短期病死率方面优于MELD-Na和CLIF-C ACLF评分。此外,基于全血转录组数据的研究应用LASSO回归和交叉验证筛选出28个关键免疫基因,构建了慢性肝衰竭联盟-系统性炎症基因评分模型(CLIF-SIG),用于量化系统性炎症水平,显著提升了短期病死率预测与风险分层能力。
3.2.3 北美NACSELD模型及亚太APASL模型
北美NACSELD研究对507例肝硬化失代偿合并感染患者的数据进行分析,通过单变量及多变量逻辑回归构建并验证了感染相关ACLF的NACSELD-ACLF评分。研究结果表明,肝外器官衰竭数量是短期生存的核心预测指标(≥2个器官衰竭者30天病死率显著升高),而感染类型和部分实验室指标(如白细胞计数、白蛋白)也独立影响预后,为临床提供了便捷的风险评估工具。亚太APASL-ACLF研究分析1 402例患者的临床数据,采用Cox比例风险回归构建了AARC动态评分系统及分级标准。该模型在衍生和验证队列中均表现优异,可用于床旁实时监测病情并快速分层高危患者。
ACLF预警及预后模型在临床应用中具有重要价值。COSSH系列模型基于大规模前瞻性队列和机器学习,可准确预测短期死亡和发病风险;欧洲EASL系列模型整合临床、代谢组学和免疫基因信息,适用于多病因ACLF的短期预后评估;北美NACSELD模型突出ACLF器官衰竭数量的预测作用;亚太APASL模型强调动态监测和床旁快速分层(表2)。总体来看,这些模型为临床早期干预和风险分层提供了可靠参考。
3.3 前沿AI技术在肝衰竭预警及预后评估中的新进展
近年来,一些探索性研究尝试将更先进的AI技术应用于ALF和ACLF的早期预警与预后研究中,以提升预测精度并发现潜在关键特征。在ALF研究中,机器学习方法如分类与回归树、随机森林和双线性混合模型可提升预后预测准确性;LASSO回归结合支持向量机可筛选关键生物标志物(如COL4A2),用于构建诊断模型;基于人工神经网络生成的肝衰竭风险指数可提前识别高风险患者;极端梯度提升(XGBoost)结合SHAP(沙普利加和解释)能够区分患者亚型并解析关键影响因素,为个体化干预提供依据。在ACLF研究中,分类与回归树、人工神经网络、XGBoost及支持向量机等方法可实现高风险患者的早期识别和动态死亡风险评估;3D卷积神经网络可对CT图像病灶进行智能分割,显著提高识别效率;潜在类别模型结合多算法共识聚类及XGBoost,可揭示患者不同亚型及器官衰竭模式,实现对疾病轨迹、存活率及治疗反应的精准分析。总体而言,这些前沿AI技术在ALF和ACLF的早期预测、风险分层及个体化干预中显示出较大应用潜力。
3.4 基于AI的肝衰竭预警及预后标志物挖掘
多模态AI模型通过整合医学影像(如CT、MRI)、临床指标及多组学数据,可以实现对肝衰竭患者更全面的表征。目前,AI技术已在肝衰竭多组学标志物发现与风险预测中取得显著进展(表3)。(1)在基因组学方面,基于逻辑回归和线性回归分析发现,全血DNA的rs3129859-C和HLA-DRB1*12∶02等位基因与HBV-ACLF患者凝血受损、腹水增加及28天病死率升高显著相关。(2)在转录组学方面,通过层次聚类、主成分分析、LASSO回归及支持向量机分析发现,SEMA6B、THBS1、MERTK、PPARG、ETS2和VSIG4等基因在外周血单个核细胞中的高表达提示强烈的炎症反应及较高的短期死亡风险。此外,COL4A2在肝组织中的高表达与ALF患者病情严重程度及短期预后不良相关。(3)在单细胞组学中,利用UMAP、RNA速率、SCENIC、CellChat及Cox回归等方法,揭示了ACLF患者中VCAN+CD14+单核细胞在早期驱动炎症风暴,而CXCR2+中性粒细胞在后期导致免疫耗竭及恶化;此外,Annexin A1高表达提示ALF/ACLF患者机体抗炎代偿能力增强,预示相对较好的预后。(4)在蛋白质组学方面,通过逻辑回归、Cox比例风险回归及主成分分析发现,血浆蛋白APOC3、HRG、TF和KLKB1的下调与HBV-ACLF高病死率相关,并可作为区分慢性乙型肝炎和HBV-ACLF的重要分子特征。(5)在代谢组学方面,利用逻辑回归、随机森林和偏最小二乘判别分析发现,血浆中哌可酸、N-乙酰天冬酰谷氨酸、3-脲基丙酸的升高以及γ-羧乙基羟色胺的下降提示ACLF的发生及不良预后;同时,FGF21、C6∶0-与C8∶0-肉碱的高水平也与ACLF的短期高病死率密切相关。(6)在微生物组学方面,基于逻辑回归、随机森林分析发现,基因丰富度和宏基因组物种丰富度的显著下降与疾病进展密切相关,提示ACLF患者的短期预后较差。
在整合多组学标志物的基础上,多模态AI模型联合大语言模型可进一步汇总和分析多维数据,实现对肝功能状态、疾病进展及潜在治疗反应的精准刻画,为早期预警、风险分层及个体化治疗提供有力支持。
4AI在肝衰竭预警及预后预测中应用的挑战
AI技术在肝衰竭预警及预后中的临床转化仍面临多重制约。在模型验证方面,现有研究大多依赖单中心、回顾性数据,导致模型在不同病因、地域及医疗环境下的泛化能力和稳定性存在不确定性。因此,构建多中心、高同质性的数据集至关重要:多中心数据应覆盖不同病因、地域和人群特征,以降低单中心偏倚,使预测结果在更广泛的临床场景中保持一致性;高同质性数据需通过统一肝衰竭定义、诊断标准及数据采集流程,减少不同来源数据之间的异质性,提高模型训练的可比性和鲁棒性,并确保跨中心验证可重复,为模型迭代提供基础。
在临床落地过程中,基于AI的肝衰竭预警及预后体系仍面临多方面挑战。在数据层面,临床多模态数据分散存储于电子病历、检验信息系统及医学影像归档与通信系统等平台,形成“数据孤岛”,跨机构共享受限;在系统集成与应用层面,现有医院信息基础设施滞后,AI工具与传统工作流程的兼容性不足,限制了模型在临床决策中的高效嵌入;在可信性与监管层面,模型普遍存在“黑箱”特征,导致其可解释性有限,而现行监管路径主要面向静态模型,不适用于需动态迭代更新的预警系统;在体系接受度与可持续性方面,模型的再训练、性能监测及长期运维尚未纳入常规管理框架,削弱了其持续应用的可行性。
总而言之,为推动基于AI的肝衰竭预警及预后体系在临床的应用,需要重点推进多中心、高同质性数据建设,提升模型验证与泛化能力,优化系统集成方案,完善监管标准,并建立长期运维机制,以保障模型安全、可解释及可持续应用。
5总结与展望
基于AI的肝衰竭预警及预后体系在ALF及ACLF的进展监测和死亡风险预测中展现出广阔应用前景。通过整合多模态临床数据,包括实验室指标、影像学信息和电子病历记录,并结合机器学习和深度学习方法,AI模型能够在疾病早期精准识别高风险患者,实现动态监测、风险分层和个性化干预,从而提升临床决策的科学性与效率。为了推动其在临床中的广泛应用,亟需建设多中心、高质量的数据平台,同时提升模型透明性与可解释性,并建立长期运维机制,确保系统的持续优化与可靠运行。随着相关平台和机制的逐步完善,基于AI的肝衰竭预警及预后体系有望成为个体化诊疗和精准医学的重要支撑,不仅为早期干预和优化治疗策略提供依据,也有助于改善患者预后并提升医疗资源利用效率。
https://www./cn/article/doi/10.12449/JCH251104
胡美倩, 李君 . 人工智能在肝衰竭预警及预后体系中的应用与挑战[J]. 临床肝胆病杂志, 2025, 41(11): 2218-2226