空间转录组学:融合多平台与计算策略,驱动临床新认知综述学习

上周新叶老师分享了于2025年12月31日发表在Cancer Cell杂志上的综述文章《Spatial omics at the forefront: emerging technologies, analytical innovations, and clinical applications》。本次,我们将介绍另一篇空间组学领域的综述,于2025年12月26日发表在Biotechnology Advances上的《Spatial transcriptomics: integrating platforms and computational approaches for clinical insights》。

推文链接:两篇几乎同时发表的最新空间综述:为什么一个发了Cancer Cell(44.5/Q1,王凌华团队),另一个只能发 Biotechnol Adv(12.5/Q1)?

这篇综述重点探讨了空间转录组学从技术原理到临床转化的全链条发展。文章系统梳理了ST在揭示组织空间异质性、解析细胞间通讯网络和重构时空动态轨迹三大核心能力上的突破,并展示了其在肿瘤、神经退行性疾病、发育生物学等领域的应用成果。同时,综述深入剖析了当前在样本处理、平台差异和算法标准化等方面面临的挑战,指出只有通过多中心验证、跨平台整合与临床导向的评估体系,才能推动ST从基础研究工具迈向可落地的精准医学解决方案。传统转录组学和单细胞RNA测序虽能揭示基因表达特征,却分别受限于“群体平均”效应和空间信息丢失,难以解析细胞在组织中的真实位置及其微环境互作。空间转录组学(ST)的出现填补了这一关键空白,通过在保留组织空间结构的前提下进行高通量基因表达分析,不仅可揭示组织的空间异质性、解码细胞间通讯网络,还能追踪发育与疾病中的动态变化,为精准分型、预后评估和个体化治疗提供新路径。尽管ST在基础研究中已展现出巨大潜力并快速发展,其临床转化仍面临技术复杂、数据分析困难及标准化缺失等核心挑战。因此,亟需在技术选型、算法优化和临床整合等方面形成规范,推动ST从科研工具迈向可靠、可推广的临床应用。

一、空间转录组技术概览

ST旨在在检测基因表达的同时,获取其在组织中的空间位置信息。目前,该领域主要由三大技术策略主导:

  1. 基于成像的方法,通过高分辨率显微成像直接可视化基因表达的空间分布;
  2. 基于感兴趣区域(ROI)的方法,通过对特定组织区域进行精准定位,实现靶向性分析;
  3. 基于空间条形码的技术,将分子信息与预设的空间坐标关联,从而支持高通量、全转录组水平的分析。 这三类技术的发展历程与核心原理如图1所示。由于这些技术各自针对不同的核心挑战,它们共同使得ST分析能够被直观呈现、精确定位和全面解析。为便于用户根据研究需求选择合适平台,表1对它们的关键技术参数进行了直接对比,这里提及的技术参数有:公司、原理、支持的样本、切片厚度、RNA质量要求等。

二、从数据生成到信息挖掘

空间转录组学数据的高度复杂性催生了大量新算法,旨在从中提取丰富的空间生物学信息。本节沿着“从原始数据到生物学洞见”的分析路径,系统介绍ST数据分析流程,并逐步阐述如何从原始数据中挖掘出可解释的生物学知识。

2.1 原始数据的获取与预处理

ST原始数据主要分为基于成像和基于测序两类,其预处理目标是将原始信号转化为高保真的空间基因表达矩阵并精确还原空间坐标, 这通常通过图像配准或位置标签解码实现。成像数据需经多轮图像对齐、拼接与共定位,并结合细胞分割算法及多模态信息(如形态学+转录组)提升分割精度,再通过荧光编码解析RNA身份;例如Xenium推荐采用文库归一化后结合k-NN与Louvain算法进行尺度缩放。测序数据则依赖空间条形码,通过比对参考基因组构建表达矩阵,主流平台已有专用工具支持:如Space Ranger(Visium)、standR(GeoMx)和Stereo-seq定制流程。尽管标准化软件提升了可重复性,预处理仍需应对信号噪声、空间坐标偏差和批次效应等关键挑战,以保障下游分析质量。

2.2 基础分析

空间转录组学的基础分析旨在从预处理后的高维数据中提取可解释的生物学信息,主要包括降维、聚类、基因表达预测、细胞类型去卷积/映射以及空间可变基因(SVG)。

  1. 降维方法已从传统PCA、t-SNE等发展为融合空间坐标的专用算法(如SpaSNE、GraphPCA、STAMP),以更好保留空间结构并提升生物学可解释性。
  2. 聚类策略强调多模态整合,基于概率模型(如BayesSpace、BASS)或图神经网络(如GraphST、DeepST)识别空间结构域,其性能高度依赖数据类型与组织特性,需根据平台(如Visium vs. MERFISH)和组织连续性(如脑 vs. 肝)合理选择。
  3. 基因表达预测通过整合scRNA-seq(如SpaGE)或直接从组织图像学习(如iSCALE、GHIST)来填补未检测基因,聚焦高变基因或SVG可提升预测的生物学相关性。
  4. 去卷积与映射利用scRNA-seq参考推断空间细胞组成,主流方法包括RCTD(推荐用于跨平台稳定性)、Cell2location、Tangram和CARD,建议结合多种算法交叉验证,并确保参考数据与空间样本在生物学背景上匹配。
  5. SVG识别是解析空间异质性的关键,可分为整体SVG、细胞类型特异性SVG和区域标记SVG三类;常用工具如BinSpect、SpatialDE和SPARK在准确性上表现优异,而SPARK-X、SOMDE更适合大规模数据分析;方法选择应结合分辨率与下游目标选择方法组合,并优先考虑经基准验证的工具。 总体而言,基础分析需根据研究问题、数据特性与平台特点进行分层决策与方法组合,以在计算效率、准确性和生物学意义之间取得最佳平衡。
2.3 下游分析

空间转录组学的高级分析聚焦于空间结构域识别、细胞间通讯和时空轨迹重构三大核心方向,旨在构建具有生物学意义的时空功能框架。

  1. 空间结构域识别通过整合基因表达相似性、空间连续性与细胞类型分布,划分功能区域并结合差异表达和通路富集进行注释。早期方法如HMRF基于马尔可夫随机场建模,近年则以深度学习为主导:SpaGCN利用图卷积网络,STAGATE采用自适应图注意力自编码器;2022–2024年的新一代算法进一步提升精度——MuCoST和STAIG通过多模态融合与图对比学习增强细节识别,而NichePCA等轻量级方法则优化了大规模数据的计算效率。
  2. 细胞间通讯分析在已识别的空间域内,结合配体–受体对的空间邻近性与微环境特征,解析位置依赖性的互作网络。传统工具如CellPhoneDB v3.0依赖已知互作对并引入空间生态位信息;新方法如SpaTalk融合拓扑结构与先验知识,DeepTalk借助图注意力网络实现单细胞分辨率推断,COMMOT和Spacia则分别通过最优传输与贝叶斯学习提升准确性,但仍面临计算复杂度高和缺乏标准化评估的挑战。
  3. 时空轨迹重构致力于从静态数据中推断动态过程,结合基因表达、空间坐标与时间信息描绘细胞分化路径。早期工具(如Monocle)忽略空间细节,RNA速度虽能预测状态转变但受限于生物学假设与技术噪声;近期进展如ENTRAIN(多模态融合)和SDEvelo(随机微分方程)提升了轨迹的生物学合理性,但如何在计算效率与动态保真度之间取得平衡仍是关键瓶颈。 总体而言,这些高级分析正推动空间转录组学从“静态地图”迈向“动态功能模型”,为理解组织发育、疾病演化和微环境调控提供系统性视角。

三、当前应用与临床转化潜力

得益于高分辨率全转录组空间技术平台的突破以及能够从复杂数据中解析空间模式的算法创新,ST已超越技术验证阶段,迈入生物学发现的新纪元。如下图和表3所示,ST技术在多个学科领域展现出巨大潜力,包括神经科学、肿瘤学、器官病理学、再生医学,以及炎症与感染性疾病研究。不同于以往综述通常按器官或疾病类型评估ST的临床价值,本文提出一种新的视角:聚焦于ST所独有的三类空间信息特征——这些特征显著推动了临床研究的发展:

  1. 揭示静态组织结构异质性:解析组织内空间有序的细胞架构与分子微环境;
  2. 分析动态细胞间通讯:描绘细胞间信号网络如何随空间位置变化,并响应局部微环境调控;
  3. 重构生物过程的连续轨迹:在原位空间背景下重建发育、分化或疾病进展等动态过程。 基于上述能力,进一步探讨ST在临床决策支持中的转化潜力。通过深化对发育与疾病机制的理解,ST可提供具有直接临床意义的新型空间生物标志物和治疗靶点,服务于疾病的诊断、治疗方案选择及预后评估。

然而必须指出,研究中观察到的空间信号可靠性受到多重因素影响,包括队列样本量、研究设计的严谨性、不同技术平台间结果的一致性,以及实验验证或正交验证的强度(见表5)。只有综合考量这些要素,才能全面评估ST研究成果在转化医学和临床应用中的可信度、可重复性与泛化能力。

3.1 多维空间信息拓展ST的应用

多维空间信息显著拓展了ST的应用,其核心价值体现在三个方面:一是揭示组织在生理与病理状态下的空间异质性,ST通过整合基因表达与精确位置信息,构建高分辨率器官图谱,不仅修正了传统“三区肝小叶”等模型,更在肿瘤、纤维化、神经退行性疾病中识别出与疾病进展密切相关的功能微区(如PDAC中的免疫抑制生态型、IPF中的AbBa生态位);二是解析微环境中的细胞间对话,借助高分辨率数据和通讯推断算法,ST能定位功能性多细胞互作单元,例如结直肠癌中巨噬细胞与T细胞在侵袭前沿的共定位激活免疫,或动脉粥样硬化斑块内平滑肌细胞通过CXCL12驱动免疫聚集,将抽象的细胞通讯转化为可干预的空间靶标;三是追踪发育与疾病的时间-空间动态轨迹,通过整合多个时间点的“空间快照”,ST重建了从胚胎器官命运决定(如肠管背腹轴分离)到疾病演化(如肿瘤亚克隆因空间隔离而耐药、心梗后修复梯度)的连续过程。综上,ST通过融合分子、空间与时间维度,为理解生命系统的结构-功能关系及开发精准诊疗策略提供了革命性工具。

3.2. 从空间发现走向临床决策

ST正推动基础发现向临床转化,主要体现在两方面:一是识别具有诊断、预后或疗效预测价值的空间构型生物标志物(如脂肪组织中细胞共定位与代谢指标相关、肿瘤中HLA-A–CD8A互作预测免疫治疗响应);二是通过揭示疾病关键过程(如阿尔茨海默病中Aβ斑块周围微环境)的空间微环境机制,明确可干预的治疗靶点(如TREM2–APOE–补体通路)。然而,要真正融入临床决策,仍需通过大规模前瞻性研究验证其普适性,并解决如何将高维空间数据转化为简洁、可操作的临床信息,以及如何精准靶向特定空间生态位等关键挑战。

四、标准化现状:前景与挑战

尽管上述案例已充分展示了ST在革新疾病认知和临床决策方面的巨大潜力,但要将这些重要发现从实验室研究转化为临床诊断、预后评估和治疗中广泛使用的常规工具,仍需系统性地解决可靠性、可重复性和可扩展性等核心挑战。这些问题主要源于当前该领域缺乏统一的标准化框架。因此,本章不仅限于技术参数的简单比较,而是系统梳理样本、平台和算法三大关键环节所面临的标准化难题,重点探讨如何构建一条通向临床可信度的可行路径。

4.1 样本标准化:迈向临床级可靠性

临床样本在采集、保存、运输和处理等环节缺乏统一规范(如使用生理盐水可使RIN≤6样本比例从11.5%升至55.6%),导致质量高度异质,不仅浪费珍贵标本,更阻碍数据整合与临床转化。未来需:1. 优化实验流程(如RNA-rescue ST)以提升对中低质量样本的兼容性;2. 推广自动化操作(如CytAssist)以确保操作一致性;3. 制定更合理的质控标准(如某些肿瘤分析中RIN≥6即可);4. 建立疾病特异性参考样本库和多中心带深度临床注释的队列,并通过合成或跨平台共识标准弥补“金标准”缺失。

4.2 平台标准化:从技术指标走向临床价值

不同ST平台在分子捕获效率、空间分辨率和数据生成原理上差异显著,导致:1. 表达定量不可比(如同一组织在Visium探针法与polyA法下检出基因不同);2. 空间坐标不一致(因细胞分割策略或成像误差导致同一组织被解析为不同空间单元)。更关键的是,目前缺乏以治疗响应或生存率等真实临床结局为基准的平台性能评估。未来应建立跨平台定量对照,并通过多中心临床研究以临床价值校准平台输出。

4.3 算法标准化:从精准分析到临床可操作

现有算法众多但评估混乱,多依赖模拟或理想数据,难以反映真实病理样本的复杂性;且常忽视平台差异和组织特性,通用模型易引入偏差。发展方向包括:1. 推动大规模跨平台公开基准测试,提供循证选择依据;2. 开发集成化、用户友好工具(如semla),降低使用门槛;3. 创新突破设备限制的新方法(如免成像计算重建),提升技术可及性;4. 最终构建可解释、可泛化、资源适应性强的标准化分析流程,将高维空间数据转化为临床可操作的报告。

五、未来展望

空间转录组学(ST)正加速突破传统技术边界,其未来发展将围绕四大核心方向展开:简化并普及空间组学技术、构建以人工智能为基础的知识整合框架、推进多组学空间整合策略、以及建设可扩展的计算基础设施。这些进展将共同决定ST能否从强大的“观察工具”成功转型为具有预测能力的临床相关技术。

5.1 技术性能与可及性协同提升。

新一代平台在持续突破分辨率与通量极限的同时,正从相关性分析迈向建立基因调控与功能结局之间的因果联系。与此同时,降低技术门槛成为关键趋势——例如PRISM技术仅需单轮成像且无需流体清洗,而免成像的计算阵列重建方法则摆脱了对复杂设备的依赖。这些简化显著降低了成本与操作难度。因此,ST的评价标准已不再局限于技术指标,而是综合考量成本、标准化程度和可及性,最终目标是推动技术的广泛普及。

5.2 人工智能从分析工具升级为知识整合框架。

当前基于深度学习的算法虽广泛应用,但仍面临高分辨率与低灵敏度难以兼顾、跨平台泛化能力弱等挑战。未来AI模型需兼具可解释性与泛化能力:通过将生物学先验知识直接嵌入模型架构,超越“黑箱”模式,提升结果的生物学合理性。同时,必须同步优化训练数据质量与模型结构,建立稳健的评估基准,并结合大规模自监督预训练,构建适用于临床的可靠AI系统。

5.3 多组学空间整合实现功能级融合。

ST平台已能同步捕获转录组、蛋白组、代谢组等多维信息,为空间坐标下的跨模态对齐提供了不可或缺的“地图”。虽然SpatialData、SpatialGlue等工具已推动数据融合,但其真正价值在于功能层面的整合——即在保留空间位置的前提下,关联转录活性、蛋白质功能输出与代谢状态。这种能力对于解析肿瘤免疫逃逸等复杂生物过程具有变革意义。

5.4 构建下一代生物信息基础设施。

面对海量、异构的多中心多组学数据,亟需可扩展的计算生态。这包括:1. 集成化数据库(如SOAR、STOmicsDB、CROST、SODB)用于存储与共享;2. 交互式分析框架(如SMDR)支持个性化报告生成。 这些基础设施不仅是工具,更是确保研究方法具备可重复性、安全性与临床有效性的基石。

5.5 生态协同与规范建设至关重要。

由SpatioTemporal Omics Consortium、GESTALT等倡议推动的社区协作与标准化努力,已加速资源共享、协议统一与技术普及。未来还需加强监管机构与科研界的协作,建立合理的法规框架,以保障ST技术在临床应用中的安全与合规。

综上,通过技术简化、AI革新、多组学融合、基建完善与生态共建的多维度协同推进,ST有望充分释放其潜力,实现多维、多模态、多切片数据的深度整合,为医学与生命科学的发展作出重大贡献。

六、结论

ST技术凭借其在细胞空间定位与基因表达分析方面的独特优势,已成为生命科学研究中的一项变革性工具。本文全面综述了ST的技术分类与分析流程,并深入探讨了该技术当前的应用现状与所面临的挑战。尽管ST在基础研究领域已取得显著进展,但在向临床应用转化过程中仍面临诸多障碍,包括技术性能的多样性、数据分析的复杂性,以及标准化工作流程的缺失,这些因素贯穿整个应用链条,制约了其临床落地。

参考资料:

  1. Spatial transcriptomics: integrating platforms and computational approaches for clinical insights. Biotechnol Adv.2025 Dec 26:87:108791.