大幅度共激活模式在静息态功能磁共振成像(fMRI)中稀疏存在,但它们驱动了功能连接并类似于任务激活模式。然而,很少有研究对剩余的绝大部分静息态信号进行特征描述。在此,我们介绍了“特征放大”(Caricaturing),这是一种将静息态数据投影到一个子空间的方法,该子空间正交于从任务态 fMRI 数据估计出的共激活模式流形。这一过程从静息态数据中去除了这些共激活模式的线性组合,从而创建了特征放大连接组。我们使用了来自两个大规模神经影像数据集的任务态数据来构建任务共激活模式的流形,并创建了特征放大连接组。这些连接组表现出较低的个体间相似性和较高的可识别性,并可用于预测表型测量指标,这些指标代表了行为中的个体差异,且通常比标准连接组的预测程度更高。我们的结果表明,在驱动静息态功能连接的主导共激活之外,存在有用的信号,这可能更好地表征大脑的固有功能架构。本文发表在Nature Neuroscience杂志。
正文
静息态下的功能连接是由短时的、空间分布的共激活事件爆发驱动的,这些事件仅占扫描的一小部分。这些共激活增加了功能网络之间的时间相关性和静息态信号的非平稳性,模仿了任务诱导的活动模式。然而,它们可能是有问题的,因为它们仅占信号的一小部分且偶发出现,导致低可靠性和预测效用。
相关地,存在两个强调功能连接中个体差异的理论框架。“聚光灯”(spotlight)方法“[模糊]无关特征,同时保留并丰富相关特征。”任务诱导的功能磁共振成像(fMRI)信号变化通过在个体间一致地调节共激活来实现这一目标。由于任务范式有意引发这些强烈的共激活,它们在任务期间被更密集地采样,从而驱动相对稳定的连接模式。结果是,任务态连接组表现出比静息态连接组更高的个体内和个体间相似性、可靠性和预测效用。这些改进已在经典任务范式以及现代自然主义和电影范式中被观察到。将静息态连接组转换为任务态连接组的方法同样提高了可靠性和预测性。
第二个框架——“特征放大”(caricature)方法——旨在夸大“每个个体最显著的特征”。就像夸张漫画一样,个体之间的相似度会降低,从而减少个体间相似性并增加个体差异。虽然存在多种统计方法来分离连接组的群体成分和个体成分,但一种更可解释的方法可能是去除共激活事件。由于任务诱导的共激活模式位于参与者共有的低维流形上,任务态 fMRI 数据的特征分解(eigendecomposition)可以以无监督的方式灵活地识别这些模式。将静息态数据投影到正交于该流形的子空间,将从静息态数据中去除这些共激活模式的线性组合。由于个体参与相似的任务相关共激活模式,去除它们将以类似于夸张漫画的方式减少个体间相似性。如果个体差异也得到增强,那么去除静息态 fMRI 中的类任务共激活将通过使用通常被他人丢弃的信号来形式化这一思想实验。
在这项工作中,我们研究了共激活事件之外的信号以实施特征放大。我们使用四个数据集比较了投影数据(即特征放大连接组)与标准静息态连接组的个体内和个体间相似性。我们还研究了特征放大连接组的多变量和单变量可靠性。最后,我们使用基于连接组的预测模型(CPM)测试了这些未被充分研究的信号是否携带有关行为个体差异的信息。特征放大连接组的表现就像夸张漫画一样,表现出较低的个体间相似性但较高的多变量可靠性。特征放大连接组显著预测了多个表型测量指标。重要的是,这些结果表明,一个隐藏的信号——存在于驱动静息态功能连接的主导共激活模式之外——包含有关行为个体差异的信息,并且可能更适合表征大脑的固有功能架构。
为了实施特征放大,我们将静息态 fMRI 时间序列投影到远离从任务态时间序列估计的任务共激活模式流形的地方(图 1a)。首先,跨任务和参与者在时间上拼接任务态时间序列,并构建相应的协方差矩阵。然后计算组级特征向量。接下来,创建一个投影矩阵,将 fMRI 时间点投影到一个正交于解释最多方差的特征向量的子空间中。这些顶部特征向量代表了跨任务反复出现的低维(即主导)共激活模式。将此投影矩阵乘以静息态扫描中的每个时间点,创建一个不包含来自这些主导共激活模式信息的新时间序列。最后,像往常一样通过关联成对的时间序列来创建特征放大连接组。
图 1:特征放大概览
a, 特征放大由两部分组成。第一部分是从组级任务态 fMRI 定义任务流形。我们在时间上拼接个体的所有任务时间序列并构建协方差矩阵。计算组级特征向量。每个特征向量代表跨任务的共同共激活模式。第二部分是将静息态数据投影远离该流形。我们创建一个排除顶部特征向量(例如,本工作中的前五个)的特征向量矩阵。将该矩阵乘以其转置(记为 T)以获得投影矩阵。接下来,我们将投影矩阵与静息态扫描的每个时间点相乘,使它们正交于任务流形。通过关联这些正交化后的时间序列来创建特征放大连接组。BOLD,血氧水平依赖信号;WM,工作记忆。
b, 在几个下游分析中,我们将特征放大连接组与标准连接组(即使用标准静息态 fMRI 数据创建的连接组)进行比较。首先,我们通过研究个体内和个体间相似性,以及多变量(指纹识别和可辨别性)和单变量(边级 ICC)可靠性,观察该方法如何在机制上改变数据。接下来,我们使用 CPM 调查特征放大连接组是否包含有关行为个体差异的信息。
先前的工作已经从静息态数据中去除信号以提高数据质量。通常,这些工作使用主成分分析(PCA)作为数据降维的方法,并去除低方差主成分(即底部特征向量)。由于底部特征向量通常被视为噪声,这些方法被认为是对静息态数据去噪,从而提高了参与者的可识别性和预测效用。
与这些工作相反,特征放大是次成分分析(MCA)的一种实现。虽然 PCA 是一种使用顶部成分的降维技术,但 MCA 提取的是解释最小方差的成分。MCA 在人们对数据中较弱、不太显著的模式感兴趣的情况下很有用,因为它强调了可能被 PCA 忽略的小波动或模式。因此,特征放大挑战了许多使用 PCA 的工作中隐含的假设:即静息态中最重要的信号是前几个成分(即大幅度共激活模式)。相反,它丢弃了主导的共激活模式并保留了剩余信号。换句话说,特征放大研究的是以前在基于 PCA 的方法中被去除的信号。
我们使用人类连接组计划 (HCP)、加州大学洛杉矶分校 (UCLA) 神经精神表型组学联盟 (CNP) 和耶鲁重测 (TRT) 数据集进行主要分析。耶鲁跨诊断数据集 (Yale Transdiagnostic Dataset) 用于外部验证。补充图 1 总结了这些数据集的人口统计信息。HCP 和 CNP 数据集包含丰富的任务数据,被独立用于创建任务共激活流形和相关的投影矩阵。使用两个数据集创建不同的流形突显了特征放大对所使用的任务和数据集具有通用性。来自 HCP 和 TRT 数据集的静息态数据被投影远离该流形,从而创建了“特征放大”连接组。“特征放大HCP”(caricaturedHCP)或“特征放大CNP”(caricaturedCNP)表示使用哪个数据集(HCP 或 CNP)来生成流形。当仅使用 HCP 创建特征放大连接组时,我们应用了经过验证的子采样程序(补充图 2-5)以避免数据泄漏。简而言之,对于下游分析的任何迭代,参与者要么用于特征分解,要么用于分析,但不能同时用于两者。补充图 6 突显了与标准连接组相比,特征放大连接组的相关结构减弱了。补充图 7 展示了调查人口统计信息如何影响特征向量结构的敏感性分析。
我们评估了来自 HCP 和 TRT 数据集的特征放大连接组,并在多个下游分析中将其与标准连接组(即使用标准静息态 fMRI 数据创建的连接组)进行了比较(图 1b)。首先,我们在 HCP 和 TRT 数据集中表征了个体内和个体间的相似性。其次,我们在 HCP 和 TRT 数据集中通过指纹识别(从参与者池中识别个体)、可辨别性以及使用组内相关系数 (ICC) 的单变量可靠性分析了多变量可靠性。请注意,可辨别性与文献中也使用过的类似方法——差异可识别性——是不同的。多变量可靠性反映了多维数据的稳定性,例如全脑模式,而单变量可靠性反映了每个测量单独的可靠性。对于相似性和可靠性分析,我们像以前一样在构建连接组之前将 HCP 时间序列截断为 176 帧,以避免潜在的天花板效应,因为更长的扫描持续时间会提高连接组稳定性和指纹识别准确性。第三,我们在 HCP 数据集上对年龄、智商 (IQ) 和性别进行了 CPM 分析。耶鲁跨诊断数据集用于这些模型的外部验证。选择年龄、性别和 IQ 是因为它们具有中到大的效应量,并且常用于预测模型的基准测试。补充信息中列出了针对效应量范围更广的不太常见变量的附加模型。这些变量包括体重指数 (BMI)、边缘性人格障碍 (BPD) 的代理评分,以及 HCP 数据集中情感和关系任务期间的两项任务表现测量指标。连续变量(例如年龄和 IQ)的模型使用岭回归,而分类模型(例如性别)使用支持向量机。模型使用 10 倍交叉验证的 1,000 次迭代进行训练和测试。基于特征放大连接组的显著预测表明,主导共激活模式之外的信号包含有关行为个体差异的信息。
除非另有说明,所有统计检验均为非参数置换检验或子采样检验,效应量报告为百分比增加或减少。必要时应用了 Bonferroni 校正。详细的统计信息在“方法”部分的“统计”中阐述。
任务共激活模式低维流形的复制与验证
在 HCP 中,我们复制了之前的结果,以验证任务驱动的活动位于低维流形上。正如在特征放大中一样,使用来自 HCP 数据集中所有参与者的拼接任务数据计算组级特征向量。然后,我们将前五个特征向量时间序列与任务块回归量相关联。与之前的结果一致,第一个特征向量的时间序列与全任务块回归量(通过组合所有任务的回归量创建)密切相关(平均 r = 0.387;补充图 2a)。此外,第五个特征向量的时间序列与全任务块回归量导数的绝对值相关(平均 r = 0.113)。其余特征向量时间序列与任务回归量的相关性各不相同(补充图 2a)。
特征放大连接组降低了个体内和个体间的相似性
我们研究了特征放大和标准连接组的个体内和个体间相似性,因为特征放大应该降低个体间相似性。正如在 HCP 中预期的那样,特征放大HCP 连接组显示出个体间相似性降低了 53%(P < 0.008;带 Bonferroni 校正的子采样检验;图 2a)。然而,这些连接组也显示出个体内相似性降低了 42%(P < 0.008;带 Bonferroni 校正的子采样检验;图 2a)。同样,特征放大CNP 连接组表现出个体内相似性降低 39%,个体间相似性降低 48%(P < 0.0001;Cohen’s d:d_within = -2.36,d_between = -2.47;带 Bonferroni 校正的配对 t 检验;图 2b)。最后,在 TRT 数据集中,特征放大连接组也表现出同样的趋势(图 2c),个体内(26%)和个体间(41%)相似性显著降低(P < 0.0001;Cohen’s d:d_within = -2.88,d_between = -3.51;带 Bonferroni 校正的配对 t 检验)。值得注意的是,这些变化与聚光灯方法形成对比,后者增加了个体内和个体间的相似性。
图2:连接组相似性
a, 使用 1,000 次迭代的子采样程序,计算了 HCP 数据集中每个扫描条件下从左到右 (LR) 和从右到左 (RL) 相位编码扫描对之间的相似性。每次迭代获得个体内和个体间相似性分布,并计算每个分布的中位数。蓝色分布说明了每次迭代的中位数个体内相似性,而红色分布显示了中位数个体间相似性。显示了第一、第二和第三四分位数。标准与特征放大相似性:P < 0.008 (REST1 个体内);P < 0.008 (REST2 个体内);P < 0.008 (REST1 个体间);P < 0.008 (REST2 个体间);带 Bonferroni 校正的双侧子采样检验。
b, 进行了相同的分析,但改用 CNP 数据集构建任务流形。仅进行了一次迭代,使用了所有参与者。显示了每种条件下的完整个体内相似性分布(蓝色)和个体间相似性分布(红色),以及第一、第二和第三四分位数。标准与特征放大相似性:t660 = 62.34, P = 3.58 × 10−278 (REST1 个体内);t660 = 59.22, P = 1.07 × 10−265 (REST2 个体内);t436,259 = 1.64 × 103, P < 1.98 × 10−323 (REST1 个体间);t436,259 = 1.62 × 103, P < 1.98 × 10−323 (REST2 个体间);带 Bonferroni 校正的双侧配对 t 检验。
c, 在 TRT 数据集中进行分析,使用 HCP 或 CNP 数据集构建用于投影的任务流形。显示了每种条件下的完整个体内相似性分布(蓝色)和个体间相似性分布(红色),以及第一、第二和第三四分位数。标准与特征放大相似性:t3,311 = 183.03, P < 1.98 × 10−323 (HCP 个体内);t3,311 = 147.92, P < 1.98 × 10−323 (CNP 个体内);t38,015 = 725.8, P < 1.98 × 10−323 (HCP 个体间);t38,015 = 641.39, P < 1.98 × 10−323 (CNP 个体间);带 Bonferroni 校正的双侧配对 t 检验。
特征放大提高了多变量可靠性
我们研究了多变量可靠性,以确定连接组相似性的变化是否对数据产生了更广泛的影响。可靠性广义上是个体内和个体间相似性的函数,两者之间较高的比率与较高的可靠性相关。在 HCP 数据集中,特征放大HCP 连接组表现出比标准连接组显著更好的指纹识别能力,准确率提高了 41%(P < 0.004;带 Bonferroni 校正的子采样检验;图 3a)。使用特征放大CNP 连接组的结果相似,准确率平均提高 42%(P < 0.004;带 Bonferroni 校正的置换检验;补充表 1)。在 TRT 数据集中,我们还评估了完全可分离率 (PSR),这是指纹识别在每位参与者有两个以上扫描会话的数据集中的扩展。特征放大连接组将 PSR 提高了 281%(P < 0.004;带 Bonferroni 校正的置换检验;补充表 2)。使用 HCP,特征放大HCP 和特征放大CNP 连接组的可辨别性平均比其标准对应物提高了 4%(P < 0.004;带 Bonferroni 校正的 subsamplingHCP 和 permutationCNP 检验;图 3b 和补充表 3)。最后,在 TRT 数据集中,特征放大HCP 和特征放大CNP 连接组的可辨别性比标准连接组高 2%(P_HCP = 0.048,P_CNP = 0.26;带 Bonferroni 校正的置换检验;补充表 3)。TRT 数据集中的可辨别性几乎完美,几乎没有大幅改进的空间。参与者数量较少可能会夸大可辨别性。虽然特征放大连接组的个体内和个体间相似性均有所下降,但个体间相似性的下降幅度大于个体内相似性,从而提高了多变量可靠性。
图3:多变量可靠性
a,b, 指纹识别 (a) 和可辨别性分析 (b) 是针对 HCP 数据集中每种条件下的一对 LR 和 RL 相位编码扫描的 1,000 个个体子样本进行的。点代表每次迭代的平均指纹识别准确度 (a) 和可辨别性 (b),半小提琴图展示了分布情况,并显示了第一、第二和第三四分位数。标准与特征放大:P < 0.004 (REST1 指纹识别);P < 0.004 (REST2 指纹识别);P < 0.004 (REST1 可辨别性);P < 0.004 (REST2 可辨别性);带 Bonferroni 校正的双侧子采样检验。
单变量可靠性随特征放大而降低
图 4:组内相关系数 (ICC)
a, ICC 是针对 1,000 个参与者子样本计算的,使用每种条件下的一对 LR 和 RL 相位编码扫描作为每个参与者的多次测量。点代表跨迭代的平均边 ICC,半小提琴图展示了分布情况,并显示了第一、第二和第三四分位数。标准与特征放大:Z = 112.2, P < 9.88 × 10−324 (REST1);Z = 109.54, P < 9.88 × 10−324 (REST2);带 Bonferroni 校正的 Wilcoxon 符号秩检验。
b, 计算了 LR 和 RL 相位编码静息态扫描的 ICC。特征放大扫描被投影到源自 CNP 数据集的特征向量上。标准与特征放大:Z = 110.73, P < 9.88 × 10−324 (REST1);Z = 105.47, P < 9.88 × 10−324 (REST2);带 Bonferroni 校正的 Wilcoxon 符号秩检验。
c, 在 TRT 数据集中计算 ICC,使用运行和会话结构来划分每个参与者的多次测量。特征放大扫描被投影到源自 HCP 和 CNP 数据集的特征向量上。标准与特征放大:Z = 54.22, P < 9.88 × 10−324 (HCP);Z = 32.05, P = 4.09 × 10−225 (CNP);带 Bonferroni 校正的双侧 Wilcoxon 符号秩检验。
特征放大连接组包含关于行为个体差异的信息
最后,使用 CPM,我们测试了特征放大连接组是否包含有关行为个体差异的信息。特征放大连接组显著预测了(P ≤ 0.032,置换检验)年龄、IQ、性别、BMI、BPD(除一种情况外)、关系任务表现(在两种情况下)和情感任务表现(在一种情况下)(图 5,补充图 10 和补充表 4 和 5)。建立在标准连接组上的模型同样具有显著的预测性(P ≤ 0.031,置换检验)。最后,我们评估了外部验证(补充部分 1.7)以解释模型中可能存在的过拟合。使用特征放大连接组的模型是显著的(补充图 16)。这些结果表明,通常被忽略的信号(例如,特征放大所强调的信号)包含有关行为个体差异的丰富信息。
图5:CPM 预测准确性
a–c,在 HCP 中为年龄 (a)、智商 (b) 和性别 (c) 构建了模型。左侧面板的特征放大连接组使用 HCP 任务数据构建,右侧面板使用 CNP 任务数据构建。对于年龄和智商,使用预测表型与实际表型之间的 Pearson 相关性来评估模型。对于性别,根据被正确分类的参与者百分比来评估模型。在所有图中,点代表十倍交叉验证的 1,000 次随机化之一的模型性能。显示了分布的第一、第二和第三四分位数。标准与特征放大:t999 = 13.7, P = 5.48 × 10−39 (子采样 REST1 年龄);t999 = 9.92, P = 6.74 × 10−22 (子采样 REST2 年龄);t999 = 10.39, P = 9.24 × 10−24 (外部 REST1 年龄);t999 = 8.42, P = 2.58 × 10−16 (外部 REST2 年龄);t999 = 4.02, P = 1.25 × 10−4 (子采样 REST1 智商);t999 = 5.02, P = 1.22 × 10−6 (子采样 REST2 智商);t999 = 5.25, P = 3.69 × 10−7 (外部 REST1 智商);t999 = 3.27, P = 0.0022 (外部 REST2 智商);t999 = 5.59, P = 5.87 × 10−8 (子采样 REST1 性别);t999 = 1.48, P = 0.2808 (子采样 REST2 性别);t999 = 6.17, P = 1.93 × 10−9 (外部 REST1 性别);t999 = 2.92, P = 0.0072 (外部 REST2 性别);带 Bonferroni 校正的双侧校正配对 t 检验。
由于多变量可靠性为预测提供了上限,我们检查了特征放大连接组改进的 CPM 结果是否伴随着多变量可靠性的增加。结果表明,特征放大在大多数情况下显著提高了预测性能。对于年龄、IQ 和 BMI,建立在特征放大HCP 连接组上的 CPM 模型显著优于标准连接组(P ≤ 0.0001;Cohen’s d:d_age = 3.96,d_IQ = 1.51,d_BMI = 5.21;带 Bonferroni 校正的校正配对 t 检验),年龄解释的方差增加了 31%,IQ 增加了 34%,BMI 增加了 18%(图 5a,b 和补充图 10a 和 11,左侧面板)。特征放大CNP 连接组的结果相似(图 5a,b 和补充图 10a 和 11,右侧面板),年龄、IQ 和 BMI 的解释方差平均增加 15%(P ≤ 0.0022;Cohen’s d:d_age = 3.15,d_IQ = 1.43,d_BMI = 4.39;带 Bonferroni 校正的校正配对 t 检验)。对于特征放大HCP 和特征放大CNP 连接组,性别分类更准确——在除一种情况外的所有情况下都显著(显著 P ≤ 0.0072;显著 Cohen’s d:d_HCP = 1.87,d_CNP = 1.52;带 Bonferroni 校正的校正配对 t 检验;图 5c)。对于任务表现,特征放大连接组在八种情况中的六种中显著优于标准连接组(补充图 10c,d)。BPD 是唯一一个特征放大导致预测性能显著下降的指标(补充图 10b)。总之,这些结果表明,特征放大可以提高具有不同效应量范围的表型的预测性能。
我们还检查了每个模型特征的多重共线性以评估模型的可解释性。在所有表型中,建立在特征放大HCP 连接组上的模型的多重共线性较低(补充图 12 和 13)。然而,与建立在标准连接组上的模型相比,建立在特征放大HCP 连接组上的模型中的特征数量并没有一致的差异(补充图 14)。尽管某些模型具有相似数量的特征,但所选特征的重叠相对较低(补充图 15)。鉴于标准连接组模型和特征放大连接组模型之间的差异,我们探索了将两种连接组结合到一个模型中。总体而言,这些组合模型表现出数值上改进的预测性能(补充部分 1.8)。因此,特征放大连接组比标准连接组提高了 CPM 性能,部分是通过改善连接组的特征空间和多变量可靠性来实现的。
来自静息态和电影数据的共激活模式低维流形
我们还测试了使用静息态或电影数据创建共激活模式的低维流形。我们计算了任务衍生流形和静息衍生流形之间的重叠,以评估流形是否相同(补充图 18)。正如预期的那样,这些流形重叠,这表明特征向量几乎可以等效地从任务或静息中得出。这些结果支持一个主要假设:即特定任务期间存在的全脑模式不仅在静息态期间被观察到,而且是主导的。此外,我们使用从 CNP 静息态数据或耶鲁跨诊断数据集电影数据得出的前五个特征向量创建了特征放大HCP 连接组。接下来,我们复制了上述分析(补充部分 1.9 和 1.10)。在特征放大连接组中,个体内和个体间相似性均降低,指纹识别准确性增加(补充图 19 和 21 以及补充表 6 和 7)。最后,我们使用静息和电影衍生的特征向量进行特征放大获得了类似的预测结果(补充图 20 和 22)。
讨论
在这项工作中,我们介绍了特征放大法(caricaturing)——一种将静息态数据投影到正交于从任务 fMRI 数据估计出的共激活模式流形的子空间的方法,以推定去除任务共激活模式。我们的工作表明,投影后剩余的信号保留了有关个体差异的信息,通常比标准静息态信号的程度更高。如果静息态数据结合了固有功能架构和类任务共激活,则剩余信号可能更好地代表这种固有功能架构,并且是一个值得进一步研究的主题。同时,特征放大可以应用于现有和未来的静息态数据,以评估个体差异的新来源。
共激活事件可能掩盖静息态中包含个体差异信息的信号
静息态功能连接可能难以解释。先前的工作,包括那些进行功能梯度映射的工作,已经显示了从任务数据生成的流形(或梯度)与从静息态数据生成的流形之间的重叠。如果静息态数据结合了类任务共激活事件和固有功能架构,那么应该可以将两者分开,类似于区分连接组的群体部分和个体部分。由于我们的方法将静息态数据投影到正交于任务相关流形的子空间,剩余信号可能代表固有功能信号。我们的结果表明,关于个体差异的信息存在于这个剩余信号中,其程度可能比在共激活事件中发现的更高。尽管有这些结果,但在特征放大中使用的信号通常被丢弃,转而研究共激活事件。此外,许多工作使用 PCA 去除连接组中的低方差成分。总之,这些方法将低方差成分视为噪声。通过使用 MCA,特征放大避免了神经影像学中的这种常见做法,强调了这些通常被丢弃的信号的重要性。我们和其他人的结果表明,静息态信号包含的信息比以前使用的要多得多。
虽然特征放大信号的组成尚不清楚,但它可能包含个体内状态差异、自发活动和神经变异性。随着主导的类任务成分通过 MCA 被抑制,这些较小的成分将相对增强。此外,个体差异在特征放大连接组中的表现与在标准连接组中根本不同。它们位于不同的边中(补充图 15),并且更有效地跨边表征信息(补充图 12 和 13)。例如,神经变异性(例如,大脑状态参与的变异性)通常被认为是噪声源,就像 PCA 中的底部主成分一样。然而,它对大脑功能至关重要。特征放大可能被证明是研究自发活动和神经变异性的宝贵工具。
类任务共激活调节个体内和个体间相似性以及个体差异的检测
正如理论所言,特征放大通过夸大个体特有的品质来降低个体间相似性。换句话说,特征放大不再强调个体间的共同特征。这种方法与聚光灯方法形成对比,后者利用任务引发更大的个体内和个体间相似性。在这种情况下,一般的任务相关信号可能会驱动相似性。例如,即使一个个体在两次扫描中从事不同的任务,任务相关信号的通用性也会增加他们的相似性(例如,默认模式失活)。当去除一般任务相关或组级信号时,个体内相似性将降低。然而,这两种方法,以及其他专门寻求去除组级信号的方法,都可以随着个体内与个体间信息的比率增加而增强个体差异。未来的工作应该确定是否可以在最大化个体内相似性的同时最小化个体间相似性。
矛盾的是,“添加”和“减去”类任务共激活模式似乎都能增强个体差异。我们推测类任务共激活模式以及静息态中的剩余信号都携带个体差异。然而,我们认为静息态是两者的错误组合。静息态中类任务共激活的稀疏性限制了可以提取的关于个体差异的信息。让参与者执行任务会增加共激活模式的频率和强度,从而允许提取更多的个体差异。相比之下,在静息态中,虽然类任务共激活很稀疏,但它们掩盖了剩余信号,而剩余信号也包含丰富的个体差异。去除共激活允许访问此信号以改进对个体差异的检测。
特征放大类似于数据预白化
聚光灯和特征放大类似于时间序列分析(包括神经影像学)中用于处理自相关的两种方法:预染色(precoloring)和预白化(prewhitening)。在预染色中,向时间序列添加大的相关性以掩盖未知的现有自相关。总自相关只能作为添加的成分进行估计并输入模型以改进统计推断。在聚光灯方法中,任务在静息之上添加了一种结构,掩盖了其无约束的性质,并以概念上相似的方式改进了下游分析(即识别和预测)。然而,预染色也充当低通滤波器,可能会去除感兴趣的信号并降低功效,类似于任务可能会掩盖有用的潜在信号。与预染色相反,预白化估计真实的自相关以直接将其去除。一旦去除,经典的统计推断就是有效的。同样,我们的特征放大方法估计组衍生的、类任务共激活并从静息态数据中去除它们以提高识别和预测。在大多数应用中,预白化优于预染色。然而,预白化需要准确的自相关模型,这在真实数据中很难确定,类似于估计真实的类任务共激活模式具有挑战性。与预白化和预染色一样,未来的研究将阐明聚光灯和特征放大的优缺点,以及它们如何相互补充。
多变量可靠性与单变量可靠性是可分离的
特征放大连接组具有更高的多变量可靠性,但单变量可靠性较低。虽然通常齐头并进,但多变量可靠性的增加并不保证单变量可靠性的增加。它们是截然不同的。同样,提高单变量可靠性可能不会增强预测效用。我们的结果进一步阐明了这一观察结果。预测方法本质上是多变量的,反映了分布在许多特征上的模式。提高每个特征(即单变量)的可靠性可能不会使整体模式更可靠,或者反过来,更具预测性。因此,增加多变量可靠性而不是单变量可靠性的方法更有能力改进预测模型。
局限性
我们的工作有几个局限性。首先,虽然我们将静息态数据投影远离任务共激活模式流形,但不清楚从静息态数据中去除了多少任务相关信息。与先前的研究一致,特征向量在时间上跟踪任务设计。因此,特征向量中的一部分信息肯定归因于任务。然而,一些任务相关信号可能不像选定的共激活模式。未来的研究需要确定静息态数据中存在多少任务相关信息以及如何将其去除。其次,我们仅使用线性方法来定义流形。然而,存在许多非线性方法可能更好地识别任务共激活模式。通过非线性技术的进一步发展可能会揭示互补的结果。第三,我们使用相关性来测量多变量可靠性分析的距离。然而,其他指标,如测地线距离,已经实施,可能会产生略有不同的结果。第四,虽然我们的主要目标不是提高预测性能,但观察到的改进是适度的。由于方法的种类繁多,很难直接与更广泛的文献进行比较。然而,由于特征放大作用于数据,它可以与其他进步(如深度神经网络)结合以进一步改进。第五,重要的是要注意特征放大是否受到各种人口统计因素(例如种族)的偏见。静息态数据中解释的方差与人口统计变量显示出微弱到中度的相关性(补充图 7),表明特征放大没有过度学习人口统计分布信息。未来的工作应继续评估特征放大中是否可能嵌入任何偏见。最后,由于特征放大使用 MCA,特征放大数据可能比标准连接组包含更高比例的非结构化噪声。然而,鉴于已证明的可识别性和预测效用,它们可能保留了强烈的神经信号。
结论
总之,我们介绍了一种特征放大方法,该方法将静息态 fMRI 数据投影到远离任务共激活模式流形的地方,以推定去除任务共激活模式。我们的工作表明,投影后剩余的信号保留了有关个体差异的信息,通常比标准静息态信号的程度更高。如果静息态数据结合了固有功能架构和类任务共激活,则剩余信号可能更好地代表这种固有功能架构,并且是一个值得进一步研究的主题。同时,特征放大可以应用于现有和未来的静息态数据,以评估个体差异的新来源。