本篇论文已被NeurIPS 2024接收,论文第一作者但俊来自浙江大学&FaceChain社区,共一作者刘洋来自伦敦国王学院&FaceChain社区,通讯作者孙佰贵来自阿里巴巴&FaceChain社区,还有合作作者包括帝国理工学院邓健康,FaceChain社区谢昊宇、李思远,伦敦国王学院罗山。
一、前言
在数字人领域,形象的生成需要依赖于基础的表征学习。FaceChain 团队除了在数字人生成领域持续贡献之外,在基础的人脸表征学习领域也一直在进行深入研究。采用了新一代的 Transformer 人脸表征模型 TransFace 后,FaceChain 去年也是推出了 10s 直接推理的人物写真极速生成工作,FaceChain-FACT。继 TransFace 之后,FaceChain 团队最近被机器学习顶级国际会议 NeurIPS 2024 接收了一篇人脸表征学习新作, ‘TopoFR: A Closer Look at Topology Alignment on Face Recognition’,让我们一睹为快。

-
论文链接:https:///pdf/2410.10587 -
开源代码:https://github.com/modelscope/facechain/tree/main/face_module/TopoFR
变化而进化的过程中所呈现的拓扑不变性特征,其主要用于分析复杂点云的潜在拓扑结构。近年来,持续同调技术在信号处理、视频分析、神经科学、疾病诊断以及表征学习策略评估等领域表现出了极大的优势。在机器学习领域,一些研究已经证明了在神经网络训练过程中融入样本的拓扑特征可以有效地提高模型的性能。
表示一个点云,
表示一个在
空间中的距离度量。矩阵
表示点云
中各点之间的成对距离矩阵。
,我们表示点云
在尺度
处所对应的 Vietoris-Rips 复形为
,其包含了点云
中所有的单纯形(即子集),并且点云
中的每个成分满足一个距离约束:
,
。
。基于这个关系,我们能够随着尺度系数
的增加而追踪单纯复形的进化过程。值得注意的是
和
是等价的,因为构建 Vietoris-Rips 复形只需要距离信息。
下单纯复形的拓扑特征,例如连通分量 (
)、环 (
)、空洞 (
) 和更高维特征 (
)。通过跟踪 Vietoris-Rips 复形的拓扑特征
随着尺度
增加而呈现的相应变化,可以深入了解底层空间的多尺度拓扑信息。
是笛卡尔平面
中点
的多重集合,其编码了关于拓扑特征寿命的信息。具体来说,它总结了每个拓扑特征的诞生时间b和消失时间d ,其中诞生时间b表示特征被创建的尺度,而消失时间d指的是特征被销毁的尺度。持续配对
包含与持久图
中标识的拓扑特征的诞生和消失相对应的单纯形
的索引
。 
表示第j维同调。持续图是用来描述空间拓扑结构的数学工具,其中持久图中的第j维同调
代表空间中的第j维空洞。在拓扑理论中,如果空间中高维空洞的数量越多,那么底层空间的拓扑结构就更越复杂。如图 1 (a)-1 (d) 所示,随着人脸数据量的增加,输入空间的持久图中包含的高维空洞(如
和
)也越来越多。因此,这一实验现象清晰地表明了输入空间的拓扑结构也变得越来越复杂。 

表示乘法操作。
表示对每个训练样本应用 RSP 的概率。
,其中包含了四个常见的数据增强运算:随机擦除
,高斯模糊
,灰度化
以及颜色增强
。对于每一个训练样本
,RSP 会随机挑选一个数据增强
运算来对其进行扰动:
将正式送入网络进行有监督训练,这极大地增加隐层特征空间的拓扑结构多样性。我们采用 ArcFace Loss 作为基础分类损失函数:
与扰动特征空间
的 Vietoris-Rips 复形
和
。并利用持续同调技术求解出其对应的持续图
和持续配对
。理想地,不管输入的人脸图像怎样被干扰,其编码在隐层空间中的位置应该保持不变。因此,我们提出对齐原始输入空间和扰动特征空间的拓扑结构,不变性结构对齐机制所对应的损失函数如下所示:

建模了困难样本,而高斯分布
建模了简单样本。因此,某个样本属于困难样本(即由于较大的预测不确定性)的后验概率可以被计算为:
来自适应地为每个样本计算结构破坏性分数 SDS:

将带来两个好处:
将鼓励模型从多样化的训练样本中捕捉出更有泛化性的人脸特征。(ii)最小化结构破坏性分数 SDS
能够有效减轻困难样本对隐层空间结构的破坏,这有利于结构信息的保留以及清晰决策边界的构建。

也能被 Focal Loss
所修正。
和黑色标记
分别表示正确分类样本和错误分类样本的熵。