软件所在因果自监督图对比学习方面取得进展

文章来源:  |  发布时间:2024-01-09  |  【打印】 【关闭

  
近日,中国科学院软件研究所天基综合信息系统重点实验室研究团队的论文Rethinking Dimensional Rationale in Graph Contrastive Learning from Causal Perspective被计算机科学领域顶级学术会议AAAI接收。共同第一作者为博士生戢启瑞、特别研究助理李江梦。论文从因果的角度探索自监督图对比学习(GCL)中的维度基本原理,并在预训练阶段进一步形式化变量之间的因果关系,构建相应的结构因果模型。研究团队在此基础上提出了能感知维度基本原理的图对比学习方法DRGCL,使图神经网络在图对比学习的无监督设定和迁移学习设定中取得了显著的性能提升。

GCL是一种通用的学习范式,旨在从图中的多样扰动中捕获不变信息。近来大量关于GCL的研究着重于从图中探索结构基本原理,即图特征中可以引导或解释模型预测的特定子集,从而增加不变信息的判别准确性。然而,这类方法可能导致图模型学习到噪声信息以及任务无关信息,从而影响了模型的预测能力。

为了解决上述问题,研究团队提出从图表示中捕获维度基本原理,并在生化分子数据集PROTEINS和社交网络数据集RDT-B上进行探索性实验。实验通过随机保留某些维度同时屏蔽其他维度,来探究图表示维度对模型预测的影响。研究团队从结果中观察到保留特定维度的图表示比原始图表示具有更好的性能,证明了维度基本原理的存在以及特定的维度基本原理能对GCL的预测起到积极作用。

探索性实验结果

根据探索性实验的结果,研究团队构建了GCL预训练阶段的结构因果模型来阐述维度基本原理R、图表示E以及图对比学习标签Y之间的关系:R既能作用于E又能作用于Y,因此在探究EY的直接因果效应时,E←R→Y是一条后门路径,R是一个混淆变量。由于后门路径的存在,原始图神经网络实际拟合的是RY的总因果效应。为了消除后门路径和混淆变量的影响,研究团队引入后门准则来干预E、校正R以获得EY的直接因果效应。

结构因果模型

基于上述分析,研究团队提出了图对比学习方法DRGCL,其中维度基本原理采用与图表示维度数量相等的一维向量R实现。DRGCL在预训练过程中采用传统GCL范式和元学习范式进行迭代:在第一个训练步,通过传统的GCL范式训练编码器、投影头的参数,包括同时最小化对比损失和冗余减少损失;在第二个训练步,使用二阶导数来重加权特定的维度,以保留与任务相关的信息,这被视为维度基本原理的迭代更新,使DRGCL可以在训练过程中通过后门调整来进行因果干预。

DRGCL框架图

研究团队从理论分析和实验验证两方面证明了DRGCL的有效性。在理论方面,通过分析维度基本原理与之前的结构基本原理的关系,发现维度基本原理具有更强的表示能力,是结构基本原理的泛化解;证明了DRGCL能有效限制GCL下游分类损失的误差界。在实验方面,通过将DRGCL与多种不同的图对比学习方法在8个图分类基准数据集(TU-dataset)上进行对比,证明了DRGCL能更好地捕获图数据的判别特征;团队将DRGCL进一步应用于图迁移学习基准数据集(CHEM),在处理下游任务方面DRGCL比最优的基线方法提升了0.4%的性能,说明DRGCL能提升图神经网络的泛化能力。此外,研究团队还通过消融实验和理论分析,证明了DRGCL对图神经网络的贡献及合理性。

论文地址:https://arxiv.org/abs/2312.10401

代码地址:https://github.com/ByronJi/DRGCL