软件所提出基于演化博弈论的自监督学习性能平衡方法----中国科学院软件研究所

软件所提出基于演化博弈论的自监督学习性能平衡方法

来源：时间：2024-12-13

近日，软件所天基综合信息系统全国重点实验室研究团队在CCF-A类人工智能领域顶级学术期刊IJCV上发表题为Rethinking Generalizability and Discriminability of Self-Supervised Learning from Evolutionary Game Theory Perspective的论文，深入探讨了自监督学习模型判别性与泛化性的负相关问题，并提出了一种新颖的平衡自监督学习方法，能使自监督学习模型自适应达到判别性与泛化性的理论最优平衡状态，显著提升了模型的综合性能。论文第一作者为特别研究助理李江梦，通讯作者为特别研究助理强文文。

自监督学习模型能利用大规模无标注数据，通过制定自监督任务来指导模型训练。自监督学习模型的判别性和泛化性是衡量模型性能的两个重要方面，判别性体现了模型对数据进行分类或区分的能力，泛化性则反映了模型在未见过的数据上保持较好性能的能力。然而研究团队通过探索性实验发现，自监督学习模型的泛化性和判别性在统计学上存在明显的负相关关系。

为了自监督学习模型在泛化和判别两方面的综合性能达到最佳，研究团队提出了一种演化博弈论引导的自监督学习模型训练方法ESSL。该方法首先基于演化博弈论建模，通过对代表性训练数据集进行序列优化，来推导出平衡泛化性和判别性的初始最优比例。然后基于自监督学习模型在训练域和任务域上的分布差距，引入强化学习方法，使模型能根据特定的目标数据集动态调整，最终实现泛化性和判别性两者的最优平衡。同时，研究团队基于复杂模型泛化误差界理论以及结构因果模型理论，给出了方法的理论可靠性证明。

演化博弈论引导的自监督学习方法（ESSL）框架图

研究团队进一步在基准自监督学习模型微调、线性探针、跨域泛化三种不同的实验设置下进行了验证。结果表明，在不同的实验设置下引入ESSL均能实现模型泛化和判别上整体性能的稳定提升。特别是在基准自监督学习模型微调实验中，ESSL在演化博弈论模型指标上相较基线方法DINO实现了11.9％的综合性能提升。

在模型微调设置下的实验结果

在线性探针设置下的实验结果

在跨域泛化设置下的实验结果

论文链接：https://arxiv.org/abs/2412.00542

新闻动态

科研进展

软件所提出基于演化博弈论的自监督学习性能平衡方法

附件：