软件所在图表示学习因果性提升方面取得进展----中国科学院软件研究所

软件所在图表示学习因果性提升方面取得进展

文章来源： | 发布时间：2023-02-09 | 【打印】【关闭】

　　近日，软件所天基综合信息系统重点实验室研究团队在图表示学习方法研究中取得进展。成果论文“Robust Causal Graph Representation Learning against Confounding Effects”被人工智能领域顶级学术会议AAAI（Association for the Advancement of Artificial Intelligence）接收并作为oral报告，共同第一作者为博士生高航、李江梦。论文首次提出一种新的图表示学习方法：鲁棒因果图表示学习（RCGRL）。该方法通过引入工具变量来消除图表示学习中的混杂因子，实现了图表示学习因果性的有效提升。

　　图表示学习旨在学习复杂图结构数据的特征表示，相比于图像或序列化数据的表示学习，图表示学习应用场景中的数据更加不规则，语义信息更加丰富，且常常会存在大量与任务无关的混杂因子，对任务进行干扰。如何去除这些混杂因子，只保留与任务相关的因果信息，是研究团队希望解决的问题。由于工具变量方法在一些经典领域对于噪声信息的消除取得了较好的效果，因此研究团队将该方法引入图表示学习领域，以消除图数据中的混杂因子对表示学习任务的影响。

　　基于上述探索和分析，研究团队遵循统计因果学的规律，提出了先基于神经网络自主生成的工具变量进行混杂因子消除，然后使用处理过的因果数据对模型进行训练，进而提升模型因果性的方法。团队还通过特定的损失函数对生成工具变量的神经网络以及进行表示学习的神经网络进行交替训练。训练后的模型能够细粒度的消除混杂因子对图表示提取的影响，并最大限度的保留因果信息。

　　研究团队基于涵盖ID和OOD任务的六个不同的图数据集建立多种下游任务基准及评估协议，将RCGRL方法与几种广泛使用的因果增强图表示学习方法相对比，实验结果表明RCGRL更具有优越性，在多种图表示学习任务精度上明显优于其它方法，有效提升了图表示学习的因果性。

RCGRL方法框架