基于分数的因果表示学习:线性与通用变换

本文研究干预式因果表示学习,在线性与非线性变换下探讨可识别性与可实现性。通过建立分数函数与因果表示的新联系,提出基于分数的算法框架,并在合成与图像数据上验证理论结果。

基于分数的因果表示学习:线性与通用变换

Burak Varıcı, Emre Acartürk, Karthikeyan Shanmugam, Abhishek Kumar, Ali Tajer; 26(112):1−90, 2025.

摘要

本文研究基于干预的因果表示学习(CRL),针对一般非参数潜在因果模型及潜在变量到观测变量的未知映射变换,分别探讨线性与通用变换情况。研究涵盖可识别性与可实现性两个维度:可识别性指确定算法无关的条件以确保恢复真实潜在因果变量及潜在因果图;可实现性指算法设计层面,旨在实现可识别性保证。通过建立分数函数(即密度函数对数的梯度)与CRL的新联系,设计了一类基于分数的算法,同时保证可识别性与可实现性。

首先,针对线性变换,证明每个节点只需一次随机硬干预即可保证可识别性,同时为软干预提供部分可识别性保证(包括一般因果模型中与父节点混合的识别,以及足够非线性因果模型中潜在图的完美恢复)。其次,针对通用变换,证明每个节点两次随机硬干预足以实现可识别性,通过定义可微损失函数,其全局最优解确保通用CRL的可识别性,且无需知道哪对干预环境干预了相同节点。最后,通过结构化合成数据与图像数据的实验对理论结果进行实证验证。

[摘要][PDF][BIB] [代码]


© JMLR 2025.
(编辑,测试版)

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计