时变特征场景下的主动特征获取方法评估

摘要

机器学习方法通常假设输入特征可免费获取。然而在医疗等领域，特征获取可能代价高昂或存在风险，因此需要平衡特征获取成本与预测价值。训练AI代理决策获取哪些特征的任务称为主动特征获取(AFA)。部署AFA代理会改变获取策略并引发分布偏移。为在此分布偏移下安全部署AFA代理，本文提出主动特征获取性能评估(AFAPE)问题。

研究在两种假设下考察AFAPE：

无直接效应(NDE)假设：获取行为不影响底层特征值
无未观测混杂(NUC)假设：回顾性特征获取决策仅基于已观测特征

研究表明可在NDE假设下应用缺失数据方法，在NUC假设下应用离线强化学习。当NUC和NDE同时成立时，提出新型半离线强化学习框架。该框架需要更弱的正性假设，并引入三种新估计量：直接法(DM)、逆概率加权(IPW)和双重强化学习(DRL)估计量。