摘要
机器学习方法通常假设输入特征可免费获取。然而在医疗等领域,特征获取可能代价高昂或存在风险,因此需要平衡特征获取成本与预测价值。训练AI代理决策获取哪些特征的任务称为主动特征获取(AFA)。部署AFA代理会改变获取策略并引发分布偏移。为在此分布偏移下安全部署AFA代理,本文提出主动特征获取性能评估(AFAPE)问题。
研究在两种假设下考察AFAPE:
- 无直接效应(NDE)假设:获取行为不影响底层特征值
- 无未观测混杂(NUC)假设:回顾性特征获取决策仅基于已观测特征
研究表明可在NDE假设下应用缺失数据方法,在NUC假设下应用离线强化学习。当NUC和NDE同时成立时,提出新型半离线强化学习框架。该框架需要更弱的正性假设,并引入三种新估计量:直接法(DM)、逆概率加权(IPW)和双重强化学习(DRL)估计量。