时变特征场景下的主动特征获取方法评估

本文探讨在医疗等特征获取成本高昂的领域,如何通过主动特征获取(AFA)平衡特征成本与预测价值,并提出在分布偏移下评估AFA性能的新框架,结合缺失数据处理和离线强化学习方法。

摘要

机器学习方法通常假设输入特征可免费获取。然而在医疗等领域,特征获取可能代价高昂或存在风险,因此需要平衡特征获取成本与预测价值。训练AI代理决策获取哪些特征的任务称为主动特征获取(AFA)。部署AFA代理会改变获取策略并引发分布偏移。为在此分布偏移下安全部署AFA代理,本文提出主动特征获取性能评估(AFAPE)问题。

研究在两种假设下考察AFAPE:

  1. 无直接效应(NDE)假设:获取行为不影响底层特征值
  2. 无未观测混杂(NUC)假设:回顾性特征获取决策仅基于已观测特征

研究表明可在NDE假设下应用缺失数据方法,在NUC假设下应用离线强化学习。当NUC和NDE同时成立时,提出新型半离线强化学习框架。该框架需要更弱的正性假设,并引入三种新估计量:直接法(DM)、逆概率加权(IPW)和双重强化学习(DRL)估计量。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计