生存数据分析中的异质处理效应:递归树填补技术

本文提出MISTR方法,通过递归填补生存树处理右删失数据,解决传统方法在重度删失场景下的局限性,并支持工具变量设定,为医学等领域的个性化治疗效应评估提供新工具。

摘要

个性化治疗是医学等领域的核心目标,其关键在于评估异质处理效应(HTE)。然而,生存数据(如死亡时间)存在右删失问题,导致传统HTE估计方法存在偏差和低效。现有方法如Cui等(2023)提出的双重稳健估计器在重度删失(如罕见病研究)中表现不佳,且无法处理工具变量。本文提出MISTR(生存治疗响应的多重填补)方法,通过递归填补生存树直接处理删失数据,无需建模删失机制。实验表明,MISTR在无隐藏混杂设定下优于现有方法,并首次扩展至工具变量场景。

核心贡献

  1. 非参数方法:MISTR利用递归填补树技术,避免对删失机制或生存分布的参数化假设。
  2. 重度删失适应性:在模拟和真实数据集(如艾滋病临床试验ALS175和失业数据集)中验证了其在重度删失下的鲁棒性。
  3. 工具变量支持:首次实现基于工具变量的HTE估计,解决未观测混杂问题。

方法概述

MISTR通过以下步骤实现:

  • 递归填补:构建生存树递归填补删失事件时间,保留数据分布特征。
  • 因果效应估计:结合处理组与对照组差异,量化子群处理效应。
  • 扩展工具变量:通过工具变量分离混杂效应,处理未观测变量偏差。

实验结果

  • 模拟数据:在50%以上删失率时,MISTR的均方误差较基线方法降低30%。
  • 真实数据:在ALS研究中识别出显著受益于特定治疗的亚组(p<0.01)。

局限与展望

当前方法计算复杂度较高,未来可优化分布式实现。此外,理论层面的删失机制敏感性需进一步研究。


comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计