本地私有化随机实验中的因果推断

摘要

本地差分隐私是一种隐私保护范式，个体在将数据传输给收集者之前会先对数据应用隐私机制（通常通过添加噪声）。隐私噪声会对其分析带来额外的偏差和方差。因此，分析师将隐私噪声纳入有效推断至关重要。本文开发了从随机实验的本地私有化数据中推断因果效应的方法论。

首先提出了在各种隐私场景下的频率学派估计量及其方差估计量和插件置信区间。研究表明，与极小极大下界相比，朴素的去偏估计会导致较差的均方误差（MSE）。相反，通过使用定制化的隐私机制，可以匹配下界，实现极小极大最优推断。

开发了贝叶斯非参数方法以及分块吉布斯采样算法，该方法可应用于任何提出的隐私机制，并在严格隐私预算下在MSE方面表现尤其出色。

最后通过模拟研究评估了提出的频率学派和贝叶斯方法在各种隐私预算下的性能，为私有化数据的因果推断提供了实用建议。

Yuki Ohnishi, Jordan Awan; 26(14):1−40, 2025.

[abs][pdf][bib]