可扩展的贡献边界技术实现隐私保护

在现代数据集中，单个记录可能拥有多个所有者，实施用户级差分隐私需要限制每个用户的总贡献量。这种"贡献边界"机制带来了显著的组合挑战。现有串行算法计算密集，难以适应当前海量数据集的规模需求。

为解决这一可扩展性瓶颈，我们提出了一种高效的分布式算法。该方法将复杂的所有权结构建模为超图：用户作为顶点，记录作为超边。算法采用多轮处理机制，允许用户并行提交记录提案。仅当某条记录的所有所有者达成一致同意时，该记录才会被纳入最终数据集，从而确保不违反任何用户预设的贡献上限。

该技术方案具有以下创新点：

实验结果表明，相比传统串行方法，本算法在千万级规模数据集上可实现两个数量级的性能提升，同时保持相同的隐私保障水平。这项研究为大数据环境下的隐私保护提供了新的技术路径。