合成数据生成与差分隐私使用张量网络的矩阵乘积态(MPS)
合成数据生成是现代人工智能中的关键技术,解决了数据稀缺性、隐私约束以及在训练鲁棒模型时对多样化数据集的需求。在这项工作中,我们提出了一种使用张量网络(特别是矩阵乘积态,MPS)生成隐私保护的高质量合成表格数据的方法。我们将基于MPS的生成模型与最先进的模型(如CTGAN、VAE和PrivBayes)进行基准测试,重点关注保真度和隐私保护能力。
为确保差分隐私(DP),我们在训练过程中集成了噪声注入和梯度裁剪,通过Rényi差分隐私核算实现隐私保证。在分析数据保真度和下游机器学习任务性能的多个指标中,我们的结果表明MPS优于经典模型,尤其是在严格的隐私约束下。
这项工作突出了MPS作为隐私感知合成数据生成的有前途工具。通过将张量网络表示的表达能力与形式化隐私机制相结合,所提出的方法为安全数据共享提供了一种可解释且可扩展的替代方案。其结构化设计有助于集成到数据质量和保密性都至关重要的敏感领域。