基于张量网络矩阵乘积态(MPS)的合成数据生成与差分隐私技术

本文提出了一种利用张量网络中的矩阵乘积态(MPS)生成高质量隐私保护合成数据的方法。通过噪声注入和梯度裁剪实现差分隐私,在多个指标上超越CTGAN、VAE等现有模型,特别在严格隐私约束下表现优异,为敏感领域的数据共享提供了可解释且可扩展的解决方案。

合成数据生成与差分隐私使用张量网络的矩阵乘积态(MPS)

合成数据生成是现代人工智能中的关键技术,解决了数据稀缺性、隐私约束以及在训练鲁棒模型时对多样化数据集的需求。在这项工作中,我们提出了一种使用张量网络(特别是矩阵乘积态,MPS)生成隐私保护的高质量合成表格数据的方法。我们将基于MPS的生成模型与最先进的模型(如CTGAN、VAE和PrivBayes)进行基准测试,重点关注保真度和隐私保护能力。

为确保差分隐私(DP),我们在训练过程中集成了噪声注入和梯度裁剪,通过Rényi差分隐私核算实现隐私保证。在分析数据保真度和下游机器学习任务性能的多个指标中,我们的结果表明MPS优于经典模型,尤其是在严格的隐私约束下。

这项工作突出了MPS作为隐私感知合成数据生成的有前途工具。通过将张量网络表示的表达能力与形式化隐私机制相结合,所提出的方法为安全数据共享提供了一种可解释且可扩展的替代方案。其结构化设计有助于集成到数据质量和保密性都至关重要的敏感领域。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计