哈希水印作为过滤器:防御基于权重的神经网络水印中的伪造和覆盖攻击
摘要
作为有价值的数字资产,深度神经网络需要强大的所有权保护,神经网络水印(NNW)因此成为一种有前景的解决方案。在各种NNW方法中,基于权重的方法因其简单性和实用性而受到青睐;然而,它们仍然容易受到伪造和覆盖攻击。为了应对这些挑战,我们提出了NeuralMark,这是一种围绕哈希水印过滤器构建的鲁棒方法。具体而言,我们利用哈希函数从密钥生成不可逆的二进制水印,然后将其用作过滤器来选择用于嵌入的模型参数。这种设计巧妙地将嵌入参数与哈希水印交织在一起,为伪造和覆盖攻击提供了强大的防御。还整合了平均池化以抵抗微调和剪枝攻击。此外,它可以无缝集成到各种神经网络架构中,确保广泛的适用性。理论上,我们分析了其安全边界。实证上,我们在13种不同的卷积和Transformer架构上验证了其有效性和鲁棒性,涵盖了五个图像分类任务和一个文本生成任务。源代码可在https://URL获取。
主题
密码学与安全(cs.CR);机器学习(cs.LG)
引用
arXiv:2507.11137 [cs.CR](或此版本的arXiv:2507.11137v1 [cs.CR])
提交历史
来自:Yuan Yao [查看电子邮件] [v1] 2025年7月15日星期二 09:38:11 UTC(1,830 KB)