哈希水印作为过滤器:防御基于权重的神经网络水印中的伪造和覆盖攻击

本文提出NeuralMark方法,通过哈希函数生成不可逆二进制水印作为过滤器选择模型参数进行嵌入,有效防御伪造和覆盖攻击。该方法还整合平均池化抵抗微调和剪枝攻击,适用于多种神经网络架构,并在13种卷积和Transformer架构上验证了有效性。

哈希水印作为过滤器:防御基于权重的神经网络水印中的伪造和覆盖攻击

摘要

作为有价值的数字资产,深度神经网络需要强大的所有权保护,神经网络水印(NNW)因此成为一种有前景的解决方案。在各种NNW方法中,基于权重的方法因其简单性和实用性而受到青睐;然而,它们仍然容易受到伪造和覆盖攻击。为了应对这些挑战,我们提出了NeuralMark,这是一种围绕哈希水印过滤器构建的鲁棒方法。具体而言,我们利用哈希函数从密钥生成不可逆的二进制水印,然后将其用作过滤器来选择用于嵌入的模型参数。这种设计巧妙地将嵌入参数与哈希水印交织在一起,为伪造和覆盖攻击提供了强大的防御。还整合了平均池化以抵抗微调和剪枝攻击。此外,它可以无缝集成到各种神经网络架构中,确保广泛的适用性。理论上,我们分析了其安全边界。实证上,我们在13种不同的卷积和Transformer架构上验证了其有效性和鲁棒性,涵盖了五个图像分类任务和一个文本生成任务。源代码可在https://URL获取。

主题

密码学与安全(cs.CR);机器学习(cs.LG)

引用

arXiv:2507.11137 [cs.CR](或此版本的arXiv:2507.11137v1 [cs.CR])

提交历史

来自:Yuan Yao [查看电子邮件] [v1] 2025年7月15日星期二 09:38:11 UTC(1,830 KB)

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计