DeepProv:基于推理溯源图分析的神经网络行为表征与修复技术

本文提出DeepProv系统,通过构建推理溯源图(IPG)来捕获和分析深度神经网络在推理过程中的行为。该系统能够自动识别节点和边级别的修复操作,显著提升模型对抗攻击的鲁棒性,在单层修复中平均提升55%的对抗精度,并适用于隐私审计和公平性分析等领域。

DeepProv:基于推理溯源图分析的神经网络行为表征与修复

深度神经网络(DNNs)正越来越多地被部署在高风险应用中,从自动驾驶汽车到生物特征认证。然而,它们在现实场景中不可预测和不可靠的行为需要新的方法来表征和确保其可靠性。

本文介绍了DeepProv,一个新颖且可定制的系统,旨在通过利用DNN的底层图结构来捕获和表征其在推理过程中的运行时行为。受系统审计溯源图的启发,DeepProv通过推理溯源图(IPGs)对DNN推理过程的计算信息流进行建模。这些图提供了DNN行为的详细结构表示,支持经验和结构分析。DeepProv利用这些洞察来系统性地修复DNN,以实现特定目标,如提高鲁棒性、隐私性或公平性。

我们以对抗鲁棒性作为模型修复目标实例化DeepProv,并进行了广泛的案例研究以评估其有效性。我们的结果证明了其在不同分类任务、攻击场景和模型复杂性下的有效性和可扩展性。DeepProv自动识别IPG中节点和边级别的修复操作,显著增强了模型的鲁棒性。特别是,将DeepProv修复策略仅应用于DNN的单个层,就能使对抗精度平均提高55%。此外,DeepProv与现有防御措施互补,在对抗鲁棒性方面实现了显著提升。除了鲁棒性,我们还展示了DeepProv作为一个适应性系统,在其他关键领域(如隐私审计和公平性分析)中表征DNN行为的更广泛潜力。

评论:
18页,9张图,6张表格,将发表于第41届年度计算机安全应用会议(ACSAC),2025年。

主题:
密码学与安全(cs.CR);机器学习(cs.LG)

引用为:
arXiv:2509.26562 [cs.CR]
https://doi.org/10.48550/arXiv.2509.26562

提交历史:
来自:Birhanu Eshete [查看邮箱]
[v1] 2025年9月30日星期二 17:29:02 UTC(1,537 KB)

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计