ProvX:基于因果反事实的攻击解释生成框架用于溯源检测

本文提出ProvX框架,针对基于溯源图的图神经网络入侵检测系统生成反事实解释,通过最小化结构扰动改变恶意预测,并验证其解释效果与模型鲁棒性增强能力,在权威数据集上达到51.59%的必要性指标。

ProvX:基于因果反事实的攻击解释生成框架用于溯源检测

摘要

基于溯源图的入侵检测系统被部署在主机上,以防御日益严重的高级持续性威胁。使用图神经网络检测这些威胁已成为研究焦点,并展现出卓越性能。然而,基于GNN的安全模型由于其固有的黑盒特性而限制了广泛应用,它们无法为安全分析师提供任何可验证的模型预测解释,或任何关于模型判断与现实攻击相关的证据。

为解决这一挑战,我们提出了ProvX,一个有效的解释框架,用于解释基于溯源图的GNN安全模型。ProvX引入了反事实解释逻辑,寻找被预测为恶意图中的最小结构子集,当该子集被扰动时,能够颠覆模型的原始预测。我们创新性地将寻找这一关键子图的离散搜索问题转化为由预测翻转和距离最小化双重目标指导的连续优化任务。此外,还引入了分阶段固化策略以增强解释的精确性和稳定性。

我们在权威数据集上对ProvX进行了广泛评估。实验结果表明,ProvX能够定位与现实攻击高度相关的关键图结构,并实现了平均51.59%的解释必要性,这些指标优于当前的最先进解释器。此外,我们探索并初步验证了一个闭环的检测-解释-反馈增强框架,通过实验证明ProvX的解释结果能够指导模型优化,有效增强其对对抗攻击的鲁棒性。

主题分类

密码学与安全(cs.CR)

引用信息

arXiv:2508.06073 [cs.CR]
(或此版本的 arXiv:2508.06073v1 [cs.CR])
DOI: https://doi.org/10.48550/arXiv.2508.06073

提交历史

来自: Weiheng Wu [查看邮箱]
[v1] 2025年8月8日 星期五 07:12:10 UTC (626 KB)

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计