Disa:基于注意力机制的精准静态反汇编
摘要
在逆向工程相关的安全领域(如漏洞检测、恶意软件分析和二进制加固)中,反汇编技术至关重要但仍面临挑战。反汇编的核心难题在于识别指令和函数边界。传统方法依赖文件格式假设和架构特定的启发式规则来猜测边界,导致反汇编结果不完整且错误,尤其在二进制文件被混淆时更为明显。
近年来,反汇编技术的进展表明深度学习可以提升反汇编的准确性和效率。本文提出Disa,一种新的基于学习的反汇编方法,利用多头自注意力机制中的超集指令信息学习指令相关性,从而能够推断函数入口点和指令边界。Disa还能识别与内存块边界相关的指令,以支持基于高级块内存模型的值集分析,从而生成准确的控制流图(CFG)。
实验结果表明,Disa在函数入口点识别方面优于先前的深度学习反汇编方法,尤其在经过反汇编去同步技术和流行源码级混淆器处理的二进制文件上,分别实现了9.1%和13.2%的F1分数提升。通过将内存块精度提高18.5%,Disa生成的控制流图更加准确,与最先进的基于启发式的方法相比,平均间接调用目标(AICT)减少了4.4%。
评论
本文将于ACM CCS 2025发表。
主题
密码学与安全(cs.CR)
引用
arXiv:2507.07246 [cs.CR]
(或此版本的 arXiv:2507.07246v1 [cs.CR])
https://doi.org/10.48550/arXiv.2507.07246
提交历史
来自:Cong Sun [查看邮箱] [v1]
2025年7月9日星期三 19:36:57 UTC(615 KB)