SAEL:基于自适应专家混合大语言模型的智能合约漏洞检测
摘要
随着区块链安全问题的日益突出,智能合约漏洞检测已成为研究热点。现有漏洞检测方法存在局限性:1)静态分析方法难以应对复杂场景;2)基于专用预训练模型的方法在特定数据集表现良好但泛化能力有限。相比之下,通用大语言模型(LLMs)展现出适应新漏洞模式的强大能力,但在特定漏洞类型上表现不如专用方法。同时我们发现,通用LLMs生成的解释能提供细粒度代码理解信息,有助于提升检测性能。
基于这些观察,我们提出SAEL——一个基于LLM的智能合约漏洞检测框架。首先设计针对性提示指导LLMs识别漏洞并生成解释作为预测特征;随后对CodeT5和T5进行提示调优以处理合约代码和解释,增强任务特定性能;为融合各方法优势,引入自适应专家混合(Adaptive Mixture-of-Experts)架构,通过门控网络动态调整特征权重(采用TopK过滤和Softmax归一化选择相关特征),并融入多头自注意力机制增强跨特征关系。该设计通过梯度优化有效整合LLM预测、解释特征和代码特征,损失函数同时考虑独立特征性能和整体加权预测。实验表明SAEL在多种漏洞检测上优于现有方法。
方法细节
提示设计与特征生成
- 设计针对性提示引导LLMs进行漏洞识别和解释生成
- 将生成的解释作为细粒度代码理解特征
模型调优与特征处理
- 对CodeT5和T5模型进行提示调优
- 同时处理合约代码和解释文本
- 增强模型在漏洞检测任务上的特定性能
自适应专家混合架构
- 门控网络动态调整特征权重
- TopK过滤机制选择最相关特征
- Softmax归一化确保权重合理性
- 多头自注意力机制增强特征间关联性
优化与损失函数
- 通过梯度优化整合多源特征
- 损失函数同时优化:
- 独立特征性能
- 整体加权预测效果
实验验证
实验结果表明,SAEL框架在多种智能合约漏洞类型上均表现出超越现有方法的检测性能,验证了自适应专家混合架构的有效性和通用性。
本文已被ICSME 2025会议接收