SAEL:基于自适应专家混合大语言模型的智能合约漏洞检测技术

本文提出SAEL框架,结合大语言模型与自适应专家混合架构,通过针对性提示设计、代码与解释特征处理及动态权重调整机制,显著提升智能合约漏洞检测性能,在多种漏洞类型上超越现有方法。

SAEL:基于自适应专家混合大语言模型的智能合约漏洞检测

摘要

随着区块链安全问题的日益突出,智能合约漏洞检测已成为研究热点。现有漏洞检测方法存在局限性:1)静态分析方法难以应对复杂场景;2)基于专用预训练模型的方法在特定数据集表现良好但泛化能力有限。相比之下,通用大语言模型(LLMs)展现出适应新漏洞模式的强大能力,但在特定漏洞类型上表现不如专用方法。同时我们发现,通用LLMs生成的解释能提供细粒度代码理解信息,有助于提升检测性能。

基于这些观察,我们提出SAEL——一个基于LLM的智能合约漏洞检测框架。首先设计针对性提示指导LLMs识别漏洞并生成解释作为预测特征;随后对CodeT5和T5进行提示调优以处理合约代码和解释,增强任务特定性能;为融合各方法优势,引入自适应专家混合(Adaptive Mixture-of-Experts)架构,通过门控网络动态调整特征权重(采用TopK过滤和Softmax归一化选择相关特征),并融入多头自注意力机制增强跨特征关系。该设计通过梯度优化有效整合LLM预测、解释特征和代码特征,损失函数同时考虑独立特征性能和整体加权预测。实验表明SAEL在多种漏洞检测上优于现有方法。

方法细节

提示设计与特征生成

  • 设计针对性提示引导LLMs进行漏洞识别和解释生成
  • 将生成的解释作为细粒度代码理解特征

模型调优与特征处理

  • 对CodeT5和T5模型进行提示调优
  • 同时处理合约代码和解释文本
  • 增强模型在漏洞检测任务上的特定性能

自适应专家混合架构

  • 门控网络动态调整特征权重
  • TopK过滤机制选择最相关特征
  • Softmax归一化确保权重合理性
  • 多头自注意力机制增强特征间关联性

优化与损失函数

  • 通过梯度优化整合多源特征
  • 损失函数同时优化:
    • 独立特征性能
    • 整体加权预测效果

实验验证

实验结果表明,SAEL框架在多种智能合约漏洞类型上均表现出超越现有方法的检测性能,验证了自适应专家混合架构的有效性和通用性。

本文已被ICSME 2025会议接收

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计