LLAMA:基于LLM引导种子生成的多反馈智能合约模糊测试框架

本文提出LLAMA框架,通过结合大语言模型、进化变异策略和混合测试技术,显著提升智能合约模糊测试效果。实验显示其指令覆盖率达91%,分支覆盖率达90%,并能检测148个已知漏洞中的132个。

LLAMA:基于LLM引导种子生成的多反馈智能合约模糊测试框架

摘要
智能合约在区块链生态系统中发挥着关键作用,而模糊测试仍是保障其安全的重要手段。尽管变异调度是影响模糊测试效果的关键因素,现有模糊测试工具主要关注种子调度和生成,而变异调度却鲜有研究。本文提出基于大语言模型(LLMs)的多反馈智能合约模糊测试框架LLAMA,整合了LLMs、进化变异策略和混合测试技术。

LLAMA的核心组件包括:

  1. 分层提示策略:指导LLMs生成语义有效的初始种子,结合轻量级预模糊测试阶段筛选高潜力输入;
  2. 多反馈优化机制:利用运行时覆盖率和依赖反馈,同步改进种子生成、种子选择和变异调度;
  3. 进化模糊测试引擎:根据有效性动态调整变异算子概率,并引入符号执行以突破停滞状态和发现深层漏洞。

实验结果表明,LLAMA在覆盖率和漏洞检测方面均优于最先进的模糊测试工具。具体而言,其指令覆盖率达到91%,分支覆盖率达90%,并能检测出跨多个类别的148个已知漏洞中的132个。这些结果证明了LLAMA在实际智能合约安全测试场景中的有效性、适应性和实用性。

主题分类
软件工程(cs.SE);密码学与安全(cs.CR)

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计