DARPA AI网络挑战赛计分轮开启:Buttercup系统竞逐漏洞挖掘桂冠

本文详细介绍DARPA AI网络挑战赛计分轮赛事,参赛系统需在数十个真实开源程序中挖掘并修复漏洞,涵盖SQLite、Nginx等常见软件,采用模糊测试与AI技术结合的方式评估系统能力。

AIxCC计分轮正式启动:Buttercup竞逐400万美元大奖

DARPA人工智能网络挑战赛(AIxCC)总决赛的唯一计分轮已正式拉开帷幕!我们的网络推理系统Buttercup正与其他六支团队展开角逐,看哪个自主AI驱动系统能够发现并修复最多的软件漏洞。经过两年的艰苦研发,我们终于迎来这一关键时刻。

计分轮赛制详解

每套参赛的CRS系统需要完成以下任务:

  • 在数十个不同的真实世界开源程序中发现并修复多个漏洞
  • 目标程序选自最广泛使用的C和Java开源项目,包含组织方战略性重新注入的历史真实漏洞
  • 往届赛事曾涉及SQLite、Nginx、Apache Tika、Jenkins甚至Linux内核等程序

评分机制包括:

  • 通过触发程序崩溃或运行时检查器证明漏洞存在
  • 修复漏洞并确保补丁不破坏功能测试
  • 对静态分析警报进行真/误报分类

团队后续计划

在等待比赛结果的同时,我们正在积极改进Buttercup:

  • 准备在8月将Buttercup发布为开源软件
  • 开发可在商用硬件上运行的版本
  • 赛后将分享Buttercup如何利用AI加速传统模糊测试的技术细节

比赛结果将于8月8日在DEFCON 33主舞台揭晓,冠军将获得400万美元奖金。我们期待在AIxCC体验区与大家见面,并分享构建Buttercup的实践经验。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计