AIxCC评分赛开战!Buttercup自主系统竞逐漏洞挖掘与修复

DARPA人工智能网络挑战赛决赛评分轮正式启动,七支团队使用自主AI系统在真实开源程序中挖掘和修复漏洞。竞赛采用SQLite、Nginx等真实软件,通过模糊测试和静态分析验证漏洞,获胜系统将获得400万美元奖金。

系好安全带,Buttercup!AIxCC评分轮正式开赛

DARPA人工智能网络挑战赛(AIxCC)决赛的唯一评分轮已正式启动!我们的网络推理系统(CRS)Buttercup正与其他六支团队竞技,看哪个自主AI驱动系统能发现并修复最多的软件漏洞。经过两年艰苦开发,我们期待看到Buttercup的实战表现。

评分轮结束后,DARPA和ARPA-H将于8月8日在DEFCON 33主舞台宣布获胜者。最高分CRS将获得400万美元头奖,第二名和第三名分别获得300万和150万美元奖金。我们的团队将现场观看结果揭晓,并参与AIxCC多项活动。如果您计划参加八月DEFCON,欢迎到AIxCC体验区我们的展位参观,并聆听我们关于Buttercup开发与竞赛历程的演讲(时间待定)。

评分轮进行哪些挑战?

每个参赛CRS需在数十个真实世界开源程序中发现并修复多个漏洞。这些程序选自最广泛使用的C和Java开源项目,包含的漏洞通常是竞赛组织者战略性地重新注入的历史真实漏洞。SQLite、Nginx、Apache Tika、Jenkins甚至Linux内核都曾在前几轮中使用。

每个CRS将面对基于这些开源程序的多轮挑战。每个挑战配备OSS-Fuzz兼容的模糊测试工具链,多数情况下还包含功能测试集。CRS可通过以下方式得分:

  • 通过找到导致程序崩溃或触发运行时检测器的输入,证明漏洞存在
  • 用修复根本原因且不破坏功能测试的补丁修复漏洞
  • 将静态分析警报分类为真阳性或假阳性

为此,每个CRS获得了充足的计算资源和第三方AI预算。AIxCC评分轮规模巨大,因为获胜的CRS必须证明能立即应对保护庞大开源软件生态系统的挑战。

我们团队的下一步计划?

在Buttercup参赛和等待结果期间,我们仍在努力改进它!接下来一个月,我们将准备在八月将Buttercup作为开源软件发布。同时,我们正在开发可在商用硬件上运行的版本,让每个人都能试用!

竞赛结束后,我们终于可以分享Buttercup的技术细节。请关注我们后续的技术深度解析,了解Buttercup如何利用AI加速传统模糊测试并生成高质量漏洞补丁!

更多背景信息请参阅我们关于AIxCC的往期文章:

  • DARPA人工智能网络挑战赛:我们入选了!
  • 我们对AIxCC竞赛形式的思考
  • DARPA向Trail of Bits授予100万美元用于AI网络挑战
  • Trail of Bits的Buttercup进军DARPA AIxCC
  • Trail of Bits晋级AIxCC决赛
  • 用Buttercup开启AIxCC决赛

如果您喜欢本文,请分享至:
Twitter | LinkedIn | GitHub | Mastodon | Hacker News


© 2025 Trail of Bits.
使用Hugo和Mainroad主题生成。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计