系好安全带，Buttercup！AIxCC评分轮正式开赛

DARPA人工智能网络挑战赛（AIxCC）决赛的唯一评分轮已正式启动！我们的网络推理系统（CRS）Buttercup正与其他六支团队竞技，看哪个自主AI驱动系统能发现并修复最多的软件漏洞。经过两年艰苦开发，我们期待看到Buttercup的实战表现。

评分轮结束后，DARPA和ARPA-H将于8月8日在DEFCON 33主舞台宣布获胜者。最高分CRS将获得400万美元头奖，第二名和第三名分别获得300万和150万美元奖金。我们的团队将现场观看结果揭晓，并参与AIxCC多项活动。如果您计划参加八月DEFCON，欢迎到AIxCC体验区我们的展位参观，并聆听我们关于Buttercup开发与竞赛历程的演讲（时间待定）。

评分轮进行哪些挑战？

每个参赛CRS需在数十个真实世界开源程序中发现并修复多个漏洞。这些程序选自最广泛使用的C和Java开源项目，包含的漏洞通常是竞赛组织者战略性地重新注入的历史真实漏洞。SQLite、Nginx、Apache Tika、Jenkins甚至Linux内核都曾在前几轮中使用。

每个CRS将面对基于这些开源程序的多轮挑战。每个挑战配备OSS-Fuzz兼容的模糊测试工具链，多数情况下还包含功能测试集。CRS可通过以下方式得分：

通过找到导致程序崩溃或触发运行时检测器的输入，证明漏洞存在
用修复根本原因且不破坏功能测试的补丁修复漏洞
将静态分析警报分类为真阳性或假阳性

为此，每个CRS获得了充足的计算资源和第三方AI预算。AIxCC评分轮规模巨大，因为获胜的CRS必须证明能立即应对保护庞大开源软件生态系统的挑战。

我们团队的下一步计划？

在Buttercup参赛和等待结果期间，我们仍在努力改进它！接下来一个月，我们将准备在八月将Buttercup作为开源软件发布。同时，我们正在开发可在商用硬件上运行的版本，让每个人都能试用！

竞赛结束后，我们终于可以分享Buttercup的技术细节。请关注我们后续的技术深度解析，了解Buttercup如何利用AI加速传统模糊测试并生成高质量漏洞补丁！

更多背景信息请参阅我们关于AIxCC的往期文章：

DARPA人工智能网络挑战赛：我们入选了！
我们对AIxCC竞赛形式的思考
DARPA向Trail of Bits授予100万美元用于AI网络挑战
Trail of Bits的Buttercup进军DARPA AIxCC
Trail of Bits晋级AIxCC决赛
用Buttercup开启AIxCC决赛

如果您喜欢本文，请分享至：
Twitter | LinkedIn | GitHub | Mastodon | Hacker News

AIxCC评分赛开战！Buttercup自主系统竞逐漏洞挖掘与修复

DARPA人工智能网络挑战赛决赛评分轮正式启动，七支团队使用自主AI系统在真实开源程序中挖掘和修复漏洞。竞赛采用SQLite、Nginx等真实软件，通过模糊测试和静态分析验证漏洞，获胜系统将获得400万美元奖金。

系好安全带，Buttercup！AIxCC评分轮正式开赛

评分轮进行哪些挑战？

我们团队的下一步计划？