AIxCC计分赛开战!Buttercup竞逐漏洞自动挖掘与修复巅峰

DARPA人工智能网络挑战赛进入计分阶段,七支团队使用自主AI系统竞相挖掘开源软件漏洞并生成修复补丁。比赛采用真实世界开源项目,包含历史漏洞复现,获胜系统将获得400万美元奖金。

系好安全带,Buttercup!AIxCC计分赛正式启动

DARPA人工智能网络挑战赛(AIxCC)总决赛的唯一计分轮次已正式开启!我们的网络推理系统(CRS)Buttercup正与其他六支团队角逐,看哪个自主AI驱动系统能发现并修复最多的软件漏洞。经过两年艰苦研发,我们期待看到Buttercup的实战表现。

计分轮结束后,DARPA和ARPA-H将于8月8日在DEFCON 33主舞台宣布获胜者。最高分CRS将获得400万美元头奖,第二名和第三名分别获得300万和150万美元奖金。我们的团队将现场见证最终结果,并通过多种方式参与AIxCC体验活动。如果您计划参加八月DEFCON,欢迎到AIxCC体验区我们的展位交流,并参加我们在AIxCC舞台的演讲(时间待定),分享构建Buttercup和参赛的酸甜苦辣。

计分赛进行时

每个参赛CRS需在数十个真实世界开源程序中寻找并修复多个漏洞。这些程序选自最广泛使用的C和Java开源项目,其中包含的漏洞通常是竞赛组织者战略性地重新注入的历史真实漏洞。SQLite、Nginx、Apache Tika、Jenkins甚至Linux内核都曾出现在前期比赛中。

每个CRS将面对基于这些开源程序的多轮挑战。每个挑战配备OSS-Fuzz兼容的模糊测试工具链,多数情况下还包含功能测试集。CRS可通过以下方式得分:

  • 通过找到导致程序崩溃或触发运行时检测器的输入,证明漏洞存在
  • 修复程序漏洞并提交补丁,需解决根本原因且通过功能测试
  • 对静态分析警报进行真假阳性分类

为达成目标,每个CRS均获得大量计算资源和第三方AI预算。AIxCC计分赛规模庞大,因为获胜的CRS将证明其能立即投入保障庞大开源软件生态系统的挑战。

团队后续计划

在Buttercup参赛和等待结果期间,我们仍在努力优化系统。接下来一个月,我们将准备在八月开源发布Buttercup。同时正在开发可在商用硬件上运行的版本,让所有人都能体验!

比赛结束后,我们终于可以分享Buttercup的技术细节。敬请关注我们如何利用AI加速传统模糊测试并生成高质量漏洞补丁的技术深度解析!

有关背景信息,请参阅我们此前关于AIxCC的系列文章。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计