系好安全带,Buttercup!AIxCC计分轮正式开启!
DARPA人工智能网络挑战赛(AIxCC)总决赛的唯一计分轮已正式启动!我们的网络推理系统(CRS)Buttercup正与另外六支队伍角逐,看哪个自主AI驱动系统能发现并修复最多的软件漏洞。经过两年艰苦开发,我们期待看到Buttercup的实战表现。
计分轮结束后,DARPA和ARPA-H将于8月8日在DEFCON 33主舞台宣布获胜者。最高分CRS将获得400万美元头奖,第二名和第三名分别获得300万和150万美元奖金。我们的团队将现场观看结果揭晓,并通过多种方式参与AIxCC体验活动。如果您计划参加八月DEFCON,欢迎到AIxCC体验区我们的展位交流,并参加我们在AIxCC舞台的演讲(时间待定),分享开发Buttercup和参赛的酸甜苦辣。
计分轮技术细节
每个参赛CRS需在数十个真实世界开源程序中发现并修复多个漏洞。这些程序选自最广泛使用的C和Java开源项目,其中包含的漏洞通常是竞赛组织者战略性地重新注入的实际历史漏洞。SQLite、Nginx、Apache Tika、Jenkins甚至Linux内核都曾出现在往轮比赛中。
每个CRS将面对基于这些开源程序的多轮挑战。每个挑战配备OSS-Fuzz兼容的模糊测试工具链,多数情况下还包含一组功能测试。CRS可通过以下方式得分:
- 通过找到导致程序崩溃或触发运行时检测器的输入,证明漏洞存在
- 通过修复漏洞的补丁(需解决根本原因且不破坏功能测试)
- 对静态分析警报进行真假阳性分类
为实现这些目标,每个CRS均获得大量计算资源和第三方AI预算。AIxCC计分轮规模庞大,因为获胜的CRS将证明其能立即扩展到保护庞大开源软件生态系统的挑战。
团队后续计划
在Buttercup参赛及等待结果期间,我们仍在努力优化系统。接下来一个月,我们将准备在八月开源发布Buttercup。同时,我们正在开发可在商用硬件上运行的版本,让所有人都能试用!
比赛结束后,我们终于可以分享Buttercup的技术细节。敬请关注深度技术解析:Buttercup如何利用AI加速传统模糊测试并生成高质量漏洞补丁!
相关背景阅读:
- DARPA人工智能网络挑战赛:我们入围了!
- 我们对AIxCC竞赛形式的思考
- DARPA向Trail of Bits授予100万美元AI网络挑战赛奖金
- Trail of Bits的Buttercup进军DARPA AIxCC
- Trail of Bits晋级AIxCC总决赛
- 用Buttercup启动AIxCC总决赛
如果您喜欢本文,请分享至:Twitter | LinkedIn | GitHub | Mastodon | Hacker News