AIxCC计分轮正式启动:Buttercup竞逐400万美元大奖
DARPA人工智能网络挑战赛(AIxCC)总决赛的唯一计分轮已正式拉开帷幕!我们的网络推理系统Buttercup正与其他六支团队展开角逐,看哪个自主AI驱动系统能够发现并修复最多的软件漏洞。经过两年的艰苦研发,我们终于迎来这一关键时刻。
计分轮赛制详解
每套参赛的CRS系统需要完成以下任务:
- 在数十个不同的真实世界开源程序中发现并修复多个漏洞
- 目标程序选自最广泛使用的C和Java开源项目,包含组织方战略性重新注入的历史真实漏洞
- 往届赛事曾涉及SQLite、Nginx、Apache Tika、Jenkins甚至Linux内核等程序
评分机制包括:
- 通过触发程序崩溃或运行时检查器证明漏洞存在
- 修复漏洞并确保补丁不破坏功能测试
- 对静态分析警报进行真/误报分类
团队后续计划
在等待比赛结果的同时,我们正在积极改进Buttercup:
- 准备在8月将Buttercup发布为开源软件
- 开发可在商用硬件上运行的版本
- 赛后将分享Buttercup如何利用AI加速传统模糊测试的技术细节
比赛结果将于8月8日在DEFCON 33主舞台揭晓,冠军将获得400万美元奖金。我们期待在AIxCC体验区与大家见面,并分享构建Buttercup的实践经验。