系好安全带,Buttercup!AIxCC评分赛正式启动
DARPA人工智能网络挑战赛(AIxCC)决赛的唯一评分环节已正式开启!我们的网络推理系统(CRS)Buttercup正与另外六支队伍角逐,看哪个自主AI驱动系统能发现并修复最多的软件漏洞。经过两年艰苦开发,我们期待看到Buttercup的实战表现。
评分环节结束后,DARPA和ARPA-H将于8月8日在DEFCON 33主舞台宣布获胜者。最高分CRS将获得400万美元头奖,第二名和第三名分别获得300万和150万美元奖金。我们的团队将现场观看结果揭晓,并通过多种方式参与AIxCC体验活动。如果您计划参加八月DEFCON,欢迎到AIxCC体验区我们的展位交流,并参加我们在AIxCC舞台关于Buttercup开发与竞赛历程的技术分享(时间待定)。
评分环节的技术挑战
每个参赛CRS需在数十个真实世界开源程序中发现并修复多个漏洞。这些程序选自最广泛使用的C和Java开源项目,其中包含的漏洞通常是竞赛组织者战略性地重新注入的历史真实漏洞。SQLite、Nginx、Apache Tika、Jenkins甚至Linux内核都曾在前几轮比赛中使用。
每个CRS将面临基于这些开源程序的多轮挑战。每个挑战配备:
- OSS-Fuzz兼容的模糊测试工具
- 多组功能测试用例
CRS可通过以下方式得分:
- 漏洞验证:通过生成导致程序崩溃或触发运行时检测器的输入数据证明漏洞存在
- 漏洞修复:提供修复漏洞根本原因的补丁,且不破坏功能测试
- 警报分类:准确判断静态分析警报的真阳性或假阳性
为完成这些任务,每个CRS都获得了大规模计算资源和第三方AI预算。AIxCC评分环节的规模巨大,因为获胜的CRS必须证明其能立即扩展到保护庞大开源软件生态系统的挑战。
团队后续技术计划
在Buttercup参赛和等待结果期间,我们仍在持续改进系统:
- 开源准备:未来一个月将准备在八月发布Buttercup开源版本
- 硬件适配:开发可在商用硬件上运行的Buttercup版本,让所有人都能体验
- 技术披露:竞赛结束后将分享Buttercup如何利用AI加速传统模糊测试并生成高质量漏洞补丁的技术细节
相关技术背景阅读:
- DARPA人工智能网络挑战赛:我们入围了!
- 对AIxCC竞赛形式的技术思考
- DARPA为AI网络挑战赛向Trail of Bits授予100万美元
- Trail of Bits的Buttercup进军DARPA AIxCC
- Trail of Bits晋级AIxCC决赛
- 用Buttercup启动AIxCC决赛
本文涉及真实漏洞挖掘、模糊测试、静态分析、AI驱动修复等核心技术内容,展现了自主网络安全系统的实战应用与挑战。