AIxCC决赛:技术方案全解析
DARPA人工智能网络挑战赛(AIxCC)决赛结果将于本周公布,获胜团队将获得400万美元大奖,奖励其构建的最佳AI系统,能够自动发现并修复现实世界代码中的漏洞。
地理分布多样性
七支决赛队伍中,四支来自高校,三支来自私营企业。团队成员分布全球,各队伍还与其他高校和企业建立了合作关系。
私营企业:
- Trail of Bits(纽约)
- LACROSSE(明尼阿波里斯)
- Theori(德克萨斯州奥斯汀)
高校团队:
- 42-b3yond-6ug(西北大学)
- all_you_need_is_a_fuzzing_brain(德克萨斯A&M大学)
- Shellphish(亚利桑那州立大学)
- Team Atlanta(佐治亚理工学院)
漏洞发现技术路线
AI增强传统安全工具
Trail of Bits、Shellphish和LACROSSE构建了基于模糊测试、静态分析和漏洞研究的系统,并使用LLM进行增强:
- Trail of Bits使用LLM为传统模糊测试工具生成种子输入
- Shellphish的"Grammar Guy"使用LLM基于未覆盖代码路径的反馈循环生成渐进式语法
- LACROSSE部署300-500个模糊测试代理,使用LLM进行需要语义理解的高级推理任务
AI优先结合传统验证
all_you_need_is_a_fuzzing_brain和Theori使用LLM作为主要推理引擎:
- all_you_need_is_a_fuzzing_brain约90%的代码库使用AI辅助编写
- Theori使用受约束的LLM代理遵循逆向工程工作流程
混合方法
Team Atlanta和42-b3yond-6ug平衡AI与传统方法:
- Team Atlanta使用专门针对C编程语言分析进行广泛微调的Llama 7B定制模型
- 42-b3yond-6ug应用能够同时修复多个不同bug的"超级补丁"
漏洞证明(PoV)生成
基于传统模糊测试的PoV生成
- LACROSSE通过成熟的模糊测试方法生成PoV
- 42-b3yond-6ug保持传统模糊测试作为核心PoV生成机制
AI增强传统方法
- Trail of Bits使用LLM生成Python程序,为传统模糊测试工具创建专门种子输入
- Shellphish的"Grammar Guy"使用LLM生成基于覆盖率反馈不断演进的渐进式语法
- Team Atlanta部署针对特定语言的PoV策略
AI优先的PoV生成
- all_you_need_is_a_fuzzing_brain通过直接AI推理生成约90%的PoV
- Theori的LLM代理使用语义理解生成需要格式合规的PoV
补丁策略
保守策略
Trail of Bits、Shellphish和Team Atlanta从不提交没有PoV的补丁
激进策略
Theori开发了无PoV补丁提交的数学模型,实施2:1比例策略
整体策略
42-b3yond-6ug部署能够修复多个看似无关漏洞的"超级补丁"
战略策略
Trail of Bits实施交叉验证系统测试现有补丁的PoV
技术启示
AIxCC决赛证明AI辅助网络安全已达到实用转折点,所有团队都实现了从漏洞发现到补丁生成的任务自动化。基于语法的模糊测试和基于代理的分析等创新将影响未来多年的网络安全工具。
最重要的是,竞赛证明问题不再是AI是否会改变网络安全,而是以多快的速度和何种形式改变。七支决赛队伍为这个问题找到了不同的答案,本周我们将了解DARPA评委认为哪种方法最具吸引力。