跨三款智能编程平台测试AGENTS.md:通用上下文时代已来临
大多数开发者都忠于自己选择的智能编程平台。你是Copilot用户、Claude Code用户等等。当每个平台都需要自己特殊的方式来管理上下文时,这种忠诚是有道理的。
但AGENTS.md正在悄然改变这一局面。这是一个通用上下文标准,可在GitHub Copilot、Claude Code、Gemini CLI、OpenAI Codex等平台上运行。只需编写一次项目规范,就能使用任何适合当前需求的平台。
我通过三种不同方式构建相同的应用程序来测试这一点。以下是我对当前智能编程现状的了解,以及为什么您的工作流程可能受益于多平台方法。
什么是AGENTS.md?
AGENTS.md是一个标准化的markdown文件,为AI编程助手提供上下文。可以将其视为存储在代码库中的项目简介:需求、技术规范、编码偏好、架构决策以及AI有效工作所需的上下文。
其有用之处在于:
- 通用标准:适用于GitHub Copilot、Claude Code、Gemini CLI、OpenAI Codex和其他AI编程工具
- 纯markdown:无需特殊语法
- 持久上下文:AI每次都会读取它,因此您无需重新解释项目
包含内容: 项目概述、技术要求、文件结构、编码标准、依赖项和设置说明。
存放位置: 将其放在项目根目录中。某些平台支持多级别的AGENTS.md文件以实现更细粒度的上下文。
平台特定说明: GitHub Copilot还支持不同级别的Instructions.md,但AGENTS.md是通用的。Claude Code和Gemini CLI都将AGENTS.md作为其主要上下文来源。
关键优势:编写一次上下文,多个AI编程工具都可以使用它。
实验设计
在这个实验中,我需要一个足够复杂的项目来压力测试这些工具:带有实时模式识别(使编码挑战更难)和复古街机美学的康威生命游戏。AGENTS.md规范包含2000字,涵盖了细胞自动机逻辑、视觉效果(CRT扫描线、发光)以及自动检测和颜色编码 emergent 模式,如滑翔机、振荡器和静物。
相同规范。三个平台:
- GitHub Copilot with GPT-5(我的日常工具,通常与Claude Sonnet 4.5一起使用)
- Claude Code(Anthropic的命令行编码代理)
- Gemini CLI(Google的基于终端的编码工具)
我从零开始运行每个工具,指向相同的AGENTS.md文件。没有手动指导,没有迭代修复,只是一次性测试每个工具能构建什么。
实际结果
所有三个工具都产生了可工作的实现。但方法、结果和开发者体验以揭示性的方式有所不同。
Claude Code:规划师
Claude Code在编写代码前会暂停。它阅读规范,呈现详细的构建路线图(文件结构、实现方法、功能优先级),然后在继续之前需要我的批准。
这感觉像是协作。不那么像"AI做事情",更像是"AI提出计划,人类签字批准"。
结果?最精致的一次性实现。模式识别工作正确,视觉效果扎实,代码结构良好。感觉像是生产就绪的。
Gemini CLI:诚实的工匠
Gemini接近完成。实现视觉上符合要求的审美。但它坦承未完成:“接下来,我将专注于增强模式检测以识别更复杂的模式,如滑翔机和其他振荡器,如项目要求中所述。”
我欣赏这种诚实。它交付了真正好的东西,同时承认在哪些方面未达到规范。透明度感觉很有价值。
GitHub Copilot + GPT-5:能干的多面手
Copilot快速产生了扎实的实现。游戏工作,复古审美存在,代码干净。但模式识别(特别是振荡器的颜色编码)没有完全按照规范工作。
没有坏,只是在一个核心功能上不完整。仍然令人印象深刻,只是不如Claude Code的输出精致。
客观分析
我不希望这只是我的意见。所以我让Grok Code Fast 1对所有三个实现进行了盲代码审查。
我给Grok提供了AGENTS.md规范和所有三个完整的代码库。没有关于哪个工具构建了哪个的背景。只是:根据规范评估这些。
Claude Code:9/10
- 模式识别:优秀(所有4个方向的滑翔机,多个静物,振荡器)
- 高级功能:余辉轨迹、灭绝警报、稳定模式检测 ✓
- 视觉抛光:完整的复古街机UI,带有CRT扫描线和图例 ✓
- 弱点:缺少LWSS飞船检测;密集网格中可能性能滞后
GitHub Copilot + GPT-5:9/10
- 模式识别:强大(所有4个方向的滑翔机,LWSS飞船,振荡器,静物)
- 高级功能:扫描线、晕影、矢量风格发光、稳定性警报 ✓
- 视觉抛光:平衡的复古审美,带有可选的FPS显示 ✓
- 弱点:振荡器检测依赖于状态比较,可能错过边缘情况 (我个人会给8分,那个9分有点慷慨。)
Gemini CLI:6/10
- 模式识别:有限(仅块静物和水平闪烁器)
- 高级功能:死细胞的基本轨迹效果
- 视觉抛光:干净、功能性的UI,带有复古风格 ✓
- 弱点:严重有限的模式检测(错过滑翔机、飞船、大多数振荡器);无稳定性/灭绝检测
工作流程洞察
除了分数,这个实验还揭示了一些实际的东西:在同一个项目上使用多个AI编程工具现在真正可行,甚至可能是最优的。
Claude Code和Gemini CLI都可以通过Homebrew在Mac上安装(brew install claude-code / brew install gemini-cli),这使得实验变得极其容易。两者都使您的终端看起来很棒,这不应该重要但不知何故确实重要。
真正的洞察:如果您已经在VSCode中使用Copilot,不打开终端窗格并偶尔运行Claude Code或Gemini CLI获取第二意见,您将错过机会。这两个工具都会读取您的AGENTS.md文件以获取上下文。您不是重新开始。您是在获取同一项目的不同视角。
AGENTS.md文件使这一点无缝衔接。一个规范,多个工具可以执行,当一个代理在难题上卡住时。
这意味着什么
我们正处于AI辅助开发的一个有趣时刻。这些工具不再是实验性的。它们真正有能力。Claude Code在一次尝试中交付了接近生产就绪的代码。Copilot的实现扎实可靠。即使是Gemini,尽管其模式识别有差距,也构建了功能性和视觉上吸引人的东西,我相信再给一次机会,它会搞定模式识别。
AGENTS.md标准使得使用多个工具而无需每次重写上下文变得实用。这不是关于放弃您偏爱的助手。而是关于认识到不同工具有不同的优势。Claude Code的规划阶段捕捉了边缘情况。Copilot的飞船检测更完整。Gemini的审美选择即使在其模式识别不足的地方也令人信服。
您不需要选择一个。多工具工作流程的基础设施已经存在。
自己尝试
所有三个实现都可以探索:
- Claude Code
- Github Copilot
- Gemini CLI
驱动所有三个的AGENTS.md文件在这里。
如果您已经在使用一个AI编程助手,考虑尝试另一个。入门门槛比您想象的要低,从看到同一问题的不同方法中获得的见解值得花费十五分钟尝试。