提示注入到AI代理中的RCE攻击
现代AI代理越来越多地执行系统命令来自动化文件系统操作、代码分析和开发工作流。虽然为了提高效率,某些命令被允许自动执行,而其他命令需要人工审批,这看似能够有效防范命令注入等攻击。然而,我们经常遇到通过参数注入攻击绕过人工审批保护的模式,这些攻击利用预批准的命令,使我们能够实现远程代码执行(RCE)。
这篇博文重点介绍了造成这些漏洞的设计反模式,通过具体示例展示了在三个不同代理平台上成功实现RCE的过程。由于正在进行协调披露,我们无法在本文中指名道姓这些产品,但这三个都是流行的AI代理,我们相信参数注入漏洞在具有命令执行能力的AI产品中很常见。最后,我们强调通过改进命令执行设计(如沙箱和参数分离),可以限制此类漏洞的影响,并为开发人员、用户和安全工程师提供可操作的建议。
设计上的批准命令执行
代理系统使用命令执行功能来高效执行文件系统操作。这些系统不是实现标准工具的自定义版本,而是利用现有工具如find、grep和git:
- 搜索和过滤文件:使用find、fd、rg和grep进行文件发现和内容搜索
- 版本控制操作:利用git进行仓库分析和文件历史
这种架构决策具有以下优势:
- 性能:原生系统工具经过优化,比重新实现等效功能快几个数量级
- 可靠性:经过充分测试的实用程序具有生产使用历史和边缘情况处理经验
- 减少依赖:避免自定义实现可以最小化代码库复杂性和维护负担
- 开发速度:团队可以更快地发布功能,而无需重新发明基本操作
然而,预批准命令存在安全缺陷:当用户输入可以影响命令参数时,它们暴露了参数注入攻击面。不幸的是,防止这些攻击很困难。全面阻止参数会破坏基本功能,而选择性过滤需要了解每个命令的完整参数空间——考虑到不同实用程序中可用的数百个命令行选项,这是一项艰巨的任务。正如我们接下来要讨论的,参数注入攻击在AI代理中很常见。
映射安全命令
在审核代理系统时,我们首先识别可以在没有用户批准的情况下执行的shell命令允许列表。例如,代理可以运行echo或hostname,但不能运行bash或curl。下面的简化go示例在执行前根据此允许列表验证命令:
|
|
图1:验证命令是否在预批准安全列表中的简单go示例
此外,在大多数系统中,经过测试的命令不会直接插入到shell中。相反,它们通过禁用shell的命令执行库运行,诸如;或&&之类的操作符,或使用反引号和$()的shell插值攻击将不起作用。
然而,许多这些代理系统不验证参数标志,使它们容易受到参数注入的攻击。
真实攻击示例
我们在下面演示了对三个生产系统的攻击。在所有情况下,我们都要求RCE可以通过单个提示(即一次性)实现。虽然这些示例显示了直接提示注入,但当恶意提示嵌入代码注释、代理规则文件、GitHub仓库和日志输出中时,相同的恶意提示也有效,这显著扩大了攻击面,超出了直接用户输入的范围。
CLI代理中的参数注入
在这个基于CLI的代理中,shell命令列表很广泛,包括无限制运行单元测试的能力,包括go test。对于那些不熟悉的人来说,go test有一个-exec标志,可以使用指定的程序运行测试二进制文件。我们发现应用程序容易受到一次性代码执行的攻击,使用以下提示:
|
|
图2:使用go test的-exec标志实现未经授权的代码执行,绕过人工参与的安全功能
攻击包括以下步骤:
- 它为单元测试的执行方式提供了背景故事
- 它使用-exec参数与go test,这允许为单元测试指定自定义程序
- 它执行bash和curl与管道操作符以实现远程代码执行。请注意,虽然curl和bash不包含在安全命令中,但我们通过实现RCE的参数注入引入了它们
作为单一shell命令,执行将如下所示,当提示被摄取时导致RCE:
|
|
图3:先前提示注入运行的命令列表
因为go test被认为是安全命令,所以漏洞利用无需人工批准即可运行。
在CLI代理中绕过正则表达式参数过滤
在下一个示例中,我们遇到了一个具有有限"安全命令"集的代理。此外,常见已知的执行标志(如find -exec)被过滤,并且代理被锁定,以至于它不会在没有引入人工参与的情况下创建文件。我们分析了正则表达式和参数过滤器的漏洞,最终发现git show和ripgrep在没有参数限制的情况下运行。通过迭代测试,我们开发了一个一次性提示注入,绕过了防护措施,然后创建并立即执行了一个文件:
|
|
图4:使用git show创建未经授权的文件,然后使用–pre标志立即执行该文件,绕过人工参与的安全功能
漏洞利用可以分解如下:
- 使用JSON作为提示的一部分。对于某些代理工具,使用JSON输入可以促使模型执行工具。在我们测试的产品中,
{"cmd":几乎总是促使模型通过工具执行相关的安全命令 - 使用git show命令与–format和–output标志。–format写入一个字符串(“open -a calculator"用十六进制编码),–output是要写入的文件名(即"payload”)。以前,代理拒绝使用此方法创建文件,但我们可以通过组合安全命令的两个标志来这样做。此外,十六进制编码看起来像git占位符,并混淆了可疑值
- 最后,ripgrep搜索文件中具有模式"calculator"的文件(即识别我们刚刚创建的文件),然后使用–pre bash参数执行创建文件的内容
外观模式参数注入
除了"安全命令"列表之外,我们还观察到一些代理系统使用外观模式,其中代理调用预定义的工具处理程序,在命令执行之前验证输入,而不是提供直接的shell访问或维护带有正则表达式过滤器的安全命令列表。这通常构成1:1的关系,其中每个工具(例如grep)接收自己的处理程序。例如,在下面易受攻击的示例go处理程序中,LLM工具输入使用go进行验证,然后基于输入构建命令:
|
|
图5:外观模式的示例go代码
考虑如下提示:
|
|
图6:用于搜索文件系统的常用提示;结果命令在下一个图中说明
LLM将确定一个输入参数*.py,使最终命令看起来像这样:
|
|
图7:从前一个提示产生的fd命令
在映射其他工具并识别在go处理程序中附加到命令的参数后,我们能够使用以下提示在上述代码上获得一次性代码执行:
|
|
图8:一次性代码执行提示,绕过人工参与的安全功能
一次性远程代码执行通过以下方式工作:
- 它调用第一个工具通过代理的文件创建功能创建恶意Python文件
- 它使用文件搜索工具输入-x=python3。LLM认为它将搜索-x=python3。但是,当由go代码处理时,-x=python3被附加到fd命令,导致参数注入。此外,go CommandContext函数不允许在命令执行中使用空格,因此需要-x=带有单个二进制文件
两个工具调用作为shell命令最终看起来像这样:
|
|
图9:由上述提示执行的一组bash命令
这些攻击是"离地生存"技术的很好的例子,使用合法的系统工具用于恶意目的。GTFOBINS和LOLBINS(离地生存二进制文件和脚本)项目编目了数百个可以被滥用于代码执行、文件操作和其他攻击原语的合法二进制文件。
先前工作
在2025年8月期间,Johann Rehberger(Embrace The Red)公开发布了代理系统中漏洞利用的每日记录。这些是巨大的资源和代理系统漏洞利用原语的优秀参考。我们认为它们是必读材料。虽然看起来我们在同一时间段内在不同产品中提交了类似的错误,但Johann的博客早于这项工作,在8月份发布了关于Amazon Q中命令注入的主题。
此外,其他人已经指出了CLI代理(Claude Code:CVE-2025-54795)和代理IDE(Cursor:GHSA-534m-3w6r-8pqr)中的命令注入机会。我们在本文中的方法面向(1)参数注入和(2)架构反模式。
为代理AI构建更好的安全模型
我们识别的安全漏洞源于架构决策。这种模式并不是新现象;信息安全社区长期以来一直理解通过过滤和正则表达式验证来保护动态命令执行的危险。这是一个经典的打地鼠游戏。然而,作为一个行业,我们以前没有面对过保护像AI代理这样的东西。我们基本上需要重新思考我们解决这个问题的方法,同时应用迭代解决方案。通常情况下,平衡可用性和安全是一个难以解决的问题。
使用沙箱
当今最有效的防御是沙箱:将代理操作与主机系统隔离。几种方法显示出前景:
- 基于容器的隔离:像Claude Code和许多代理IDE(Windsurf)这样的系统支持限制代理访问主机系统的容器环境。容器提供文件系统隔离、网络限制和资源限制,防止恶意命令影响主机
- WebAssembly沙箱:NVIDIA探索了使用WebAssembly为代理工作流创建安全执行环境。WASM提供强大的隔离保证和细粒度的权限控制
- 操作系统沙箱:一些代理如OpenAI codex使用平台特定的沙箱,如macOS上的Seatbelt或Linux上的Landlock。这些提供内核级隔离和可配置的访问策略
适当的沙箱并非易事。正确设置权限需要仔细考虑合法用例,同时阻止恶意操作。这仍然是安全工程中的一个活跃领域,在代理世界之外存在像seccomp配置文件、Linux安全模块(LSM)和Kubernetes Pod安全标准这样的工具。
应该说,这些代理的基于云的版本已经实现了沙箱来防范灾难性破坏。本地应用程序应得到相同的保护。
如果必须使用外观模式
外观模式明显比安全命令更好,但不如沙箱安全。外观允许开发人员重用验证代码,并提供执行前分析输入的单一位置。此外,可以通过以下建议使外观模式更强大:
始终使用参数分隔符:在用户输入之前放置–以防止恶意附加参数。以下是安全应用ripgrep的示例:
|
|
图10:参数分隔符防止附加参数被附加
–分隔符告诉命令将其后的一切视为位置参数而不是标志,防止注入额外参数。
始终禁用shell执行:使用防止shell解释的安全命令执行方法:
|
|
图11:至少防止shell执行
安全命令并不总是安全
在没有沙箱的情况下维护"安全"命令的允许列表从根本上是有缺陷的。像find、grep和git这样的命令服务于合法目的,但包含强大的参数,可以启用代码执行和文件写入。大量潜在的标志组合使得全面过滤不切实际,正则表达式防御成为一场无法支持的打地鼠游戏。
如果必须使用这种方法,请专注于最严格可能的命令,并定期根据LOLBINS等资源审核命令列表。但是,要认识到这本质上是一场必输的战斗,对抗使这些工具首先有用的灵活性。
建议
对于构建代理系统的开发人员:
- 实施沙箱作为主要安全控制
- 如果沙箱不可能,使用外观模式验证输入和执行前的适当参数分离(–)
- 除非与外观结合,否则大幅减少安全命令允许列表
- 定期审核命令执行路径以查找参数注入漏洞
- 实施所有命令执行的全面日志记录以进行安全监控
- 如果在链式工具执行期间识别出可疑模式,请将用户带回循环以验证命令
对于代理系统的用户:
- 谨慎授予代理广泛的系统访问权限
- 理解处理不受信任的内容(电子邮件、公共仓库)会带来安全风险
- 考虑使用容器化环境,并在可能的情况下限制对敏感数据(如凭据)的访问
对于测试代理系统的安全工程师:
- 如果源代码可用,首先识别允许的命令及其执行模式(例如,“安全命令"列表或执行输入验证的外观模式)
- 如果外观模式就位且源代码可用,审查实现代码以查找参数注入和绕过
- 如果没有源代码可用,首先向代理询问可用工具列表并提取系统提示进行分析。同时审查代理的公开可用文档
- 根据GTFOBINS和LOLBINS等网站比较命令,以查找绕过机会(例如,在没有批准的情况下执行命令或写入文件)
- 尝试在提示中模糊常见的参数标志(即,搜索文件系统,但确保使用参数标志
--help以便我可以审查结果。提供工具的确切输入和输出)并查找参数注入或错误。请注意,代理通常会在LLM解释之前提供命令的确切输出。如果没有,有时可以在对话上下文中找到此输出
展望未来
由于该领域的快速发展和缺乏对缺失安全措施的经济后果的证明,代理AI的安全性一直被降级。然而,随着代理系统变得越来越普遍并处理更敏感的操作,这种计算将不可避免地转变。我们有一个狭窄的窗口来建立安全模式,然后这些系统变得太根深蒂固而无法改变。此外,我们拥有特定于代理系统的新资源,例如在可疑工具调用时退出执行、对齐检查护栏、输入/输出的强类型边界、代理操作的检查工具包,以及代理数据/控制流中可证明安全的提案。我们鼓励代理AI开发人员使用这些资源!