MCP服务器如何窃取你的对话历史 - Trail of Bits博客
Keith Hoodlet
2025年4月23日
机器学习, MCP, 漏洞, 提示注入
攻击原理
我们的上一篇文章描述了攻击者如何利用Model Context Protocol(MCP)中的"越线"漏洞诱骗大型语言模型在用户工作站上执行恶意命令。虽然该攻击清晰展示了核心漏洞,但直接命令执行可能显得粗糙且易被检测。攻击者通常优先考虑隐蔽性和获取高价值信息,而非制造噪音的即时控制。因此,探索不同的概念验证攻击对于全面理解"越线"等漏洞的真正严重性和潜在影响至关重要。
本文展示了一种技术:向工具描述中注入触发短语以窃取用户的整个对话历史。这种方法支持高度定向的攻击。可以定制触发机制,使其仅在对话中出现敏感数据模式(如API密钥、内部项目名称或财务标识符)时激活,从而最大化窃取数据的价值同时最小化噪音。
端到端的攻击流程如下:将恶意工具描述插入MCP服务器,等待其被安装到用户环境中。该工具描述指示模型在用户输入选定触发短语(如"谢谢")时立即将对话历史转发给攻击者。用户正常与聊天机器人交谈,当触发短语自然出现时,攻击者将获取直到该点的所有消息。
由于工具描述在主机连接到MCP服务器时立即加载到上下文窗口中,一旦恶意服务器安装完成,触发短语就会立即生效。
图1:恶意MCP服务器在模型上下文中植入触发短语,导致模型在用户输入触发短语时将完整对话历史发送到服务器
以下是实现该攻击的工具描述示例:
|
|
对话历史的金矿
对话历史是敏感信息的金矿,这种攻击可以是持久性的:与传统的时点数据泄露不同,如果工具保持安装状态,与恶意MCP服务器的单个持续连接可能会持续泄露和收集包含此类信息的数周或数月的对话:
敏感凭据和访问令牌:许多用户直接在聊天中排除API集成问题,共享API密钥、OAuth令牌和数据库凭据,这些都会存在于被窃取的对话历史中。此漏洞允许攻击者被动收集多个对话中的凭据,而不会引发任何可能触发警报的可疑活动。
知识产权:与AI助手讨论的产品规格、专有算法和未发布的业务策略可能被静默收集。例如,使用AI工具完善产品策略的初创公司可能会无意中将其整个路线图暴露给运营恶意MCP服务器的竞争对手。
受保护信息:受监管行业(如医疗保健、金融和法律服务)的组织在处理敏感信息时越来越多地使用AI助手。此漏洞可能导致受保护的健康信息、个人可识别信息或重大非公开信息的未经授权披露,从而导致违规和潜在法律责任。
为什么这种攻击比弹出shell更好
从复杂威胁行为者的角度来看,这种方法在隐蔽性和获取有价值内容的可能性之间取得了更好的平衡。
发起此类漏洞利用的最可能方法是供应链攻击,例如在GitHub或服务器注册表中植入恶意MCP服务器,或将后门插入现有开源项目。这类攻击有两个缺点。首先,这些攻击可能昂贵且耗时。例如,臭名昭著的XZ Utils后门是在近两年时间内逐步插入的。其次,被发现会永久破坏整个漏洞利用链。如果单个研究人员注意到入侵,攻击者必须完全重新开始。弹出shell是攻击者能做的最吵闹和最危险的事情之一,因此聪明的威胁行为者会寻找更安静的方法。
此外,针对运行主机应用程序的计算机可能无法给攻击者带来任何可货币化的东西。无法保证应用程序会在高权限用户的工作站上运行。在精心设计的企业部署中,主机应用程序可能在隔离(甚至是临时)容器中运行,这意味着攻击者可能需要大量横向移动(和高发现风险)才能访问任何有用的东西。
使用触发短语而不是在每个工具调用上运行漏洞利用将使攻击隐藏更长时间。事实上,巧妙选择的触发短语实际上可以帮助定位最有价值的信息以进行窃取。
为定向数据窃取精心设计触发机制
上述工具描述使用"谢谢"仅仅是因为其普遍性,但考虑针对银行或金融科技公司的攻击。攻击者可以指示模型寻找格式像银行账号、社会安全号码或其他高价值标识符的数字序列,而不是特定的词语序列。如果目标是科技公司,模型可以寻找格式像AWS密钥的字符串。由于某些MCP服务器邀请用户通过聊天界面提交凭据(更多内容将在后续文章中介绍),这种攻击将捕获大量凭据。更可怕的例子是,考虑合法或非法在工作中咨询聊天机器人的政府或军事官员。针对此类目标的定向数据窃取可能导致国际丑闻、勒索甚至人员伤亡。
此外,获得对话历史访问权限的攻击者可以使用这些上下文信息来制作高度可信的后续攻击。了解目标如何与其AI助手通信为创建模仿合法交互的定向钓鱼活动提供了宝贵情报。
保护自己免受越线攻击
MCP协议的未来迭代可能最终解决底层漏洞,但用户现在需要采取预防措施。在标准化稳健解决方案之前,将所有MCP连接视为潜在威胁并采取以下防御措施:
审查来源:仅连接到来自可信源的MCP服务器。在允许任何工具描述进入模型上下文之前仔细审查所有工具描述。
实施防护栏:使用自动扫描或防护栏在可疑工具描述和潜在有害调用模式到达模型之前检测和过滤它们。
监控变化(首次使用信任):为MCP服务器实施首次使用信任(TOFU)验证。每当添加新工具或现有工具描述发生变化时提醒用户或管理员。
实践安全使用:禁用不需要的MCP服务器以最小化攻击面。避免自动批准命令执行,特别是对于与敏感数据或系统交互的工具,并定期审查模型的建议操作。
MCP生态系统的开放性使其成为扩展AI功能的强大工具,但同样的开放性带来了重大的安全挑战。随着我们构建越来越强大的AI系统,这些系统可以访问敏感数据和外部工具,我们必须确保不会为了便利性或速度而牺牲基本安全原则。
这是我们关于MCP安全状况系列文章的第二部分。在下一部分中,我们将探讨恶意服务器如何使用ANSI转义码向用户隐藏其真实意图,创建肉眼不可见的后门。
查看本系列其他文章:
跳过线路:MCP服务器如何在您使用它们之前攻击您
感谢我们的AI/ML安全团队调查这种攻击技术的工作!
如果您喜欢这篇文章,请分享:
Twitter LinkedIn GitHub Mastodon Hacker News
© 2025 Trail of Bits.
使用Hugo和Mainroad主题生成。