安全高效的计算机使用代理访问控制:基于上下文空间的方法
基于大型语言模型(LLM)的计算机使用代理代表了AI与操作系统能力的融合,使得自然语言能够控制系统级和应用级功能。然而,由于LLM固有的不确定性问题,授予代理对计算机的控制权会带来重大安全风险。当代理行为偏离用户意图时,可能导致不可逆转的后果。
现有的缓解方法,如用户确认和基于LLM的动态操作验证,在可用性、安全性和性能方面仍存在局限性。为解决这些挑战,我们提出了CSAgent——一个面向计算机使用代理的系统级、基于静态策略的访问控制框架。
为了弥合静态策略与动态上下文及用户意图之间的差距,CSAgent引入了意图和上下文感知策略,并提供了自动化工具链以协助开发者构建和完善这些策略。CSAgent通过优化的操作系统服务强制执行这些策略,确保代理操作只能在特定的用户意图和上下文中执行。
CSAgent支持保护通过多种接口控制计算机的代理,包括API、命令行界面(CLI)和图形用户界面(GUI)。我们实现并评估了CSAgent,该系统成功防御了超过99.36%的攻击,同时仅引入6.83%的性能开销。