安全高效的计算机使用代理访问控制：基于上下文空间的方法

基于大型语言模型（LLM）的计算机使用代理代表了AI与操作系统能力的融合，使得自然语言能够控制系统级和应用级功能。然而，由于LLM固有的不确定性问题，授予代理对计算机的控制权会带来重大安全风险。当代理行为偏离用户意图时，可能导致不可逆转的后果。

现有的缓解方法，如用户确认和基于LLM的动态操作验证，在可用性、安全性和性能方面仍存在局限性。为解决这些挑战，我们提出了CSAgent——一个面向计算机使用代理的系统级、基于静态策略的访问控制框架。

为了弥合静态策略与动态上下文及用户意图之间的差距，CSAgent引入了意图和上下文感知策略，并提供了自动化工具链以协助开发者构建和完善这些策略。CSAgent通过优化的操作系统服务强制执行这些策略，确保代理操作只能在特定的用户意图和上下文中执行。

CSAgent支持保护通过多种接口控制计算机的代理，包括API、命令行界面（CLI）和图形用户界面（GUI）。我们实现并评估了CSAgent，该系统成功防御了超过99.36%的攻击，同时仅引入6.83%的性能开销。

基于上下文空间的计算机使用代理安全高效访问控制