基于上下文空间的计算机使用代理安全高效访问控制

本文提出CSAgent框架,通过上下文空间为基于大型语言模型的计算机使用代理提供安全高效的访问控制。该系统采用静态策略和意图感知机制,支持API、CLI和GUI等多种接口,能防御99.36%的攻击且仅产生6.83%性能开销。

安全高效的计算机使用代理访问控制:基于上下文空间的方法

基于大型语言模型(LLM)的计算机使用代理代表了AI与操作系统能力的融合,使得自然语言能够控制系统级和应用级功能。然而,由于LLM固有的不确定性问题,授予代理对计算机的控制权会带来重大安全风险。当代理行为偏离用户意图时,可能导致不可逆转的后果。

现有的缓解方法,如用户确认和基于LLM的动态操作验证,在可用性、安全性和性能方面仍存在局限性。为解决这些挑战,我们提出了CSAgent——一个面向计算机使用代理的系统级、基于静态策略的访问控制框架。

为了弥合静态策略与动态上下文及用户意图之间的差距,CSAgent引入了意图和上下文感知策略,并提供了自动化工具链以协助开发者构建和完善这些策略。CSAgent通过优化的操作系统服务强制执行这些策略,确保代理操作只能在特定的用户意图和上下文中执行。

CSAgent支持保护通过多种接口控制计算机的代理,包括API、命令行界面(CLI)和图形用户界面(GUI)。我们实现并评估了CSAgent,该系统成功防御了超过99.36%的攻击,同时仅引入6.83%的性能开销。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计