今天,Brave Leo 通过部署基于 NEAR AI 支持的 Nvidia 可信执行环境的 LLM,提供了一项新的能力:可加密验证的隐私和透明度。Brave 认为,用户必须能够验证他们正在与他们期望的模型进行私密对话。该功能现已在 Brave Nightly(我们的测试和开发频道)中提供,可供早期实验使用 DeepSeek V3.1(我们计划根据反馈在未来将其扩展到更多模型)。
通过集成可信执行环境,Brave Leo 朝着提供无可匹敌的可验证隐私和透明度的 AI 助手迈进,实际上从“信我就行”的过程,转向了 Brave 所追求的“设计即隐私”方法:“信任但要验证”。
Brave 信奉以用户为先的 AI
Leo 是 Brave 浏览器集成的、保护隐私的 AI 助手。它由最先进的大语言模型驱动,同时通过保护隐私的订阅模式、云端不存储聊天记录、云端不存储上下文、不记录 IP 地址以及不基于用户对话进行训练来保护用户隐私。
Brave 认为用户必须能够:
- 可验证的隐私 — 用户必须能够验证 Leo 的隐私保证是否符合公开的隐私承诺。
- 模型选择的可验证透明度 — 用户必须能够验证 Leo 的响应确实来自用户期望(或付费购买,就 Leo Premium 而言)的机器学习模型。
其他竞争聊天机器人提供商缺乏这些以用户为先的功能,引入了“隐私粉饰”的风险。研究和实践(例如,研究论文《你得到了你付费的东西吗?审计 LLM API 中的模型替换》以及对 ChatGPT 的强烈反对)均已表明,聊天机器人提供商可能有动机为了降低 GPU 成本和提高利润率,默默地将昂贵的大语言模型替换为运行成本更低、能力更弱的模型,并将来自较弱模型的结果返回给用户。
Brave 通过机密计算迈向 LLM 的可验证隐私与透明度
Brave 通过使用 NEAR AI TEE 上的机密 LLM 计算,消除对大语言模型/API 提供商的信任需求,从而开启这一旅程。Brave 使用支持 NEAR AI TEE 的 Nvidia GPU,通过创建安全飞地来确保机密性和完整性,在飞地中数据和代码都被加密处理。
这些 TEE 会产生一份加密的证明报告,其中包含加载模型和执行代码的度量值(哈希值)。此类证明报告可以进行加密验证,以获得绝对保证:
- 通过正版 Nvidia GPU TEE 创建了一个安全环境,该环境会生成其完整性和配置的加密证明。
- 推理在此安全环境中运行,采用完全加密,确保用户数据的私密性 — 任何人都无法看到用户传递给计算的任何数据,或计算的任何结果。
- 用户期望的模型和开源代码正在未经修改地运行,这是通过为每次计算进行加密签名来实现的。
在我们开发的第一阶段,Brave 执行加密验证,用户可以按如下方式在 Leo 中使用“通过 NEAR AI TEE 可验证私密”:
- 用户在 Brave Nightly 的 Leo 中选择标有“通过 NEAR AI TEE 可验证私密”的 DeepSeek V3.1。
- Brave 执行 NEAR AI TEE 验证,验证从 NEAR 开源代码到硬件证明执行的加密链,确保响应是在正版 Nvidia TEE 中运行特定版本的 NEAR 开源服务器生成的。
- Brave 通过显示已验证的绿色标签(如下图所示)将验证结果传达给用户。
- 用户开始聊天,而无需信任 API 提供商会查看或记录他们的数据和响应。
Brave Leo 中可验证隐私与透明度的未来
今天,我们很高兴在 Brave Nightly(我们的测试和开发频道)中发布基于 TEE 的机密 DeepSeek V3.1 计算,以供早期实验和反馈。
在更广泛地推出此功能之前,我们专注于两件事:
- 无面向用户的性能开销 — TEE 会在 GPU 上引入一些计算开销。然而,正如《NVIDIA Hopper GPU 上的机密计算:性能基准研究》所示,最近的进展显著降低了这种开销 — 在某些情况下几乎为零。我们希望确保用户不会体验到性能倒退。
- 端到端验证 — 我们正在积极研究如何扩展 Leo 中的机密计算,以便用户可以验证他们对整个流程的信任,同时 Brave 将开源所有阶段。特别是,我们计划将验证移近用户,以便他们可以在 Brave 浏览器中自行重新确认 API 验证。
更多关于可信执行环境的信息
可信执行环境是处理器中的一个安全区域,提供一个隔离的计算环境,与传统的富运行时环境(例如操作系统)分开。TEE 对其托管的代码和数据提供强有力的硬件支持的机密性和完整性保证。这些保证是通过强制执行(例如仅 TEE 可访问的专用内存)来实现的。
硬件隔离确保即使操作系统完全被攻破,也无法访问或篡改驻留在 TEE 内的任何代码或数据。除此之外,TEE 还公开独特的硬件原语,如安全启动和远程证明,以确保只有受信任的代码被加载到 TEE 中,并且外部方能够验证 TEE 的完整性。
芯片制造商已在 CPU(传统上)和 GPU(最近)上启用了 TEE。支持 TEE 的 CPU(例如 Intel TDX)和支持 TEE 的 GPU(例如 Nvidia Hopper)的结合,使得大语言模型推理能够以最小的性能损失进行端到端的机密性保护和完整性保持计算。