Claude Sonnet 4.5：Anthropic迄今最安全的AI模型

当然，它在编程方面也很出色。

2025年9月30日 GMT+8 凌晨1:00 | 阅读时间2分钟

Anthropic将Sonnet 4.5称为迄今为止世界上最好的编程模型。

5月，Anthropic宣布了两个新的AI系统Opus 4和Sonnet 4。现在，不到六个月后，该公司推出了Sonnet 4.5，并称其为迄今为止世界上最好的编程模型。Anthropic这一声明的基础是一系列基准测试，新AI在这些测试中不仅超越了其前代产品，还超越了更昂贵的Opus 4.1以及竞争系统，包括Google的Gemini 2.5 Pro和OpenAI的GPT-5。例如，在OSWorld（一套测试AI模型在真实世界计算机任务上表现的套件）中，Sonnet 4.5创下了61.4%的纪录得分，比Opus 4.1高出17个百分点。

同时，新模型能够自主处理多步骤项目超过30小时，与Opus 4在发布时能维持的约7小时相比，这是一个显著的改进。对于Anthropic想要构建的代理系统类型来说，这是一个重要的里程碑。

Sonnet 4.5在编程和代理任务上超越了Anthropic的旧模型。

也许更重要的是，该公司声称Sonnet 4.5是其迄今为止最安全的AI系统，该模型经过了“广泛”的安全训练。这种训练转化为一个Anthropic称“显著”更不容易出现“奉承、欺骗、权力寻求和鼓励妄想思维倾向”的聊天机器人——这些都是最近几个月让OpenAI陷入困境的潜在模型特征。同时，Anthropic加强了对提示注入攻击的防护。由于新模型的复杂性，Anthropic在其AI安全等级3框架下发布Sonnet 4.5，这意味着它配备了旨在防止与化学、生物和核武器相关提示产生潜在危险输出的过滤器。

一张图表显示Sonnet 4.5在安全测试中与其他前沿模型的对比。

随着今天的公告，Anthropic还在整个Claude产品栈中推出了生活质量改进。首先，该公司流行的编程代理Claude Code拥有焕然一新的终端界面，并包含了一个名为检查点的新功能。正如您可能从名称中猜到的，它们允许您保存进度，并在Claude编写了一些不符合您预期的奇怪代码时回滚到之前的状态。文件创建功能（Anthropic在本月初开始推出）现在对所有Pro用户可用，如果您加入了Chrome版Claude的等待列表，今天就可以开始使用该扩展。

Sonnet 4.5的API定价仍为每100万输入令牌3美元，相同数量的输出令牌为15美元。Sonnet 4.5的发布为Anthropic强劲的9月画上了句号。就在上周微软将Claude模型加入Copilot 365一天后，OpenAI承认其竞争对手为工作相关任务提供了最好的AI。

Anthropic发布最安全AI模型Claude Sonnet 4.5，编程能力再创新高

Anthropic推出新一代AI模型Claude Sonnet 4.5，在编程基准测试中创下61.4%的新纪录，支持超过30小时的多步骤项目自主工作，并显著增强了对提示注入攻击的防护能力，成为该公司迄今最安全的AI系统。

Claude Sonnet 4.5：Anthropic迄今最安全的AI模型