Claude Sonnet 4.5:Anthropic迄今最安全的AI模型
当然,它在编程方面也很出色。
2025年9月30日 GMT+8 凌晨1:00 | 阅读时间2分钟
Anthropic将Sonnet 4.5称为迄今为止世界上最好的编程模型。
5月,Anthropic宣布了两个新的AI系统Opus 4和Sonnet 4。现在,不到六个月后,该公司推出了Sonnet 4.5,并称其为迄今为止世界上最好的编程模型。Anthropic这一声明的基础是一系列基准测试,新AI在这些测试中不仅超越了其前代产品,还超越了更昂贵的Opus 4.1以及竞争系统,包括Google的Gemini 2.5 Pro和OpenAI的GPT-5。例如,在OSWorld(一套测试AI模型在真实世界计算机任务上表现的套件)中,Sonnet 4.5创下了61.4%的纪录得分,比Opus 4.1高出17个百分点。
同时,新模型能够自主处理多步骤项目超过30小时,与Opus 4在发布时能维持的约7小时相比,这是一个显著的改进。对于Anthropic想要构建的代理系统类型来说,这是一个重要的里程碑。
Sonnet 4.5在编程和代理任务上超越了Anthropic的旧模型。
也许更重要的是,该公司声称Sonnet 4.5是其迄今为止最安全的AI系统,该模型经过了“广泛”的安全训练。这种训练转化为一个Anthropic称“显著”更不容易出现“奉承、欺骗、权力寻求和鼓励妄想思维倾向”的聊天机器人——这些都是最近几个月让OpenAI陷入困境的潜在模型特征。同时,Anthropic加强了对提示注入攻击的防护。由于新模型的复杂性,Anthropic在其AI安全等级3框架下发布Sonnet 4.5,这意味着它配备了旨在防止与化学、生物和核武器相关提示产生潜在危险输出的过滤器。
一张图表显示Sonnet 4.5在安全测试中与其他前沿模型的对比。
随着今天的公告,Anthropic还在整个Claude产品栈中推出了生活质量改进。首先,该公司流行的编程代理Claude Code拥有焕然一新的终端界面,并包含了一个名为检查点的新功能。正如您可能从名称中猜到的,它们允许您保存进度,并在Claude编写了一些不符合您预期的奇怪代码时回滚到之前的状态。文件创建功能(Anthropic在本月初开始推出)现在对所有Pro用户可用,如果您加入了Chrome版Claude的等待列表,今天就可以开始使用该扩展。
Sonnet 4.5的API定价仍为每100万输入令牌3美元,相同数量的输出令牌为15美元。Sonnet 4.5的发布为Anthropic强劲的9月画上了句号。就在上周微软将Claude模型加入Copilot 365一天后,OpenAI承认其竞争对手为工作相关任务提供了最好的AI。