Anthropic发布Claude Sonnet 4.5：AI智能体与编程能力重大突破

该模型可自主连续运行30小时，生成约11000行代码构建类Slack聊天应用

Anthropic最新AI模型在无人干预的情况下自主运行30小时，成功编写出类似Slack或Teams的聊天应用程序。据Anthropic称，该模型输出了约11000行代码，仅在完成任务后才停止运行。

今日发布的Claude Sonnet 4.5模型能够连续自主运行30小时，这一能力实现了巨大飞跃。此前，该公司Opus 4模型因能运行7小时而在5月登上头条新闻。

这是Anthropic在AI智能体和AI编程市场竞争中的重要一步。该公司称Claude Sonnet 4.5是"现实世界智能体、编程和计算机使用领域的全球最佳模型"，并表示其在"使用计算机方面领先市场"，这指的是Anthropic近一年前推出的计算机使用功能。据Anthropic称，新模型在网络安全、金融服务和研究等领域表现尤为出色。其Beta测试者之一Canva表示，新模型在"复杂的长上下文任务中提供了帮助——从代码库工程到产品功能和研究"。

Anthropic、OpenAI、Google等公司持续发布增量更新和功能，使其技术既能作为消费者助手（研究主题、安排会议、查询航班），也能用于企业和开发人员用途（创建幻灯片、协助编码任务和分析电子表格）。这场关注度和依赖度的竞争几乎每月（如果不是每周）都在升温。几天前，OpenAI宣布了Pulse，这是其最新ChatGPT功能，旨在成为用户晨间例行公事和研究相关主题的一部分。

Anthropic还表示，新模型将与其他更新配合，帮助开发人员编写自己的AI智能体。

“我们将模型发布与虚拟机、内存、上下文管理和多智能体支持的访问权限相结合，“该公司在新闻稿中写道。“这实质上打包了驱动Claude Code的相同构建模块——使开发人员能够构建自己的尖端智能体。”

Anthropic产品管理负责人Dianne Penn在接受The Verge采访时表示，该模型在计算机使用能力方面的改进甚至令她感到惊讶。与去年10月的技术相比，Claude Sonnet 4.5在浏览器导航和计算机使用方面的技能提高了三倍以上。Penn表示团队收到了早期访问客户的反馈——“全球的GitHub和Cursor用户”——并在过去一个月密集优化了该模型。

Claude.ai产品负责人Scott White告诉The Verge，新模型以"参谋长级别"运作，能够查找多人日历的空闲时间并安排会议，查看数据仪表板并汇总见解，根据与直接下属的一对一会议编写状态更新等。

当The Verge与他们交谈时，White和Penn都尚未尝试使用新模型进行"氛围编码”。但Penn表示她使用Claude Sonnet 4.5为Anthropic招聘潜在新团队成员。

“拥有一个持续运行的提示确实非常有帮助，我使用它进行深度网络搜索，为团队中特定角色制定人才搜寻参数，“Penn说。“这真的非常非常有帮助。而且我看到Sonnet 4.5在搜索质量和深度方面比过去做得更好，实际上生成了包含LinkedIn个人资料的电子表格，这样我就可以给他们发邮件了。”