Anthropic发布Claude Sonnet 4.5:AI智能体与编程能力重大突破

Anthropic最新发布的Claude Sonnet 4.5模型能够自主运行30小时编写出类似Slack的聊天应用,生成约11000行代码。该模型在计算机使用、网络安全和金融服务领域表现卓越,为开发者提供了虚拟机器、内存管理等构建AI智能体的关键工具。

Anthropic发布Claude Sonnet 4.5:AI智能体与编程能力重大突破

该模型可自主连续运行30小时,生成约11000行代码构建类Slack聊天应用

Anthropic最新AI模型在无人干预的情况下自主运行30小时,成功编写出类似Slack或Teams的聊天应用程序。据Anthropic称,该模型输出了约11000行代码,仅在完成任务后才停止运行。

今日发布的Claude Sonnet 4.5模型能够连续自主运行30小时,这一能力实现了巨大飞跃。此前,该公司Opus 4模型因能运行7小时而在5月登上头条新闻。

这是Anthropic在AI智能体和AI编程市场竞争中的重要一步。该公司称Claude Sonnet 4.5是"现实世界智能体、编程和计算机使用领域的全球最佳模型",并表示其在"使用计算机方面领先市场",这指的是Anthropic近一年前推出的计算机使用功能。据Anthropic称,新模型在网络安全、金融服务和研究等领域表现尤为出色。其Beta测试者之一Canva表示,新模型在"复杂的长上下文任务中提供了帮助——从代码库工程到产品功能和研究"。

Anthropic、OpenAI、Google等公司持续发布增量更新和功能,使其技术既能作为消费者助手(研究主题、安排会议、查询航班),也能用于企业和开发人员用途(创建幻灯片、协助编码任务和分析电子表格)。这场关注度和依赖度的竞争几乎每月(如果不是每周)都在升温。几天前,OpenAI宣布了Pulse,这是其最新ChatGPT功能,旨在成为用户晨间例行公事和研究相关主题的一部分。

Anthropic还表示,新模型将与其他更新配合,帮助开发人员编写自己的AI智能体。

“我们将模型发布与虚拟机、内存、上下文管理和多智能体支持的访问权限相结合,“该公司在新闻稿中写道。“这实质上打包了驱动Claude Code的相同构建模块——使开发人员能够构建自己的尖端智能体。”

Anthropic产品管理负责人Dianne Penn在接受The Verge采访时表示,该模型在计算机使用能力方面的改进甚至令她感到惊讶。与去年10月的技术相比,Claude Sonnet 4.5在浏览器导航和计算机使用方面的技能提高了三倍以上。Penn表示团队收到了早期访问客户的反馈——“全球的GitHub和Cursor用户”——并在过去一个月密集优化了该模型。

Claude.ai产品负责人Scott White告诉The Verge,新模型以"参谋长级别"运作,能够查找多人日历的空闲时间并安排会议,查看数据仪表板并汇总见解,根据与直接下属的一对一会议编写状态更新等。

当The Verge与他们交谈时,White和Penn都尚未尝试使用新模型进行"氛围编码”。但Penn表示她使用Claude Sonnet 4.5为Anthropic招聘潜在新团队成员。

“拥有一个持续运行的提示确实非常有帮助,我使用它进行深度网络搜索,为团队中特定角色制定人才搜寻参数,“Penn说。“这真的非常非常有帮助。而且我看到Sonnet 4.5在搜索质量和深度方面比过去做得更好,实际上生成了包含LinkedIn个人资料的电子表格,这样我就可以给他们发邮件了。”

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计