谷歌发布Gemini 2.5 Deep Think for AI Ultra订阅者
谷歌今日发布了其最强大的Gemini模型,但你可能无法尝试。在5月的I/O大会上揭晓Gemini 2.5 Deep Think后,谷歌现已在Gemini应用中提供此AI。Deep Think专为最复杂的查询设计,这意味着它比其他模型使用更多的计算资源。因此,只有订阅谷歌250美元的AI Ultra计划的用户才能访问它,这并不令人意外。
Deep Think基于与Gemini 2.5 Pro相同的基础,但通过更大的并行分析增加了“思考时间”。据谷歌称,Deep Think探索问题的多种方法,甚至重新审视和重新混合它生成的各种假设。这个过程帮助它创建更高质量的输出。
像其他一些重量级Gemini工具一样,Deep Think需要几分钟才能得出答案。这显然使AI更擅长设计美学、科学推理和编码。谷歌已将Deep Think暴露于通常的基准测试套件中,显示它超越了标准Gemini 2.5 Pro和竞争模型,如OpenAI o3和Grok 4。Deep Think在“人类最后考试”中显示出特别大的增益,这是一个包含2500个复杂、多模态问题的集合,覆盖100多个主题。其他模型最高达到20%或25%,但Gemini 2.5 Deep Think获得了34.8%的分数。
数学是Deep Think的一个主要焦点,它在AIME基准测试中也表现出强劲性能。不过,这里还有更多工作要做。谷歌最近透露,它使用了一个特殊训练的Deep Think版本,该版本可以运行数小时才得出解决方案,以参加国际数学奥林匹克(IMO)。这个模型首次获得了IMO金牌。谷歌仅向受信任的测试者分发了IMO版本的Deep Think,但希望稍后更广泛地发布它。与此同时,标准Deep Think在2025年IMO测试中仍达到铜牌状态。
谷歌AI Ultra订阅者从今天起可以在Gemini应用和网络界面中访问Deep Think,但它不在主模型菜单中。当你选择Gemini 2.5 Pro时,它可以作为一个工具(与Deep Research、Canvas等一起)访问。即使有谷歌昂贵的AI订阅,谷歌表示每天对Deep Think查询的数量有设定限制。它没有指定限制是什么,谷歌也没有提供具体细节,表明限制会随时间变化。Deep Think最终将进入API,为开发者提供一种通过付费服务访问更多提示的方式。