Gemini推出革命性Deep Think模型:技术原理与体验指南

谷歌Gemini推出全新Deep Think模型,采用并行思考技术与强化学习,在数学推理和编程任务中表现卓越。该模型现已面向Ultra订阅用户开放,每日提供固定次数的高阶推理体验。

Gemini推出强大新Deep Think模型 - 功能详解与体验方式

两周前,谷歌和OpenAI纷纷宣传其模型在国际数学奥林匹克竞赛(IMO)中的获奖表现。如今,谷歌正式向公众开放其模型的某个版本。

上周五,谷歌为Google Ultra订阅用户(年费250美元或前三个月125美元的高级订阅层级)在Gemini应用中推出了Deep Think功能。虽然该模型与IMO金牌标准模型同源,但在日常任务中运行速度更快。内部评估显示,该模型在2025年IMO基准测试中达到铜牌水平。

技术原理

卓越的复杂问题解决能力得益于并行思考技术,该技术使模型能够同时生成和处理多个想法,甚至在必要时组合不同思路以找到最佳答案。

其他促成高性能的因素包括:延长推理时间(又称思考时间),使Deep Think能在得出答案前探索更多选项;以及新的强化学习技术,帮助模型随时间推移成为更优秀的问题解决者。

据谷歌表示,Deep Think在迭代开发与设计(如上图所示)、科学与数学发现以及编程方面表现突出。这些成果体现在Gemini 2.5 Deep Think在最先进基准测试中的表现,包括涵盖数学、科学和人文学科等100多个学科多模态问题的"人类终极考试"。

谷歌还透露,与Gemini 2.5 Pro相比,Gemini 2.5 Deep Think展现出更好的内容安全性和语气客观性,但需要注意的是,它拒绝良性请求的比率更高。

访问方式

Google AI Ultra订阅用户可通过Gemini应用每日使用固定次数的Deep Think功能。要选择该模型,需在模型选择器中切换至2.5 Pro,然后在提示栏中启用"Deep Think"选项。

该公司还表示,正在努力在未来几周内通过Gemini API向一组受信任的测试者发布带工具和不带工具的Deep Think版本。达到金牌标准的Gemini 2.5 Deep Think模型将与少数数学家和学者共享,旨在推动他们的研究工作,并期望通过这些实践获得改进反馈。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计