谷歌新型扩散AI代理模仿人类写作提升企业研究

谷歌研究人员开发的新型AI研究代理框架TTD-DR,通过模仿人类写作的迭代过程,在复杂商业研究任务中超越OpenAI等竞争对手。该系统结合扩散机制与进化算法,可生成更全面准确的市场分析报告。

谷歌研究人员开发的新型AI研究代理框架在关键基准测试中超越了OpenAI等竞争对手的领先系统。这个名为"测试时扩散深度研究代理"(TTD-DR)的新系统,灵感来源于人类写作的起草、信息搜索和迭代修改过程。

该系统采用扩散机制和进化算法,能够针对复杂主题生成更全面准确的研究报告。对企业而言,该框架可支持新一代定制化研究助手,完成标准检索增强生成(RAG)系统难以处理的高价值任务,如竞争分析或市场进入报告。

当前深度研究代理的局限性

深度研究(DR)代理旨在处理超越简单搜索的复杂查询。它们使用大语言模型(LLMs)进行规划,利用网络搜索等工具收集信息,然后借助思维链(CoT)、N最佳采样和蒙特卡洛树搜索等测试时扩展技术将发现综合成详细报告。

然而,许多现有系统存在根本设计缺陷。大多数公开可用的DR代理应用测试时算法和工具时缺乏模拟人类认知行为的结构。开源代理通常遵循严格的线性或并行流程,使得研究的不同阶段难以相互修正。

受人类写作和扩散启发的新方法

与大多数AI代理的线性流程不同,人类研究者以迭代方式工作。他们通常从高层计划开始,创建初稿,然后进行多轮修改。在这些修订中,他们会搜索新信息来强化论点并填补空白。

谷歌研究人员发现,这一人类过程可以通过增强检索组件的扩散模型来模拟。研究人员解释:“在这个类比中,训练好的扩散模型首先生成噪声草稿,然后去噪模块在检索工具的辅助下,将草稿修订为更高质量的输出。”

TTD-DR基于这一蓝图构建。该框架将研究报告的创建视为扩散过程,初始"嘈杂"草稿逐步完善为最终报告。

核心机制

该系统通过两个核心机制实现:

  1. 检索去噪:从初步草稿开始迭代改进。每一步中,代理使用当前草稿制定新搜索查询,检索外部信息并整合以"去噪"报告。
  2. 自我进化:确保代理的每个组件(规划器、问题生成器和答案合成器)独立优化自身性能。这种组件级进化使"报告去噪更有效"。

性能表现

研究人员使用谷歌代理开发套件(ADK)构建和测试该框架,核心LLM为Gemini 2.5 Pro(可替换为其他模型)。基准测试显示,TTD-DR在长式报告生成和多跳问题回答任务中 consistently 优于竞争对手。

在长式报告生成方面,TTD-DR对OpenAI深度研究系统的胜率达到69.1%和74.5%。在需要多跳推理的三个独立基准测试中,性能分别提升4.8%、7.7%和1.7%。

未来方向

虽然当前研究聚焦基于网络搜索的文本报告,但该框架设计高度灵活。研究团队计划扩展工作以纳入更多企业级复杂任务工具。类似的"测试时扩散"过程可用于生成复杂软件代码、创建详细财务模型或设计多阶段营销活动。

研究人员表示:“所有这些工具都可以自然地融入我们的框架”,表明这种以草稿为中心的方法可能成为各类复杂多步AI代理的基础架构。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计