生命科学研发中可构建的四种智能体工作流
由生成式人工智能驱动的AI智能体正通过充当智能、协作的合作伙伴来迅速改变各行各业。它们能够解读目标、规划多步骤行动并跨系统独立工作,标志着企业在寻找、理解和处理数据方式上的重大转变。我们最近的博客概述了AI智能体如何改变多个行业。
下面我们将描述如何创建一个模块化、端到端的平台,通过多智能体系统加速新型候选治疗药物的发现和临床前优化。该系统旨在从高层次的疾病概念出发,无论特定疾病或治疗模式如何,最终产出一组具有高成功概率的先导候选药物。
我们认为,专门的AI智能体可以扮演几个关键角色,每个角色都基于Google的特定开源权重模型,而这些模型又可以针对更专业的目的进行微调和训练。鉴于下述智能体均基于开源权重模型,这为进-步微调和训练这些模型以构建强大的智能体提供了很大空间。
可用于生命科学的四种智能体
1. MedGemma: “战略情报智能体”
专长: 深度理解和综合非结构化的生物医学文本、医学影像、临床数据和科学文献。 功能: 充当专门的知识智能体。当受到认知协调器的指示时,它会跨生物医学语料库(如PubMed、患者文本记录、胸部X光片等其他模态)执行深度搜索和综合,以提取发现、构建队列并总结知识。MedGemma特别适用于需要严格版本控制(例如受监管产品)、较低推理成本或需要大量适应特定用例的场景。此外,其快速的性能和高效的成本使其非常适用于那些对速度和成本有要求的高吞吐量医疗用例,其中许多用例在生命科学领域非常常见。
2. TxGemma: “临床前分析师”
专长: 预测治疗分子的功能和安全特性。 功能: 在计算机中预测候选药物的临床前特性,如药代动力学、渗透性、毒性或功效。 (可参考TxGemma博客)
3. Gemini 2.5 Pro: “认知协调器智能体”
专长: 先进的多步推理、动态规划和上下文理解,以管理端到端的药物发现工作流。 功能: 通过解释高层次目标、排序任务、评估结果并动态调整工作流程来指导专门的AI智能体,帮助科学家实现最终的治疗目标。此协调器还可以访问各种工具。一个工具可以是一个完整的、专门的智能体(如MedGemma),也可以是一个特定的模型端点(如AlphaFold),并且会被赋予其功能的清晰、自然语言描述。例如,MedGemma工具可以这样使用:“一个根据给定病理学搜索和综合生物医学文献以识别潜在疾病靶点的工具。” 注意: 对于需要版本锁定模型和变更控制的用例,用户可以选择使用Gemma(开源)来进行此协调。
4. AlphaFold-2 与分子对接工具: “分子架构师”
专长: 预测分子靶点的精确三维结构,并模拟候选分子如何与它们物理相互作用(对接)。 功能: 创建药物-靶点相互作用的基本结构蓝图,实现基于结构的设计、虚拟筛选和特异性分析。
以下是分步流程
阶段 1:寻找靶点
科学家向系统发出提示(例如,“寻找帕金森病的新靶点”)。MedGemma智能体(“AI研究分析师”)立即扫描数百万出版物和临床数据,以识别有前景的生物学靶点。协调器提供一份简洁的报告,科学家批准最终靶点。
阶段 2:生成候选药物
AlphaFold智能体(“分子架构师”)构建靶点的3D模型。然后,TxGemma智能体进行虚拟筛选,测试数千个潜在的药物"钥匙",看它们如何"适配"靶点"锁",从而创建一个候选药物短名单。
阶段 3:“设计-测试-优化"循环
这是快速改进候选药物的核心引擎。
- 预测: TxGemma(“临床前分析师”)对每个候选药物运行虚拟模拟,预测其实际性能(如效力、毒性)。
- 分诊: 协调器对它们进行分类:“推进”(看起来极佳)、“归档”(死胡同)或"优化”(有前途,但有缺陷)。
- 优化: “优化"类别的候选药物会自动进行精炼以修复其特定缺陷,并立即被送回循环中。
这个"设计 -> 对接 -> 预测 -> 优化"的循环在Google Cloud的高性能计算上运行数千次,以物理实验室无法达到的速度迭代药物设计。
阶段 4:提名可用于实验室的先导药物
循环结束后,协调器向人类科学家呈现最终的、高度优化的先导候选药物。科学家做出最终选择,MedGemma再次参与,帮助设计现实世界实验室测试的最佳策略。
通过将药物发现中昂贵的"测试-失败"部分转移到这种快速的、计算机模拟的工作流程中,我们可以将实验室资源集中在成功概率最高的候选药物上,从而为开发新疗法创造一条更快速、更智能的路径。
参考架构
此图显示了基础服务以及数据如何在它们之间流动,以及服务如何协同工作。执行这种复杂、迭代的工作流程需要一个稳健、可扩展且安全的云平台。Google Cloud提供了一套全面的服务,直接映射到每个AI智能体和整体工作流程的需求,确保数据完整性、合规性和计算能力。
如何开始使用 Google Cloud
- Vertex AI Search 是实现此智能体功能的核心服务。它可以在私有生物医学数据语料库(如内部研究文档、PubMed文献和临床试验数据)上创建一个复杂的检索增强生成(RAG)系统。这直接使智能体能够回答自然语言查询并综合带有引用的信息。
- Vertex AI。 Google Cloud提供托管、优化的AlphaFold环境和集成。对于高通量需求,配备GPU或TPU加速的Vertex AI Training可以并行运行数千个蛋白质折叠和对接模拟。使用Vertex AI Agent Builder来创建智能体。
(我们感谢Ryan Ye Min Thein(谷歌云客户工程师)和Justin Chen(谷歌健康临床专家)的贡献。)