谷歌云月度AI技术全景：从Gemini模型到Agent协议架构深度解析

十月更新

核心发布

在Vertex AI上使用Gemini 2.5 Flash Image构建下一代视觉效果：我们宣布在Gemini 2.5 Flash（代号nano-banana）中推出原生图像生成和编辑功能，提供更高质量的图像和更强大的创意控制。Gemini 2.5 Flash Image在生成和图像编辑方面均达到业界领先水平。

通过新型Agent支付协议（AP2）推动AI商务：我们发布了Agent支付协议（AP2），这是一个与领先支付和技术公司共同开发的开源协议，用于安全地启动和执行跨平台的代理主导支付。该协议可作为Agent间协议（A2A）和模型上下文协议（MCP）的扩展。

AI投资回报率：代理如何为企业创造价值：根据我们的2025年AI投资回报报告，52%的高管表示其组织正在生产环境中部署AI代理，这代表了业务完成方式的根本性转变。

AI代理安全：如何保护数字助手（和您的业务）：如果没有健全、灵活的安全措施，AI代理可能泄露敏感公司数据、导致系统中断，甚至使企业面临安全威胁。

经济高效地扩展高性能推理：GKE推理网关正式可用，我们正在推出提供更多价值的新功能。

实用资讯

Agent Factory回顾：Keith Ballinger谈AI、开发未来和氛围编码：在第6期Agent Factory播客中，Vlad Kolesnikov与谷歌云副总裁兼总经理Keith Ballinger深入探讨了AI带来的软件开发变革性未来。

宣布新的Google Cloud数据科学实践指南：我们设计了这本新指南，面向希望在BigQuery、Vertex AI和Google Cloud无服务器Apache Spark中使用Google Cloud功能的从业者。

通过新的Gemini CLI扩展自动化应用部署和安全分析：我们通过两个新扩展首次展示了Gemini CLI的未来：安全扩展和Cloud Run扩展。

八月更新

核心发布

在Vertex AI上使用Gemini 2.5 Flash Image构建下一代视觉效果：我们宣布在Gemini 2.5 Flash中推出原生图像生成和编辑功能。

Google AI使用多少能源？我们做了计算：每个提示的估计能源影响相当于观看电视不到九秒。

Wells Fargo如何使用Google Cloud AI为其员工配备代理工具：Wells Fargo作为Google Agentspace的早期采用者，正在改变个人和团队的工作、协作和服务客户方式。

实用资讯

针对每种情况应使用哪种Google AI开发工具：从Jules到Firebase Studio，我们绘制了开发工具全景图。

使用Google Kubernetes Engine大规模运行OpenAI的新gpt-oss模型：本指南引导您在GKE上部署OpenAI的新gpt-oss模型。

使用Gemini和Google ADK构建实时语音代理：学习如何使用代理开发套件（ADK）和Gemini为应用程序创建复杂的实时语音代理。

AI Hypercomputer最新动态：了解我们AI Hypercomputer架构的最新更新和进展。

七月更新

核心发布

Veo 3和Veo 3 Fast现已在Vertex AI上向所有人提供：Veo 3 Fast是将文本转换为视频的更快方式。

我们的Big Sleep代理实现重大飞跃：由Google DeepMind和Google Project Zero开发的Big Sleep可以帮助安全研究人员发现零日软件安全漏洞。

宣布用于在Google Cloud上扩展A2A代理的完整开发工具包：我们发布了A2A协议0.3版本，带来了更稳定的构建接口。

全球端点为Anthropic的Claude on Vertex AI提供改进的可用性：Anthropic在Vertex AI上的Claude模型现在通过Claude模型的全局端点提高了整体可用性。

实用资讯

收藏我们的25+生成式AI操作指南：我们收集了超过25个企业生成式AI操作指南。

使用BigQuery构建对话式分析代理：我们发布了用于BigQuery的新第一方工具集。

在Vertex AI上将开放模型从发现带到端点：本指南引导您完成在Vertex AI上选择、微调、评估和部署开放模型的过程。

为AI工作负载启用安全启动：了解如何在Google Cloud上为GPU加速的AI工作负载启用安全启动。

六月更新

核心发布

在终端中：介绍Gemini CLI：一个开源AI代理，将Gemini的强大功能直接带入您的终端。

在Vertex AI中：Gemini 2.5 Flash和2.5 Pro现已稳定并正式可用：我们最智能的速度和高级推理模型已为生产环境做好准备。

故事展开：您梦想，Veo创造：Veo 3不仅带来惊艳的视觉质量，现在还添加了从背景声音到对话的声音。

AI代理安全

随着AI从回答问题转向采取行动，保护这些自治系统至关重要。

实用资讯

使用Vertex AI服务构建支持RAG的应用：这是一个新的架构指南，帮助理解Vertex AI和Vector Search在生成式AI应用中的作用。

创建多模态代理以处理复杂任务：使用新的教程，结合Gemini、LangChain和LangGraph构建能够识别对象的多模态代理。

在Vertex AI上微调视频输入的快速指南：如果您的工作涉及内容审核、视频字幕和详细事件定位，本指南适合您。

五月更新

主要公告

新的生成式AI媒体模型：包括用于视频的Veo 3、用于图像的Imagen 4和用于音乐的Lyria 2。

扩展Gemini 2.5 Flash和Pro模型功能：通过思想总结，企业可以获得模型原始思想的清晰度和可审计性。

Gemini 2.5现为所有Gemini Code Assist版本提供支持：我们还推出了Jules，一个新的自主AI编码代理，现处于公开测试阶段。

Firebase Studio：一个基于云的AI工作区，由Gemini 2.5提供支持。

简化AI应用部署：通过Cloud Run推出了三个关键更新。

安全进展

Google Cloud风险保护计划的新内容：我们现在包括针对Google相关AI工作负载的肯定性AI保险覆盖。

机密计算如何为可信AI奠定基础：我们最新的机密计算创新重点介绍了客户使用机密计算保护最敏感工作负载的创造性方式。

四月更新

主要公告

代理：我们最近推出的Agent间协议（A2A）获得了大量关注。这个开放互操作性协议旨在让AI代理无论其基础如何都能轻松相互通信。

模型：本月我们宣布了六个新模型：Gemini 2.5 Pro、Gemini 2.5 Flash、Imagen 3、Chirp 3、Lyria和Veo 2。

安全：在Next ‘25上推出了Google统一安全，为卓越的安全成果奠定了基础。

实用资讯

Meta的Llama 4在Vertex AI上正式可用

Vertex AI仪表板：帮助您监控使用情况、吞吐量、延迟和排除错误。

Vertex AI模型优化器：使用Google对Gemini的独特理解，根据您的质量、速度和成本偏好自动将查询定向到性能最佳的模型和工具。

实时API：为实现真正的对话交互，实时API提供直接流入Gemini的流式音频和视频。

三月更新

主要公告

Gemini家族正在成长：我们推出了Gemini 2.5，一个旨在处理日益复杂问题的思维模型。

我们还推出了Gemma 3：这是您可以在TPU或GPU上运行的最强大模型。

在开源世界：我们宣布Claude 3.7 Sonnet可在Vertex AI模型园地中预览。

在安全方面向前迈进：我们推出了AI保护，一套旨在保护跨云和模型的AI工作负载和数据的能力。

二月更新

主要公告

将AI带给您：本月我们宣布了Vertex AI中的代理评估。我们还从基础设施角度宣布了AI Hypercomputer的新更新。

合作伙伴和开源的新内容：本月我们投资于与合作伙伴的关系。同时，我们分享了开源世界的几个重要公告。

行业新闻

国家零售联合会以他们的年度NRF会议开启了这一年，Google Cloud展示了AI代理和AI驱动的搜索如何帮助零售商更高效运营。

实用资讯

本月我们分享了几种更好地实施快速发展的AI的方法，从监督微调（SFT）的综合指南，到开发人员如何帮助他们的LLM提供更准确、相关和上下文感知的响应。