谷歌云月度AI技术全景:从Gemini模型到Agent支付协议

本文详细梳理了谷歌云在AI领域的最新发布,涵盖Gemini 2.5系列模型、Agent支付协议AP2、生成式媒体工具、安全框架及多项开发工具更新,为开发者提供全面的技术参考和实践指南。

十月更新

核心发布

在Vertex AI上使用Gemini 2.5 Flash Image构建下一代视觉效果:我们宣布在Gemini 2.5 Flash中推出原生图像生成和编辑功能,提供更高质量的图像和更强大的创意控制。Gemini 2.5 Flash Image在生成和图像编辑方面均达到业界领先水平(SOTA)。对于创意用例,这意味着您可以创建更丰富、更动态的视觉效果,并对图像进行精细编辑直至完美。

通过新型Agent支付协议(AP2)赋能AI商务:我们发布了Agent支付协议(AP2),这是一个与领先支付和技术公司共同开发的开放协议,用于安全地启动和处理跨平台的代理主导支付。该协议可作为Agent2Agent(A2A)协议和模型上下文协议(MCP)的扩展。结合行业规则和标准,它建立了一个支付无关的框架,使用户、商户和支付提供商能够自信地跨所有支付方式进行交易。

AI的投资回报率:代理如何为企业创造价值:根据我们的《2025年AI投资回报率报告》,52%的高管报告其组织正在生产环境中部署AI代理,这代表了业务完成方式的根本性转变。

AI代理安全:如何保护数字助手(和您的业务):如果没有强大、灵活的安全措施,AI代理可能会泄露敏感公司数据、导致系统中断,甚至使您的业务面临安全威胁。

经济高效地扩展高性能推理:GKE推理网关现已正式可用,我们推出了提供更多价值的新功能。这体现了我们帮助公司以更高性能和优化成本提供更多智能的承诺。

实用资讯

Agent Factory回顾:Keith Ballinger谈AI、开发的未来和氛围编码:在Agent Factory播客第六集中,Vlad Kolesnikov与谷歌云副总裁兼总经理Keith Ballinger深入探讨了AI带来的软件开发变革性未来。

宣布新的Google Cloud数据科学实用指南:我们设计了这本新指南,面向希望使用Google Cloud在BigQuery、Vertex AI和Google Cloud无服务器Apache Spark方面能力的从业者。

使用新的Gemini CLI扩展自动化应用部署和安全分析:我们通过两个新扩展首次展示了Gemini CLI的未来:安全扩展和Cloud Run扩展。

八月更新

核心发布

在Vertex AI上使用Gemini 2.5 Flash Image构建下一代视觉效果:我们宣布在Gemini 2.5 Flash中推出原生图像生成和编辑功能,提供更高质量的图像和更强大的创意控制。

Google AI使用了多少能源?我们做了计算:您知道每个提示的估计能源影响相当于看电视不到九秒吗?

Wells Fargo如何使用Google Cloud AI为其员工配备代理工具:Wells Fargo作为Google Agentspace的早期采用者,正在改变个人和团队的工作、协作和服务客户方式。

实用资讯

针对每种情况应使用哪种Google AI开发工具:从Jules到Firebase Studio,我们绘制了开发工具全景图,帮助您为项目选择合适的产品。

使用Google Kubernetes Engine大规模运行OpenAI的新gpt-oss模型:本指南引导您在GKE上部署OpenAI的新gpt-oss模型,实现可扩展和高效的性能。

使用Gemini和Google ADK构建实时语音代理:了解如何使用代理开发套件(ADK)和Gemini为应用程序创建复杂的实时语音代理。

AI Hypercomputer最新动态:了解我们AI Hypercomputer架构的最新更新和进展,该架构旨在处理最苛刻的AI工作负载。

七月更新

核心发布

Veo 3和Veo 3 Fast现已在Vertex AI上向所有人开放:Veo 3 Fast是将文本转换为视频的更快方式,从 narrated产品演示到短片。

我们的Big Sleep代理实现重大飞跃:由Google DeepMind和Google Project Zero开发的Big Sleep可以帮助安全研究人员发现零日(先前未知的)软件安全漏洞。

宣布用于在Google Cloud上扩展A2A代理的完整开发工具包:我们宣布了A2A协议0.3版本,它带来了更稳定的构建接口,对加速企业采用至关重要。

全球端点为Anthropic的Claude on Vertex AI提供改进的可用性:Anthropic在Vertex AI上的Claude模型现在通过Claude模型的全局端点提高了整体可用性。

实用资讯

收藏我们的25+生成式AI操作指南:我们收集了25多个企业生成式AI操作指南,涵盖从更快模型部署和构建多代理系统到微调、评估和RAG的所有内容。

使用BigQuery构建对话分析代理:我们发布了用于BigQuery的新第一方工具集,可与Google的代理开发套件(ADK)和开源MCP工具箱配合使用。

在Vertex AI上将开放模型从发现到端点:本指南引导您完成在Vertex AI上选择、微调、评估和部署开放模型的整个过程。

为AI工作负载启用安全启动:了解如何在Google Cloud上为GPU加速的AI工作负载启用安全启动。

六月更新

核心发布

在终端中:介绍Gemini CLI:这是一个开源AI代理,将Gemini的强大功能直接带入您的终端。

在Vertex AI中:Gemini 2.5 Flash和2.5 Pro现已稳定并正式可用:我们最智能的速度和高级推理模型现已生产就绪。

故事展开:您梦想,Veo创造:Veo 3不仅带来令人惊叹的视觉质量,现在还添加了从背景声音到对话的声音。

代理安全

随着AI从回答问题转向采取行动,保护这些自治系统至关重要。本月,我们不仅重点介绍如何构建强大的代理,还介绍如何实施安全优先的部署方法。

实用资讯

使用Vertex AI服务构建支持RAG的应用:这是一个新的架构指南,帮助理解Vertex AI和Vector Search在生成式AI应用中的作用。

创建多模态代理以处理复杂任务:通过使用Gemini、LangChain和LangGraph的新教程,Matthew和May向您展示需要做出哪些决策来组合这些工具以构建能够识别对象的多模态代理。

在Vertex AI上微调视频输入的快速指南:如果您的工作涉及内容审核、视频字幕和详细事件本地化,本指南适合您。

五月更新

主要公告

新的生成式AI媒体模型:我们推出了用于媒体的新生成式AI模型,包括用于视频的Veo 3、用于图像的Imagen 4和用于音乐的Lyria 2。

扩展Gemini 2.5 Flash和Pro模型能力:通过思想摘要,企业可以获得模型原始思想的清晰度和可审计性。

Gemini 2.5现在为所有Gemini Code Assist版本提供支持:我们还推出了Jules,一个新的自主AI编码代理,现处于公开测试阶段。

Firebase Studio:这是一个基于云的AI工作区,由Gemini 2.5提供支持,让您在几分钟内将想法转化为全栈应用。

AI应用部署更轻松:通过Cloud Run,我们推出了三个关键更新,包括从AI Studio直接部署应用到Cloud Run的单按钮点击功能。

合作伙伴与安全

推出下一代AI推理:我们通过使vLLM与Kubernetes原生分布式和分离式推理完全可扩展,使推理更轻松、更经济高效。

Mistral AI的Le Chat Enterprise和Mistral OCR 25.05模型在Google Cloud上可用

Anthropic的Claude Opus 4和Claude Sonnet 4在Vertex AI上

实用资讯

掌握生成式AI:我们推出了首个面向非技术学习者的生成式AI认证,以及一套新的免费培训来帮助您准备该认证。

将生成式AI付诸实践:我们重新设计了Vertex AI Studio,这个开发者优先的体验将成为您获取所有模态生成式AI媒体模型的来源。

新的操作指南系列:文本到SQL代理:在这个博客文章中,我们探索了Google Cloud文本到SQL代理的技术内部。

四月更新

主要公告

代理:我们最近推出的Agent2Agent(A2A)协议受到广泛关注。这个开放互操作性协议旨在使AI代理能够相互通信,无论其基础如何。

模型:本月,我们为客户宣布了六个新模型,包括在Vertex AI和Gemini应用中预览的Gemini 2.5 Pro。

安全:在我们的AI保护新闻之后,我们在Next ‘25上推出了Google统一安全,为卓越的安全成果奠定了基础。

实用资讯

Meta的Llama 4在Vertex AI上正式可用

Vertex AI仪表板:这些帮助您监控使用情况、吞吐量、延迟和排除错误,为您提供更好的可见性和控制。

Vertex AI模型优化器:此功能使用Google对Gemini的独特理解,根据您的质量、速度和成本偏好,自动将查询定向到性能最佳的模型和工具。

实时API:为实现真正的对话交互,实时API直接将流式音频和视频输入Gemini。

三月更新

主要公告

Gemini家族正在成长:我们推出了Gemini 2.5,一个旨在处理日益复杂问题的思维模型。

我们还推出了Gemma 3:这是您可以在TPU或GPU上运行的最有能力模型。

在开源世界:我们宣布Claude 3.7 Sonnet,Anthropic迄今为止最智能的模型,也是市场上第一个混合推理模型,可在Vertex AI模型园中预览。

最后,我们在安全方面迈出了一步:我们推出了AI保护,一套旨在保护跨云和模型的AI工作负载和数据的能力。

实用资讯

从基础设施角度:我们分解了AI Hypercomputer的四大顶级用例和入门方法。

说到成本:您知道企业AI的真实成本吗?企业需要优化大型AI工作负载的方法,因为这些资源仍然相当昂贵。

二月更新

主要公告

将AI带给您:本月,我们宣布了Vertex AI中的代理评估。从基础设施角度来看,我们宣布了AI Hypercomputer的新更新。

合作伙伴和开源新闻:本月,我们投资于与合作伙伴的关系。同时,我们在开源世界分享了几项重要公告。

行业新闻:Google Cloud在National Retail Federation(NRF):National Retail Federation以他们的年度NRF会议开始了这一年。

实用资讯

本月:我们分享了几种更好地实施快速发展的AI的方法,从监督微调(SFT)的综合指南,到开发人员如何帮助他们的LLM提供更准确、相关和上下文感知的响应。

我们还发布了新文档:在Vertex AI Studio中使用开放模型。模型选择不再限于Google的Gemini。现在,在编写或比较提示时,可以选择来自Anthropic、Meta等的模型。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计