谷歌云G4虚拟机正式发布:搭载NVIDIA RTX 6000 Blackwell GPU的强大计算平台

谷歌云正式发布搭载NVIDIA RTX PRO 6000 Blackwell GPU的G4虚拟机,为AI训练、数字孪生和实时渲染提供强大算力支持,支持多实例GPU分区和增强PCIe P2P通信,性能提升高达168%。

G4虚拟机正式发布:扩展我们的NVIDIA GPU产品组合,助力视觉计算和AI

强大性能满足多模态工作负载需求

当今的多模态工作负载需要强大的基于GPU的加速器、大容量GPU内存和专业图形处理能力,才能实现所需的性能和吞吐量。今天我们宣布正式推出G4虚拟机,该机型搭载NVIDIA RTX PRO 6000 Blackwell服务器版GPU。G4的加入扩展了我们全面的NVIDIA GPU产品组合,补充了A系列虚拟机的专业规模能力和G2虚拟机的成本效益。G4虚拟机现已上市,为延迟敏感或有特定监管要求的应用提供更多谷歌云区域的GPU可用性。

我们还宣布NVIDIA Omniverse作为虚拟机镜像在谷歌云市场上正式可用。在G4上运行时,利用NVIDIA Omniverse库开发和部署工业数字孪生和物理AI模拟应用比以往任何时候都更加容易。

通用GPU平台

G4虚拟机在性能上实现了巨大飞跃,吞吐量最高可达G2实例的9倍,为多模态AI推理、逼真设计和可视化,以及使用NVIDIA Omniverse开发的机器人模拟应用带来了变革性的结果提升。

AI训练、微调和推理

生成式AI加速和效率:凭借其FP4精度支持,G4的高效计算加速了大语言模型的微调和推理,让您能够创建实时生成式AI应用,如多模态和文本到图像创建模型。

多实例GPU资源优化:G4允许将单个GPU安全地划分为最多四个完全隔离的MIG实例,每个实例都有自己的高带宽内存、计算核心和专用媒体引擎。此功能通过允许多个较小的不同工作负载在保证资源、隔离和服务质量的情况下并发运行,从而实现最佳性价比。

灵活的模型容量和扩展:通过利用先进的量化技术、MIG分区和多GPU配置,可服务于从不到300亿到超过1000亿参数的各种模型。

NVIDIA Omniverse和模拟

NVIDIA Omniverse集成:选择此基础架构,使用基于物理的模拟和OpenUSD构建和连接模拟应用,实现实时交互性和AI加速数字孪生的开发。

大规模数字孪生加速:加速专有或商业计算机辅助工程和模拟软件,在复杂的数字孪生环境中运行具有数十亿单元的场景。

近实时物理分析:利用G4的并行计算能力和内存处理巨大的计算域,为高保真模拟实现近实时的计算流体动力学和复杂物理分析。

机器人开发:借助NVIDIA Isaac Sim(一个开源参考机器人模拟框架),客户现在能够在物理和虚拟环境中创建、训练和模拟AI驱动的机器人。

AI驱动的渲染、图形和虚拟工作站

AI增强的内容创建:利用神经着色器和第五代NVIDIA Tensor Core将AI直接集成到可编程渲染管道中,推动未来十年的AI增强图形创新,包括实时电影级渲染和增强的内容创建。

大规模场景处理:利用大容量内存在G4上每个GPU最高96GB,创建和渲染大型复杂3D模型和逼真可视化效果,具有惊人的细节和准确性。

虚拟工作站:为数字孪生、模拟和视觉效果工作负载提供动力。G4能力的飞跃得益于全面支持所有NVIDIA DLSS 4功能、用于视频流和转码的最新NVENC/NVDEC编码器,以及用于实时光线追踪的第四代RT Core。

谷歌云扩展NVIDIA RTX PRO 6000

现代生成式AI模型经常超过单个GPU的显存,迫使您使用多GPU配置来服务这些工作负载。虽然这种方法很常见,但性能可能会受到AI架构间通信速度的瓶颈限制。我们通过实施增强的基于PCIe的P2P数据路径,显著提升了G4虚拟机上的多GPU性能,该路径优化了关键集体操作,如All-Reduce,这对于在GPU间拆分模型至关重要。

与G4虚拟机集成的谷歌云服务

G4虚拟机与多个谷歌云服务完全集成,从第一天起就加速您的AI工作负载。

Google Kubernetes Engine:G4 GPU通过GKE正式可用。由于GKE最近将Autopilot扩展到所有符合条件的集群,包括GKE Standard集群,您可以受益于GKE的容器优化计算平台来快速扩展G4 GPU,从而优化成本。

Vertex AI:推理和训练都显著受益于G4的大GPU内存、原生FP4精度支持和全球覆盖。

Dataproc:G4虚拟机在Dataproc托管分析平台上得到完全支持,让您能够加速大规模Spark和Hadoop工作负载。

Cloud Run:我们将无服务器平台的AI基础设施选项扩展到了NVIDIA RTX PRO 6000,因此您可以使用完全托管、简单、按使用付费的GPU,使用您偏好的大语言模型执行实时AI推理或媒体渲染。

Hyperdisk ML、Managed Lustre和Cloud Storage:当您需要为HPC和大规模AI/ML工作负载扩展本地存储时,可以将G4连接到各种谷歌云存储服务。

客户反馈

“NVIDIA Omniverse与谷歌云G4虚拟机的结合是我们创意转型的真正引擎。它使我们的团队能够将数周的传统制作压缩到数小时内,让我们能够即时生成全球规模的逼真3D广告环境,同时确保像素完美的品牌合规性——这一能力重新定义了数字营销中的速度和个性化。” - WPP创意AI高级副总裁Perry Nightingale

“我们很高兴将谷歌云G4虚拟机的强大功能引入Altair One,因此您可以以推动创新进一步所需的速度、规模和视觉保真度运行最苛刻的模拟和流体动力学工作负载。” - Altair分析、HPC、IoT和数字孪生首席工程师Yeshwant Mummaneni

谷歌云优势

选择谷歌云意味着选择一个为切实结果而设计的平台。新的G4虚拟机就是一个典型例子,我们的定制P2P互连从底层NVIDIA RTX PRO 6000 Blackwell GPU中释放了高达168%的吞吐量。这种对优化性能的关注贯穿我们的全面产品组合;G4完美补充了我们现有的A系列和G2 GPU,确保您拥有适合任何工作负载的理想基础设施。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计