HPE扩大与AMD合作,推进开放机架级AI技术
为“重新定义高性能计算的极限”,处理器巨头AMD宣布与HPE扩大合作,以加速开发基于AMD领先计算技术的下一代开放、可扩展人工智能基础设施。
此次合作的核心部分是,HPE将成为首批采用AMD Helios机架级AI架构的系统供应商之一。该架构将集成一个与博通合作开发的、专为Helios打造的HPE Juniper Networking纵向扩展交换机及配套软件,以实现基于以太网的无缝、高带宽连接。
Helios结合了AMD EPYC中央处理器、AMD Instinct图形处理器、AMD Pensando先进网络技术以及AMD ROCm开放软件栈,旨在提供一个为性能、效率和可扩展性优化的统一平台。AMD表示,该系统旨在简化大规模AI集群的部署,在研究、云和企业环境中实现更快的解决方案交付和更高的基础设施灵活性。
基于OCP Open Rack Wide设计,Helios旨在帮助客户和合作伙伴缩短部署时间,为苛刻的AI工作负载提供可扩展、灵活的解决方案。Helios机架级AI平台采用AMD Instinct MI455X GPU、AMD EPYC Venice CPU以及用于横向扩展网络的AMD Pensando Vulcano网络接口卡,每机架可提供高达2.9 exaFLOPS的FP4性能。这一切都通过开放的ROCm软件生态系统统一起来,据称该生态系统将为AI和高性能计算工作负载带来灵活性和创新。
AMD董事长兼首席执行官Lisa Su表示:“HPE一直是AMD杰出的长期合作伙伴。通过Helios,我们将进一步深化合作,将AMD全栈计算技术与HPE的系统创新相结合,为AI时代的客户提供一个开放的机架级AI平台,以实现前所未有的效率、可扩展性和突破性性能。”
HPE表示,此次合作使其能够为客户集成差异化技术,特别是为Helios设计的纵向扩展以太网交换机和软件。该交换机与博通合作开发,利用基于以太网的超高速加速器链路标准,为AI工作负载提供优化性能,进一步强化了AMD对开放、基于标准的技术的承诺。
HPE总裁兼首席执行官Antonio Neri表示:“十多年来,HPE和AMD不断突破超级计算的界限,交付了多个百亿亿次级系统,并倡导加速创新的开放标准。随着新的AMD‘Helios’和我们专为HPE打造的纵向扩展网络解决方案的推出,我们正在为云服务提供商客户提供更快的部署速度、更大的灵活性,并降低他们在业务中扩展AI计算规模的风险。”
HPE将于2026年在全球范围内提供AMD Helios AI机架级架构。
HPE同时透露,为德国斯图加特高性能计算中心打造的新超级计算机“Herder”将由AMD Instinct MI430X GPU和下一代AMD EPYC Venice CPU提供动力。基于HPE Cray超级计算GX5000平台构建的Herder旨在为大规模HPC和AI工作负载提供性能和效率。
HPE和AMD相信,双方各自的计算产品组合与系统设计相结合,将为欧洲研究人员和企业提供用于主权科学发现和工业创新的强大工具。Herder计划于2027年下半年交付,预计将于2027年底投入服务。
HLRS主任Michael Resch表示:“我们的科学用户群体要求我们继续支持用于数值模拟的传统HPC应用。同时,我们看到对机器学习和人工智能的兴趣日益增长。Herder的系统架构将使我们能够同时支持这两种方法,同时让我们的用户有能力开发并受益于新型混合HPC/AI工作流。这个平台不仅能让我们的用户运行更大、更强大的模拟,从而带来激动人心的科学发现,还能开发更高效的计算方法,而这些方法只有在下一代硬件提供的强大能力下才成为可能。”