华为新一代昇腾芯片驱动全球最强计算集群

某中国科技巨头发布三款新一代昇腾AI芯片及超级计算集群架构,详细介绍芯片规格、互联技术和开源协议,包括FP8低精度计算、4TB/s互联带宽等核心技术参数,并对比现有全球最强计算集群性能。

芯片系列规划

该机构计划推出昇腾950、960和970三个芯片系列。昇腾950PR与950TO采用相同晶圆,新增对FP8等低精度数据格式的支持,其中950系列可提供1 PFLOP(每秒千万亿次浮点运算)的FP8算力,MXFP8模式可达2 PFLOP。芯片同时优化向量处理能力,内存访问粒度从512字节细化至128字节。

昇腾950系列互联带宽提升至2.5TB/s,较当前910C型号提升2.5倍。950PR将于2026年第一季度上市,950DT计划在2026年第四季度发布。

昇腾960预计2027年第四季度推出,计算性能、内存带宽、存储容量及互联端口数量均达到950系列的两倍,并支持自主研发的HiF4数据格式,宣称精度优于其他FP4技术。

最高端的昇腾970计划于2028年第四季度发布,目标实现4TB/s互联带宽、8 PFLOP的FP4算力及更大内存容量。

超级计算集群架构

通过NPU集群构建的SuperPoD架构将于2026年第四季度首发Atlas 950 SuperPoD,搭载昇腾950DT芯片。相比竞争对手同期发布的NVL144系统,该集群NPU数量提升56.8倍,算力增强近7倍。即便面对2027年推出的NVL576系统,Atlas 950 SuperPoD仍保持性能领先。

通用计算芯片

2026年第一季度将推出鲲鹏950处理器,提供96核/192线程和192核/384线程两种配置。同期推出基于鲲鹏950的泰山950 SuperPod,称为"全球首款通用计算SuperPoD"。

开源互联协议

新一代SuperPoD采用统一总线UnifiedBus 2.0协议,技术规范已向开发者社区开放。该协议既用于单个SuperPoD内部连接,也可互联多个SuperPoD形成SuperCluster集群。首款集群产品Atlas 950 SuperCluster的NPU数量达到当前全球最强集群的2.5倍,算力提升1.3倍。

计划2027年末推出Atlas 960 SuperCluster,集成超百万NPU,FP4算力达4 ZFLOPS(每秒10^21次浮点运算)。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计