芯片系列规划
该机构计划推出昇腾950、960和970三个芯片系列。昇腾950PR与950TO采用相同晶圆,新增对FP8等低精度数据格式的支持,其中950系列可提供1 PFLOP(每秒千万亿次浮点运算)的FP8算力,MXFP8模式可达2 PFLOP。芯片同时优化向量处理能力,内存访问粒度从512字节细化至128字节。
昇腾950系列互联带宽提升至2.5TB/s,较当前910C型号提升2.5倍。950PR将于2026年第一季度上市,950DT计划在2026年第四季度发布。
昇腾960预计2027年第四季度推出,计算性能、内存带宽、存储容量及互联端口数量均达到950系列的两倍,并支持自主研发的HiF4数据格式,宣称精度优于其他FP4技术。
最高端的昇腾970计划于2028年第四季度发布,目标实现4TB/s互联带宽、8 PFLOP的FP4算力及更大内存容量。
超级计算集群架构
通过NPU集群构建的SuperPoD架构将于2026年第四季度首发Atlas 950 SuperPoD,搭载昇腾950DT芯片。相比竞争对手同期发布的NVL144系统,该集群NPU数量提升56.8倍,算力增强近7倍。即便面对2027年推出的NVL576系统,Atlas 950 SuperPoD仍保持性能领先。
通用计算芯片
2026年第一季度将推出鲲鹏950处理器,提供96核/192线程和192核/384线程两种配置。同期推出基于鲲鹏950的泰山950 SuperPod,称为"全球首款通用计算SuperPoD"。
开源互联协议
新一代SuperPoD采用统一总线UnifiedBus 2.0协议,技术规范已向开发者社区开放。该协议既用于单个SuperPoD内部连接,也可互联多个SuperPoD形成SuperCluster集群。首款集群产品Atlas 950 SuperCluster的NPU数量达到当前全球最强集群的2.5倍,算力提升1.3倍。
计划2027年末推出Atlas 960 SuperCluster,集成超百万NPU,FP4算力达4 ZFLOPS(每秒10^21次浮点运算)。