微软测试微流体冷却技术为下一代AI芯片散热

微软宣布在芯片冷却技术上取得突破,成功测试了微流体冷却方法。该方法通过在硅芯片背面蚀刻微通道,让冷却液直接流过芯片热点区域,散热效果比传统冷板技术提升三倍,有望解决AI芯片功率密度增加带来的散热瓶颈。

微软宣布在一种新的芯片冷却方法上取得进展,这可能有助于解决扩展AI基础设施时面临的最大瓶颈之一:散热问题。该公司的研究人员已成功演示了芯片内微流体冷却技术,这是一种将冷却液直接引导到硅芯片背面蚀刻沟槽中的系统。

数据中心中的传统冷却方法(如冷板)通过多个材料层传递热量来散热。这个过程限制了可以有效管理的热量。随着AI芯片功率密度增加,这些限制正更快地被触及。据微软称,以前可以用冷板处理的工作负载可能很快会超出其热容量。

微流体技术采用了不同的方法。通过直接在硅片中蚀刻微通道(每个通道宽度约为人发粗细),冷却液可以在芯片内部流过热点区域。早期的实验室规模测试显示,在某些工作负载下,这种设计的散热效果比冷板高出三倍。微软还报告称GPU最大温升降低了65%。

这项研究仍处于实验阶段,但研究人员认为该技术具有实际应用意义。它可以使数据中心实现更高密度的服务器配置,减少冷却液体所需的能量,并在无需过度配置基础设施的情况下扩展芯片的性能上限。由于AI工作负载经常出现不可预测的峰值,冷却效率也可能使受控的超频更加可行。

该系统的工程设计已被证明是复杂的。通道必须足够深以循环冷却液而不堵塞,但又不能太深以致损害硅的结构完整性。微软在一年内制作了多个设计迭代,并与瑞士初创公司Corintis合作优化通道模式。其中一些设计灵感来自树叶和蝴蝶翅膀中的天然脉络结构,这些结构可以实现更高效的流体分布。

微流体技术还需要防漏封装系统、稳定的冷却液配方以及与芯片制造工艺的兼容性。在实验室之外,与全规模数据中心系统的集成将是一个重大挑战。

业界已经注意到更广泛的影响。PTC的高级分析师Sanil S.分享道:

除了冷却效果的提升,这还可能带来效率和可持续性效益:冷却过程中的能量浪费减少,可能提高电源使用效率,并减轻对电力基础设施的压力。

微软尚未设定部署时间表,但该公司确认正在测试将微流体冷却技术纳入其内部芯片未来版本的方法,并正在探索与制造公司的合作伙伴关系。

目前,这些测试展示了一条潜在的未来路径,因为AI芯片设计继续变得更强大且对散热要求更高。微流体技术是否会成为数据中心标准将取决于其可制造性、长期可靠性以及在大规模应用中的成本效益。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计