英伟达豪赌英特尔:CPU-GPU融合架构将如何重塑AI计算格局

英伟达向英特尔投资50亿美元并达成战略合作,双方将共同开发集成CPU-GPU的AI芯片。这项合作通过NVLink技术实现1.8TB/s带宽,显著提升AI工作负载性能,但同时也带来供应商锁定、迁移成本等挑战。

执行摘要

英特尔-英伟达合作可能通过更深层次的CPU-GPU集成重塑AI基础设施,为企业AI和数据中心工作负载带来显著的性能和效率提升。战略风险依然存在,包括供应商锁定、执行延迟和监管审查。CIO和IT领导者应密切关注英特尔-英伟达的技术路线图,早期采用者可能获得优势,而后期采用者可能在AI性能和成本效率方面落后。

背景介绍

几十年来,英特尔一直被视为具有影响力的主导芯片制造商。然而,英特尔的兴衰是一段错失机遇的时间线,特别是在生成式AI这一新兴领域。另一方面,英伟达一直朝着与英特尔相反的方向发展,成为推动AI进步的主导且有影响力的硅供应商。近年来,这两家供应商经常被定位为竞争对手,尽管它们也在有限范围内进行过合作。这种情况在2025年9月18日发生变化,英伟达宣布向英特尔投资50亿美元,并达成战略合作,共同开发AI和数据中心芯片。

市场反应立竿见影。这笔交易使英特尔股价上涨超过23%,同时为这家芯片制造商提供了来自AI领导者的资本和认可。

这对AI/计算格局的改变

CPU-GPU集成革命

合作的技术基础集中在将英伟达的NVLink互连技术与英特尔的x86 CPU集成。NVLink 5.0为每个GPU提供1.8 TB/s的带宽,比PCI Express连接提高了14倍。这消除了限制AI工作负载性能的数据传输瓶颈。

“NVLink设计得比PCI Express更适合CPU和GPU通信,特别是针对新英特尔和英伟达交易针对的特定高性能计算和AI工作负载,“Gartner副总裁分析师Gaurav Gupta告诉Informa TechTarget。“合作将把英伟达的NVLink技术直接集成到定制设计的英特尔CPU中,实现一类克服PCIe总线限制的新超级芯片。”

Gupta补充说,这种组合可以提供更低的延迟、更高的带宽和缓存一致性。

推理与训练工作负载影响

AI工作负载有两种核心类型——训练和推理。随着AI更广泛使用,推理正日益成为生产部署的主导类型。对于推理工作负载,需求转向效率、延迟和成本优化。集成芯片针对这些注重效率的工作负载,而传统的离散解决方案在这些方面效率不高。

供应商格局变化

由于英特尔-英伟达合作,供应商格局面临直接颠覆。

“这种合作使它们能更好地对抗AMD,后者集成自己的CPU和GPU,“Gupta指出。“AMD在CPU和GPU两方面都面临压力,而像Cerebras这样的定制硅供应商则面对强化的x86+GPU联盟。”

Moor Insights and Strategy首席分析师Anshel Sag也认为英特尔将从竞争对手中受益。

“我认为这给英特尔一个真正机会夺回一些被AMD和Arm夺取的市场份额,同时可能帮助其保留现有客户,“Sag告诉Informa TechTarget。

Forrester高级分析师Alvin Nguyen看到了更广泛的市场影响。

“可以预期英特尔x86 CPU和英伟达GPU在消费级和数据中心市场更紧密集成。这使得这些产品可能对AMD CPU和GPU组合更具竞争力,因此预计这将长期影响CPU、GPU和APU市场空间,“Nguyen说。

合作的另一个潜在影响是针对云提供商。例如,AWS拥有自己的Graviton CPU和Trainium加速器,而谷歌有自己的TPU产品。

“超大规模企业可能积极看待这种合作,因为它拓宽了它们的架构选择,“Constellation Research首席分析师Ray Wang说。“如今英伟达机架严重偏向基于ARM的Grace CPU;通过将英特尔x86加入组合,超大规模企业可以在x86或基于ARM的AI服务器之间选择,而无需改变以英伟达为中心的GPU策略。”

监管和地缘政治风险

AI能力的集中可能引发监管担忧,影响可用性和定价。然而,这种合作支持美国半导体独立性,并遵循特朗普政府关于更多美国本土制造的整体方向。

成本和投资回报考虑

虽然合作仍处于早期阶段,但有一些初步的成本和投资回报考虑。

  • 新硬件成本:集成CPU-GPU系统通常比离散解决方案价格更高,但提供的效率改进可以抵消更高成本。通过架构优化,功耗往往下降,直接影响数据中心开支和AI总拥有成本。

  • 生命周期和总拥有成本:更紧密集成也使混合匹配组件更加困难。长期TCO计算必须考虑供应商锁定的影响。虽然集成解决方案可能降低复杂性和支持成本,但它们限制了竞争替代选择和价格谈判。

竞争和战略定位

审视英特尔-英伟达合作的竞争和战略定位可能性,揭示了一些关键见解。

差异化机会

早期投资新架构的组织可能在基于AI的服务、机器学习推理和边缘计算方面获得性能和成本优势。

“联盟扩大了企业选择,而不是限制它,“Constellation Research首席分析师Ray Wang解释。“企业现在有更清晰的路径在标准化AI服务器配置中组合英特尔CPU与英伟达GPU,同时仍保留基于ARM的Grace选项。”

Wang补充说,双轨模式为CIO和采购团队在构建计算能力时,在工作负载、价格/性能层级和软件堆栈方面提供更广泛的灵活性。

延迟采用的风险

随着时间的推移,延迟采用的潜在风险显著增长。随着集成系统成熟,依赖PCIe架构的组织可能面临性能劣势。带宽差异(1.8 TB/s vs. 128 GB/s)创造了无法通过软件优化弥合的能力差距。

合作和供应链风险

英特尔在英伟达集成路线图中的核心作用为供应链创造了机遇和风险。

“主要风险是增加对英伟达生态系统的依赖,现在这种依赖扩展到ARM和x86 CPU环境,“Wang说。“这加深了围绕英伟达NVLink Fusion、CUDA软件和以GPU为中心的机架设计的供应商锁定。”

运营和组织影响

合作可能对以下领域产生一系列运营和组织影响。

DevOps/MLOps调整

团队需要重大调整以有效使用NVLink和集成架构。所需更改包括:

  • 性能调优:集成CPU-GPU系统的新优化方法
  • 驱动程序管理:NVLink特定软件堆栈的更新程序
  • 监控工具:集成组件性能的增强可见性
  • 团队培训:集成架构管理的技能发展

工作负载评估和迁移

公司必须重新审视现有工作负载,识别集成效益并制定迁移策略:

  • 应用审计:全面评估AI工作负载的集成潜力
  • 性能基准测试:在真实环境中验证理论效益的测试
  • 迁移规划:优先处理高影响应用的分阶段方法
  • 资源分配:系统升级的预算和时间规划

安全和兼容性挑战

新CPU设计和互连引入新的攻击面和兼容性考虑:

  • 安全协议:集成系统漏洞的更新程序
  • 固件管理:跨集成组件的更复杂更新过程
  • 驱动程序兼容性:确保跨集成架构的软件堆栈兼容性
  • 合规验证:使用新硬件配置满足监管要求

风险和挑战

英特尔-英伟达合作存在几个风险和挑战。

供应商锁定代表最重大的长期风险。专有NVLink互连与x86架构的组合创造了显著的转换成本,并限制了未来的供应商谈判。

转换成本超出硬件更换,包括应用移植、员工培训和基础设施修改。与传统服务器更新不同,集成架构需要全面的系统更换,与离散组件升级相比,可能使迁移费用翻倍。

不确定的性能提升与期望是另一个核心关注点,特别是在时间线方面。

“我认为我们仍然没有具体时间框架,我们必须谨慎对待英特尔路线图中较远的产品是否具有竞争力,“Sag说。“最终,英特尔仍然必须提供有竞争力的产品,使NVLink或GPU芯片产品具有吸引力。”

Gupta呼应了这些担忧。

“英特尔的挑战将是交付PC产品,在那里它们利用封装技术将其SoC与英伟达的GPU芯片集成,“Gupta说。“大问题将是这些PC如何品牌化;它们仍将以英特尔品牌销售,还是英伟达将获得关注?”

Gupta还指出,英特尔需要确保定制x86 CPU的及时交付,以匹配英伟达加速和激进的路线图,这可能是一个挑战。

“英特尔近年来一直在努力跟上时间线,“Gupta说。

需要关注的指标和指标

对于CIO和业务领导者,随着英特尔-英伟达合作展开,有几个关键领域需要监控和关注。

一个关键领域是目标市场。

“我认为看看哪些产品线获得英伟达IP以及它们可能瞄准哪些市场会很有趣,“Sag说。“我可以看到它们共同进军像5G/6G AI RAN这样的市场,因为英特尔在那里有丰富经验,但这也是英伟达的一个大增长领域。”

Forrester分析师Alvin Nguyen表示,在未来12到24个月内,IT高管应关注以下方面:

  • 更多NVLink采用——这可能延迟UALink采用
  • 带有嵌入英特尔CPU的英伟达GPU的英伟达或英特尔APU/SoC
  • 英伟达GPU与英特尔CPU的基准测试,与AMD CPU-GPU组合比较

“如果它们能在优化发生前使英特尔和英伟达产品组合与AMD竞争,那将是营销福音,“Nguyen说。

Nguyen还质疑英特尔GPU和AI加速器工作的未来,包括其Battlemage和Gaudi硅。“不确定这对Battlemage和Gaudi产品线意味着什么,但预计它们将来不会相关,“Nguyen说。“这将损害市场,因为选择更少,特别是在消费级领域,随着GPU市场一直专注于更有利可图的数据中心产品,游戏玩家已经看到更少选择。”

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计