当AI泡沫破灭,软件将如何拯救英伟达
目前,英伟达的收入主要由硬件销售主导。但当AI泡沫不可避免地破灭时,这家GPU巨头将在一夜之间成为世界上最重要的软件公司。
自2022年底ChatGPT引发AI军备竞赛以来,英伟达已售出数百万颗GPU,主要用于AI训练和推理。当音乐停止,金融从业者们痛苦地意识到,用快速贬值的资产作为数十亿美元贷款的抵押品毕竟不是个好主意时,将会有大量芯片闲置。
然而,任何认为这些GPU最终会变得一文不值的人都是天真的。
时至今日,GPU虽然已成为AI的代名词,但它们的用途远比这广泛。需要提醒的是,GPU代表图形处理单元。这些芯片最初是为了加速视频游戏渲染而设计的,因为在90年代末,单线程CPU的计算能力已难以应对日益复杂的图形渲染需求。
事实证明,使GPU擅长处理像素的特性,也使其特别适合其他并行工作负载——比如模拟氢弹爆炸的物理过程。英伟达许多最强大的加速器——如H200或GB300——早已抛弃了图形流水线,以便为高性能计算(HPC)和AI所需的更多矢量和矩阵数学加速器腾出空间。
如果一个应用程序可以并行化,那么它很可能受益于GPU加速——前提是你有相应的软件。这就是为什么GPU公司如此之少。GPU需要广泛可编程;而AI专用集成电路(ASIC)只需要擅长推理或训练。
CUDA-X:购买GPU的诸多理由
自2007年推出其底层GPU编程环境和API接口CUDA以来,英伟达已经构建了数百个软件库、框架和微服务,以加速它能想到的任何工作负载。
这些库以CUDA-X的名义统一营销,涵盖了从计算流体动力学、电子设计自动化到药物发现、计算光刻、材料设计,甚至量子计算等一切领域。该公司还拥有用于可视化数字孪生和机器人的框架。
目前,AI已被证明是其中最赚钱的应用,但当炒作热潮退去,硬件仍有大量用武之地。
例如,英伟达构建了cuDF并将其集成到流行的RAPIDS数据科学和分析框架中,以加速SQL数据库或Pandas,在此过程中实现了高达150倍的加速。难怪数据库巨头甲骨文对英伟达的硬件如此热衷。任何它无法出租给OpenAI牟利的算力,都可以用来加速自己的数据库和分析平台。
英伟达并不提供完整的解决方案,这是有意为之。它的一些库是开源的,而另一些则以更全面的框架和微服务形式提供。这些构成了软件开发者可以用来加速其工作负载的基础模块,并且越来越多地与产生收入的许可计划绑定。
唯一的问题是:到目前为止,要获得这些好处,需要购买或租赁昂贵的GPU,然后将这些框架集成到您的代码库中,或者等待独立软件供应商(ISV)为您完成。
但当泡沫破裂,GPU价格暴跌时,任何能为这些闲置资产找到用途的人都将赚大钱。英伟达已经构建了必要的软件——ISV只需要集成并销售它。
在这种背景下,英伟达从构建面向开发者的底层软件库,稳步转向销售面向企业的微服务,开始变得非常有意义。采用门槛越低,销售硬件和随附订阅服务就越容易。
英伟达甚至可能将其软件栈开放给更广泛的硬件供应商生态系统。这家GPU巨头已开始向解耦架构过渡,将工作负载分解并卸载到第三方芯片上。
本周,英伟达完成了对英特尔的50亿美元投资。这家x86巨头目前正在开发一种预填充加速器,以加快大语言模型推理中的提示处理。与此同时,英伟达上周签署协议,以“收购式招聘”的方式吸纳竞争对手芯片供应商Groq,不过这家GPU厂商打算如何长期整合该公司的技术还有待观察。
除了自研的软件平台,英伟达在过去几年还进行了多项战略性软件收购,包括在2024年收购了Run:AI基于Kubernetes的GPU编排平台和Deci AI的模型优化平台。本月早些,英伟达又增加了SchedMD的Slurm工作负载管理平台,该平台广泛部署在基于AMD、英伟达和英特尔的HPC和AI集群上,确保即使你不购买其硬件,它也能获利。
生成式AI将长期存在
需要明确的是,我们今天所知的生成式AI不会消失。过去三年推动AI发展的资金可能会蒸发,但其底层技术,尽管不完美,仍然具有足够的价值,企业将继续使用它。
与其追逐通用人工智能(AGI)的海市蜃楼,该技术的应用将变得平凡得多。
事实上,英伟达许多更全面的微服务都广泛使用特定领域的AI模型,用于天气预报或物理模拟等任务。
当互联网泡沫破裂时,人们并没有停止构建网络服务或购买交换机和路由器。这一次,人们也不会停止消费AI服务。它们只是购买GPU的众多理由之一。