随着生成式AI和智能体AI的快速普及,市场对AI基础设施以及能够交付完整AI生命周期的丰富生态系统的需求急剧增长。在此背景下,一类新型的AI云服务提供商——通常被称为“新云”——应运而生。它们作为敏捷且技术成熟的参与者,正在构建高度专业化的AI云服务,以满足新的市场需求。在思科,我们致力于与广泛的生态系统参与者合作,这既包括传统的超大规模云厂商,也包括这些新兴的新云提供商和基础模型构建者,还包括通过提供AI托管、安全的泛在连接以及可信的基础设施与数据服务来增强AI云服务的通信服务提供商、托管服务提供商和主权云提供商。
AI基础设施市场:蓬勃发展的前沿
对AI基础设施的需求正在呈指数级增长。预计2025年至2030年这五年间,全球数据中心IT设备总支出将高达4.7万亿美元。这涵盖了服务器、加速器、网络、光模块和存储。据估计,目前超大规模云厂商负责超过60%的基础设施投资,而新云则负责约17%,预计未来十年这一比例将增长至30%以上。随着推理和智能体AI、主权云以及边缘AI日益成为主流,其他生态系统成员和企业自身也将承担越来越多的AI基础设施建设份额。根据麦肯锡的数据,到2030年,对AI数据中心容量的需求将占总数据中心需求的70%,并成为日益增长的基础设施缺口的主要驱动力。新云正迅速行动以填补这一缺口,并大力推动新的商业模式和技术创新,专注于其AI云服务产品的就绪性、韧性、差异化与盈利能力。
AI云服务的三种模式
新云提供商并非单一形态。他们利用各种商业模式来提供满足不同用例和垂直行业的AI基础设施服务。消费模式正在迅速变化,从裸机服务到全栈硬件和软件,再到“即服务”产品。我们可以将交付和消费模式分为多种方式,以反映企业对可扩展性、灵活性、成本、性能和数据主权的多样化需求。各个提供商正在选择最符合其业务优先级和客户需求的模式。
目前已经出现了三种主要模式:
专用的云端AI IaaS:在此模式下,企业承诺在固定期限内使用新云数据中心内的专用AI基础设施。这种方法的优势包括保证的容量、更好的性能隔离,并且与按需定价相比通常能显著节省成本。它最适合可预测且长期运行的AI工作负载,例如大规模模型训练或持续推理任务,也适合那些有持续AI资源需求或需要独占计算资源的组织。
公共AI云服务:在此模式下,新云使企业客户能够访问共享的AI优化计算资源池,例如GPU和张量处理单元。客户只需为他们消耗的资源付费,无需长期承诺。这种“按需付费”的方式提供了最大的灵活性和可扩展性,非常适合实验性工作负载、开发、测试或需求不稳定的突发性AI任务。
混合与边缘AI IaaS:此模式将AI基础设施的部署和管理扩展到公共云环境、本地或托管数据中心以及边缘位置的组合。它将AI计算带到更靠近数据生成或消费的位置,满足低延迟处理、数据主权和法规遵从性等需求。此模式对于需要实时决策的客户特别有益,例如工业物联网、自动驾驶汽车或本地化分析。
新云可依靠思科获得AI基础设施支持的七大理由
无论采用何种服务模式,新云提供商都需要一个稳健、可扩展且安全的基础。许多提供商发现,思科提供了成功所需的合作伙伴专注力、全面的产品组合和前瞻性愿景。以下是选择与思科合作的七大关键优势:
全面的内部AI基础设施产品组合:思科在数据中心内部和数据中心之间提供最广泛的自主研发AI基础设施产品组合。这包括集成的全栈安全AI工厂解决方案、AI优化的计算、AI网络、光模块和数据中心互连解决方案,以及面向AI的安全和可观测性。为新云带来的好处包括架构灵活性、简化的采购流程、一致的操作与支持,以及高度稳健的供应链。
架构与操作灵活性:借助思科,新云提供商可以灵活选择最适合其技术要求的参考架构和操作环境。无论他们希望遵循NVIDIA企业参考架构、NVIDIA云合作伙伴参考架构、思科云参考架构,还是希望构建自己的架构——我们都提供必要的灵活性和经过验证的设计,以加速部署。
业界领先的AI网络架构:思科AI网络在数据中心内部提供可扩展的前端和后端架构,并在数据中心之间提供互连和横向扩展网络。新云可以选择经过验证的思科NX-OS以获得操作一致性,或选择SONiC以适应开放网络标准。
与NVIDIA的扩展合作伙伴关系:我们与NVIDIA的扩展合作实现了NVIDIA Spectrum-X技术与基于思科Silicon One的交换机以及采用NVIDIA Spectrum-X以太网交换芯片的思科N9100系列交换机的集成——所有这些都在Nexus操作模型下统一,以便与思科Nexus仪表板无缝集成。Nexus已在许多新云的前端计算网络中得到应用,广为人知。
强大且多样化的合作伙伴生态系统:思科与广泛的生态系统伙伴合作,以交付最佳的解决方案和价值。这包括计算和加速器合作伙伴,如NVIDIA、AMD和Intel;存储合作伙伴;软件合作伙伴;液冷合作伙伴;系统集成商等等。
端到端安全性与可观测性:安全性和可靠性是企业部署AI时最关心的问题。思科安全AI工厂与NVIDIA合作提供了全栈解决方案,安全被集成在每一层。借助Splunk,思科提供“面向AI的可观测性”,对环境中的每一层(包括GPU基础设施、生成式AI、大语言模型输出和AI应用程序)提供深度可见性。思科为AI部署提供了无与伦比的安全性和可观测性,帮助新云保护其基础设施和数据。
基于思科Silicon One的统一芯片架构:思科Silicon One是一种开创性的交换和路由芯片架构。这一单一架构是广泛的网络基础,从后端和前端AI网络到横向扩展网络、数据中心互连、广域网和边缘网络。它为AI架构提供了先进的拥塞控制和负载均衡,并且可编程以支持新兴标准。
携手思科共建AI云服务的未来
思科在支持新云提供商满足其所有服务模式的AI基础设施需求方面具有独特的优势。通过提供从思科Silicon One和基于NVIDIA Spectrum-X芯片的交换技术,到思科UCS计算,再到集成的安全与可观测性堆栈的尖端技术,思科使新云能够以速度、可靠性和效率交付可扩展的AI服务。
随着市场持续演进,思科凭借其专业知识、市场进入支持和解决方案,帮助新云加速服务上线时间、最大化GPU集群效率,并最终在蓬勃发展的AI生态系统中确立其基础性角色。