Replicate加入Cloudflare
立即开始免费使用 | 联系销售 | ▼
Cloudflare博客
订阅接收新文章通知:订阅
AI | 开发者 | Radar | 产品新闻 | 安全 | 政策与法律 | 零信任 | 速度与可靠性 | Cloudflare生活 | 合作伙伴
Replicate加入Cloudflare
2025-11-17
Rita Kozlov & Ben Firshman | 5分钟阅读
本文还提供以下语言版本:繁體中文、Deutsch、日本語、한국어、Español (Latinoamérica)、Nederlands和Français。
我们今天有个重大消息要分享:运行AI模型的领先平台Replicate正在加入Cloudflare。
我们最初开始与Replicate交流,是因为除了对明亮色彩搭配的热情外,我们还有很多共同点。我们为Cloudflare的Workers开发者平台设定的使命是让构建和部署全栈应用尽可能简单。与此同时,Replicate也肩负着类似的使命,即让部署AI模型变得像写一行代码那样简单。我们意识到,通过将Replicate平台直接集成到Cloudflare中,我们可以共同构建更出色的产品。
我们很高兴分享这个消息,更兴奋于这对客户意味着什么。将Replicate的工具引入Cloudflare将继续使我们的开发者平台成为互联网上构建和部署任何AI或智能工作流的最佳场所。
这对您意味着什么?
在我们花更多时间讨论AI未来之前,我们希望先回答Replicate和Cloudflare用户最关心的问题。简而言之:
对于现有Replicate用户: 您的API和工作流将继续无中断运行。您很快将受益于Cloudflare全球网络带来的额外性能和可靠性。
对于现有Workers AI用户: 准备好迎接模型目录的大规模扩展,以及直接在Workers AI上运行微调和自定义模型的新能力。
现在,让我们回到为什么我们对共同的未来如此兴奋。
AI革命没有在电视上播出,但它始于开源
在AI成为AI之前,以及成为每个对话主题之前,它几十年来一直被称为"机器学习"。这是一个专业化的、几乎是学术性的领域。进展稳定但孤立,突破发生在少数资金雄厚的大型研究实验室内。模型是整体式的,数据是专有的,工具对大多数开发者来说难以获取。当开源协作文化——这股构建了现代互联网的力量——与机器学习碰撞时,一切都改变了,研究人员和公司开始不仅发表论文,还发布他们的模型权重和代码。
这引发了一场令人难以置信的创新爆炸。仅过去几年的变化速度就令人震惊;18个月前(有时感觉就像几天前)还是最先进的技术,现在已成为基准线。这种加速在生成式AI中最为明显。我们几乎在一眨眼之间就从诡异的模糊奇观发展到逼真的图像生成。像Stable Diffusion这样的开源模型为开发者释放了即时创造力,而这仅仅是个开始。如果您今天查看Replicate的模型目录,您会看到几乎各种风格的数千个图像模型,每个都在前一个基础上迭代。这不仅发生在图像模型上,还发生在视频、音频、语言模型等领域……
但这种令人难以置信的、社区驱动的进展带来了一个巨大的实际挑战:您如何实际运行这些模型?每个新模型都有不同的依赖关系,需要特定的GPU硬件(以及足够的数量),并且需要复杂的基础设施来扩展。开发者发现自己花费更多时间与CUDA驱动程序和requirements.txt文件斗争,而不是实际构建应用程序。
这正是Replicate解决的问题。他们构建了一个平台,抽象了所有这些复杂性(使用他们的开源工具Cog将模型打包成标准、可复现的容器),让任何开发者或数据科学家都能通过简单的API调用运行即使是最复杂的开源模型。
今天,Replicate的目录涵盖超过50,000个开源模型和微调模型。虽然开源释放了如此多的可能性,但Replicate的工具集更进一步,让开发者能够在一个地方访问他们需要的任何模型。通过他们的市场,他们还通过相同的统一API提供对领先专有模型(如GPT-5和Claude Sonnet)的无缝访问。
值得注意的是,Replicate不仅构建了一个推理服务;他们还构建了一个社区。如此多的创新是通过受他人所做工作的启发、迭代并改进而发生的。Replicate已成为开发者在公共游乐场中发现、分享、微调和试验最新模型的权威中心。
强强联合:AI目录遇见AI云
回到Workers平台使命:我们的目标一直是让开发者能够构建全栈应用,而不必为基础设施所累。虽然这一点没有改变,但AI已经改变了应用的需求。
开发者正在构建的应用类型正在发生变化——三年前,没有人构建智能体或创建AI生成的发布视频。今天他们正在这样做。因此,他们对云或AI云的需求和期望也发生了变化。
为了满足开发者的需求,Cloudflare一直在构建AI云的基础支柱,旨在靠近用户的边缘运行推理。这不仅仅是一个产品,而是整个技术栈:
- Workers AI: 在我们全球网络上的无服务器GPU推理
- AI Gateway: 用于缓存、速率限制和观察任何AI API的控制平面
- 数据栈: 包括Vectorize(我们的向量数据库)和R2(用于模型和数据存储)
- 编排: 如AI搜索(前身为Autorag)、智能体和工作流等工具,用于构建复杂的多步骤应用
- 基础: 全部构建在我们核心开发者平台Workers、Durable Objects和我们其他技术栈之上
在我们帮助开发者扩展应用的同时,Replicate也肩负着类似的使命——让部署AI模型变得像部署代码一样简单。这就是一切汇聚的地方。Replicate带来了行业最大、最活跃的模型目录和开发者社区之一。Cloudflare带来了极其高性能的全球网络和无服务器推理平台。 together,我们可以提供两全其美的方案:最全面的模型选择,可在快速、可靠且价格合理的推理平台上运行。
我们的共同愿景
对于社区:AI探索的中心
分享模型、发布微调、收集星标和在游乐场中实验的能力是Replicate社区的核心。我们将继续投资和发展这一平台,使其成为AI发现和实验的首选目的地,现在通过Cloudflare的全球网络增强,为每个人提供更快、响应更迅速的体验。
推理的未来:一个平台,所有模型
我们的愿景是将两个平台的最佳部分结合在一起。我们将把整个Replicate目录——所有50,000多个模型和微调——带到Workers AI。这给您提供了最终选择:在Replicate的灵活环境或Cloudflare的无服务器平台上运行模型,全部从一个地方访问。
但我们不仅仅是在扩展目录。我们很高兴地宣布,我们将借助Replicate的深厚专业知识,将微调能力引入Workers AI。我们还在使Workers AI比以往更加灵活。很快,您将能够将自己的自定义模型带到我们的网络。我们将利用Replicate在Cog方面的专业知识,使这个过程无缝、可复现且简单。
AI云:不仅仅是推理
运行模型只是拼图的一部分。当您将AI连接到整个应用程序时,真正的魔力才会发生。想象一下,当Replicate的大规模目录与整个Cloudflare开发者平台深度集成时,您可以构建什么:运行模型并将结果直接存储在R2或Vectorize中;从Worker或Queue触发推理;使用Durable Objects管理AI智能体的状态;或使用WebRTC和WebSockets构建实时生成UI。
为了管理所有这些,我们将把我们的统一推理平台与AI Gateway深度集成,为您提供一个单一的控制平面,用于跨所有模型的可观测性、提示管理、A/B测试和成本分析,无论这些模型是在Cloudflare、Replicate还是任何其他提供商上运行。
欢迎加入团队!
我们非常兴奋地欢迎Replicate团队加入Cloudflare。他们对开发者社区的热情和AI生态系统的专业知识是无与伦比的。我们迫不及待地想共同构建AI的未来。
Cloudflare的连接云保护整个企业网络,帮助客户高效构建互联网规模的应用,加速任何网站或互联网应用,抵御DDoS攻击,阻止黑客入侵,并可以帮助您开启零信任之旅。
从任何设备访问1.1.1.1,开始使用我们的免费应用,使您的互联网更快更安全。
要了解更多关于我们帮助构建更好互联网的使命,请从这里开始。如果您正在寻找新的职业方向,请查看我们的空缺职位。