融资进展
专注于开发美国本土AI推理硬件与软件的Positron AI,已完成5160万美元超额认购的A轮融资,使年度总融资额超过7500万美元。本轮融资由Valor Equity Partners、Atreides Management和DFJ Growth领投,Flume Ventures、Resilience Reserve、1517 Fund及Unless跟投。
技术部署
资金将用于部署首款产品Atlas,并加速2026年第二代产品的推出。面对全球科技公司预计在2025年投入超过3200亿美元建设AI基础设施的趋势,企业正面临成本压力、功耗限制及某机构GPU短缺的挑战。
性能优势
Atlas宣称相比某机构H100芯片可实现每美元3.5倍性能提升和最高66%的功耗降低。该产品专为增强生成式AI应用设计,通过每瓦特产生3倍于现有GPU的token数量,显著提升数据中心收益潜力。
架构创新
采用内存优化FPGA架构,实现93%带宽利用率(远超GPU系统10-30%的典型值),单个2千瓦服务器支持最高5000亿参数模型。兼容Hugging Face transformer模型,并通过OpenAI API兼容端点处理推理请求。
应用场景
基于美国本土芯片的Atlas已应用于LLM托管、生成式智能体和企业协作者系统,提供更低延迟和更少硬件需求。首席执行官Mitesh Agrawal表示:“高度优化的硅晶与内存架构支持在单系统运行超智能模型,目标实现每系统160亿参数模型处理能力。”
未来规划
获得A轮融资后,公司正推进下一代前沿模型推理系统Titan的开发。作为Atlas的继任者,Titan采用自研’Asimov’芯片,每个加速器支持最高2TB高速内存,可处理160亿参数模型并显著扩展最大模型的上下文限制。