开源AI推理模型Deep Cogito v2技术解析

Deep Cogito发布第二代开源AI模型Cogito v2,采用迭代蒸馏放大技术优化推理过程,参数规模达671B的混合专家模型在保持60%更短推理链的同时,以不足350万美元成本实现接近专有系统的性能表现。

Deep Cogito v2:开源AI推理模型的技术突破

模型架构与参数规模
Cogito v2系列包含四款混合推理AI模型:两款中型模型(70B/109B参数)和两款大规模版本(405B/671B参数)。其中671B参数的混合专家模型(MoE)被誉为当前最强大的开源AI之一,性能可比肩某机构最新模型,并逐步逼近O3、Claude 4 Opus等专有系统。

核心技术创新:迭代蒸馏放大(IDA)
与传统推理时延长思考时间的方案不同,Cogito v2通过IDA技术将搜索过程中的发现蒸馏融入模型核心参数,形成更强的"直觉"能力。这种内在化推理机制使模型无需完整搜索即可预判推理结果,相比同类竞品推理链长度缩短60%。

训练成本与效率
整个模型从实验到最终训练的总成本控制在350万美元以内,远低于主流AI实验室的投入规模。旗舰版671B模型专门针对思维过程优化进行训练,避免冗余推理路径,在关键基准测试中达到或超越某机构最新版本性能。

涌现的多模态能力
未经图像专门训练的模型展现出跨模态推理能力,例如通过迁移学习对比鸭与狮子的栖息地、颜色和构成特征。该特性为未来多模态推理系统的训练数据自举提供了新思路。

开源承诺与发展规划
开发团队重申所有AI模型将保持开源,计划通过迭代自我改进持续攀登超智能技术高峰。该技术路径为开源社区提供了可替代专有系统的低成本高性能方案。

相关技术活动:阿姆斯特丹/加州/伦敦举办的AI与大数据博览会涵盖智能自动化、区块链、数字化转型及网络安全等前沿议题

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计