OpenAI开源模型:高性能AI推理架构与定制化解决方案

本文详细介绍OpenAI推出的gpt-oss-120b和gpt-oss-20b两款开源模型的技术特性,包括支持Apache 2.0许可证、完整思维链访问、智能体任务设计、多层级推理调整以及本地部署方案,涵盖模型性能基准测试和安全评估框架。

OpenAI开源模型

先进的开放权重推理模型,可针对任何用例进行定制并在任何地方运行。

在Hugging Face下载 | 在GitHub查看 | 试用模型

模型系列

gpt-oss-120b

大型开放模型,设计用于数据中心及高端台式机和笔记本电脑运行。 开始构建

技术指标:

  • 推理性能:-0.70
  • 代码理解:0.65
  • 多语言支持:0.39
  • 数学推理:0.42
  • 安全系数:-0.81

gpt-oss-20b

中型开放模型,可在大多数台式机和笔记本电脑上运行。 开始构建

技术指标与120b版本保持一致。

技术特性

宽松许可证

模型采用Apache 2.0许可证支持,可自由构建而无需担心著作权限制或专利风险——无论是实验、定制还是商业部署。

智能体任务设计

在思维链中利用强大的指令跟随和工具使用能力,包括网络搜索和Python代码执行。

深度定制化

支持低、中、高三个级别的推理力度调整,并通过全参数微调使模型适配特定用例。

完整思维链访问

可访问完整思维链过程,便于调试并提高模型输出的可信度。

交互演示

我们构建了简单的演示平台,开发者可在浏览器中试用两款模型。 立即体验

模型性能

测试项目 gpt-oss-120b gpt-oss-20b OpenAI o3 OpenAI o4-mini
推理与知识
MMLU 90.0 85.3 93.4 93.0
GPQA Diamond 80.1 71.5 83.3 81.4
Humanity’s Last Exam 19.0 17.3 24.9 17.7
数学竞赛
AIME 2024 96.6 96.0 95.2 98.7
AIME 2025 97.9 98.7 98.4 99.5

开源模型安全标准推进

阅读我们的模型系统卡片

安全基础

每个模型都完成了严格的安全培训和评估,帮助开发者保障用户安全。

全面安全测试

我们根据预备框架对恶意微调版本的gpt-oss-120b进行了严格测试,发现其无法达到高能力水平。这些培训和测试方法经过外部安全专家评审,标志着开源模型安全标准的重大进步。

合作伙伴

我们正与领先的部署和硬件公司合作,向开源社区提供这些模型。

部署合作伙伴 硬件合作伙伴
多家行业领导者 顶级硬件制造商

资源中心

反馈征集

提交反馈


comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计