OpenAI开源模型
先进的开放权重推理模型,可针对任何用例进行定制并在任何地方运行。
在Hugging Face下载 | 在GitHub查看 | 试用模型
模型系列
gpt-oss-120b
大型开放模型,设计用于数据中心及高端台式机和笔记本电脑运行。 开始构建
技术指标:
- 推理性能:-0.70
- 代码理解:0.65
- 多语言支持:0.39
- 数学推理:0.42
- 安全系数:-0.81
gpt-oss-20b
中型开放模型,可在大多数台式机和笔记本电脑上运行。 开始构建
技术指标与120b版本保持一致。
技术特性
宽松许可证
模型采用Apache 2.0许可证支持,可自由构建而无需担心著作权限制或专利风险——无论是实验、定制还是商业部署。
智能体任务设计
在思维链中利用强大的指令跟随和工具使用能力,包括网络搜索和Python代码执行。
深度定制化
支持低、中、高三个级别的推理力度调整,并通过全参数微调使模型适配特定用例。
完整思维链访问
可访问完整思维链过程,便于调试并提高模型输出的可信度。
交互演示
我们构建了简单的演示平台,开发者可在浏览器中试用两款模型。 立即体验
模型性能
测试项目 | gpt-oss-120b | gpt-oss-20b | OpenAI o3 | OpenAI o4-mini |
---|---|---|---|---|
推理与知识 | ||||
MMLU | 90.0 | 85.3 | 93.4 | 93.0 |
GPQA Diamond | 80.1 | 71.5 | 83.3 | 81.4 |
Humanity’s Last Exam | 19.0 | 17.3 | 24.9 | 17.7 |
数学竞赛 | ||||
AIME 2024 | 96.6 | 96.0 | 95.2 | 98.7 |
AIME 2025 | 97.9 | 98.7 | 98.4 | 99.5 |
开源模型安全标准推进
安全基础
每个模型都完成了严格的安全培训和评估,帮助开发者保障用户安全。
全面安全测试
我们根据预备框架对恶意微调版本的gpt-oss-120b进行了严格测试,发现其无法达到高能力水平。这些培训和测试方法经过外部安全专家评审,标志着开源模型安全标准的重大进步。
合作伙伴
我们正与领先的部署和硬件公司合作,向开源社区提供这些模型。
部署合作伙伴 | 硬件合作伙伴 |
---|---|
多家行业领导者 | 顶级硬件制造商 |