GLM-4.5发布：强化推理、编程与智能体能力

GLM-4.5发布：强化推理、编程与智能体能力

Zhipu AI发布GLM-4.5系列模型，采用混合专家架构与双模态设计，在编程、推理和智能体任务中表现优异。该模型在12项基准测试中综合排名第三，编程任务成功率超过90%。

架构与技术亮点

双模态设计：支持"思考模式"（复杂推理/工具调用）和"快速响应模式"，平衡精度与速度
混合专家架构：GLM-4.5含3550亿总参数（激活320亿），轻量版GLM-4.5-Air含1060亿总参数（激活120亿）
关键技术：
- 每层96个注意力头
- QK-Norm标准化
- 分组查询注意力机制
- 多令牌预测
- Muon优化器加速收敛

训练与性能

训练数据：2200万亿token语料（含700万亿代码/推理专用数据）
强化学习：采用Slime RL异步智能体训练框架，支持长周期任务
基准表现：
- SWE-bench Verified：64.2%
- TerminalBench：37.5%
- 工具调用成功率：90.6%（超越Claude-4-Sonnet等竞品）

部署与应用

支持通过Z.ai平台直接访问或API调用
模型权重已发布在Hugging Face/ModelScope
兼容vLLM和SGLang推理框架

comments powered by Disqus