Zhipu AI发布GLM-4.5系列模型,采用混合专家架构与双模态设计,在编程、推理和智能体任务中表现优异。该模型在12项基准测试中综合排名第三,编程任务成功率超过90%。
架构与技术亮点
- 双模态设计:支持"思考模式"(复杂推理/工具调用)和"快速响应模式",平衡精度与速度
- 混合专家架构:GLM-4.5含3550亿总参数(激活320亿),轻量版GLM-4.5-Air含1060亿总参数(激活120亿)
- 关键技术:
- 每层96个注意力头
- QK-Norm标准化
- 分组查询注意力机制
- 多令牌预测
- Muon优化器加速收敛
训练与性能
- 训练数据:2200万亿token语料(含700万亿代码/推理专用数据)
- 强化学习:采用Slime RL异步智能体训练框架,支持长周期任务
- 基准表现:
- SWE-bench Verified:64.2%
- TerminalBench:37.5%
- 工具调用成功率:90.6%(超越Claude-4-Sonnet等竞品)
部署与应用
- 支持通过Z.ai平台直接访问或API调用
- 模型权重已发布在Hugging Face/ModelScope
- 兼容vLLM和SGLang推理框架