GLM-4.5发布:强化推理、编程与智能体能力

Zhipu AI发布GLM-4.5系列模型,采用混合专家架构与双模态设计,在编程、推理和智能体任务中表现优异。该模型在12项基准测试中综合排名第三,编程任务成功率超过90%。

架构与技术亮点

  • 双模态设计:支持"思考模式"(复杂推理/工具调用)和"快速响应模式",平衡精度与速度
  • 混合专家架构:GLM-4.5含3550亿总参数(激活320亿),轻量版GLM-4.5-Air含1060亿总参数(激活120亿)
  • 关键技术
    • 每层96个注意力头
    • QK-Norm标准化
    • 分组查询注意力机制
    • 多令牌预测
    • Muon优化器加速收敛

训练与性能

  • 训练数据:2200万亿token语料(含700万亿代码/推理专用数据)
  • 强化学习:采用Slime RL异步智能体训练框架,支持长周期任务
  • 基准表现
    • SWE-bench Verified:64.2%
    • TerminalBench:37.5%
    • 工具调用成功率:90.6%(超越Claude-4-Sonnet等竞品)

部署与应用

  • 支持通过Z.ai平台直接访问或API调用
  • 模型权重已发布在Hugging Face/ModelScope
  • 兼容vLLM和SGLang推理框架
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计