智谱AI今日正式发布新一代旗舰模型GLM-4.5,这是一款专为智能体应用打造的基础模型,现已在Hugging Face与ModelScope平台同步开源,模型权重遵循MIT License开源协议。开源SOTA性能,国产模型领跑GLM-4.5在包含推理、代码、智能体的综合能力方面达到开源SOTA水平,在真实代码智能体的人工对比评测中实测表现为国内最佳。 通过对12个最具代表性的评测基准进行综合评估,包括MMLU Pro、AIME24、MATH500、SciCode等权威测试,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的优异成绩。原生融合三大核心能力GLM-4.5首次在单个模型中实现推理、编码和智能体能力的原生融合,满足智能体应用的复杂需求。 这一技术突破体现了智谱AI对AGI第一性原理的完整呈现:在不损失原有能力的前提下融合更多通用智能能力。高参数效率的MoE架构GLM-4.5采用混合专家(MoE)架构,提供两个版本:GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿。值得注意的是,GLM-4.5参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,但在多项标准基准测试中表现更为出色,在SWE-bench Verified榜单上位于性能/参数比帕累托前沿。 双模式设计与训练流程模型支持两种运行模式:用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式。
训练流程包括在15万亿token通用数据上的预训练,随后在代码、推理、智能体等领域8万亿token数据上进行针对性训练,最后通过强化学习进一步增强模型能力。极致性价比突破行业定价GLM-4.5系列在成本和效率上实现重大突破,API调用价格远低于主流模型:输入仅需0.8元/百万tokens,输出2元/百万tokens。高速版本实测生成速度最高可达100tokens/秒,支持低延迟、高并发的实际部署需求。 |