智谱开源多款GLM模型,推理速度与价格优势凸显

AI快讯18分钟前发布 niko
0 0
AiPPT - 一键生成ppt

智谱在模型领域又有新动作,一次性上线并开源了三大类最新的GLM模型,按模型大小可细分为六款。

  • GLM-Z1-Rumination沉思模型,为应对复杂问题提供新思路。
  • GLM-Z1-Air推理模型,在推理任务上表现卓越。
  • GLM-4-Air-0414基座模型,是一系列应用的坚实基础。

其中,推理模型GLM-Z1-32B-0414性能出众,与顶尖模型媲美,推理速度可达200tokens/秒,是国内商业模型中速度最快的,且高性价比版本价格仅为DeepSeek-R1的1/30。

这些开源模型均采用宽松的MIT许可协议,可免费用于商业用途、自由分发,为开发者提供了广阔空间。

在性能方面,不同模型各有亮点。GLM-4-32B-0414基于大量数据预训练,在多个应用场景表现出色,部分指标达到或超越更大规模模型。GLM-Z1-32B-0414专为深度推理优化,在复杂任务上表现卓越。GLM-Z1-9B-0414虽规模较小,但在数学推理等方面性能超越参数规模。沉思模型GLM-Z1-Rumination-32B-0414采用全新工作范式,在复杂认知任务上优势明显。

价格上,基座、推理两类模型已上线智谱MaaS开放平台,提供多种版本满足不同需求,有免费版和高性价比版等。

此外,智谱还拿下顶级域名Z.ai,上线多款模型,展现出其在大模型时代的强劲发展势头。

© 版权声明
Trea - 国内首个原生AI IDE