IBM Granite3.2大型语言模型带来多项创新功能

AI快讯1年前 (2025)发布 niko

IBM推新语言模型 ：IBM 近期发布的 Granite3.2 大型语言模型，致力于为企业及开源社区打造 “小巧、高效、实用”的企业人工智能方案。此模型融合多模态与推理能力，提升灵活性与成本效益，促进用户采用。

视觉语言模型助力 ：Granite3.2 引入视觉语言模型（VLM），用于文档处理、数据分类与提取。在关键基准测试中，其性能达到或超越LLaMA3.211B 和 Pixtral12B 等大型模型，8B 模型在数学推理测试中也表现出色。

思维链提升推理 ：为强化推理能力，Granite3.2 部分模型配备 “思维链”功能，可阐释中间推理步骤。该功能虽需较多计算力，但用户能按需启用或禁用，以优化效率与成本。

安全模型创新 ：Granite3.2 推出 “Granite Guardian” 安全模型小型化版本，体积缩减 30% 性能依旧。同时引入“可言语化信心” 能力，能更精细评估风险，将不确定性纳入安全监测。

基于工具包训练 ：Granite3.2 在 IBM 的开源 Docling 工具包上训练，该工具包助开发者将文档转为定制企业 AI模型所需数据。训练中处理大量 PDF 文件与合成问答对，增强 VLM 处理复杂文档工作流的能力。

新预训练模型发布 ：IBM 还宣布推出下一代TinyTimeMixers（TTM）模型，这一紧凑预训练模型专注多变量时间序列预测，有长达两年的长远预测能力。

文章版权归作者所有，未经允许请勿转载。