IBM推新语言模型 :IBM 近期发布的 Granite3.2 大型语言模型,致力于为企业及开源社区打造 “小巧、高效、实用”的企业人工智能方案。此模型融合多模态与推理能力,提升灵活性与成本效益,促进用户采用。
视觉语言模型助力 :Granite3.2 引入视觉语言模型(VLM),用于文档处理、数据分类与提取。在关键基准测试中,其性能达到或超越LLaMA3.211B 和 Pixtral12B 等大型模型,8B 模型在数学推理测试中也表现出色。
思维链提升推理 :为强化推理能力,Granite3.2 部分模型配备 “思维链”功能,可阐释中间推理步骤。该功能虽需较多计算力,但用户能按需启用或禁用,以优化效率与成本。
安全模型创新 :Granite3.2 推出 “Granite Guardian” 安全模型小型化版本,体积缩减 30% 性能依旧。同时引入“可言语化信心” 能力,能更精细评估风险,将不确定性纳入安全监测。
基于工具包训练 :Granite3.2 在 IBM 的开源 Docling 工具包上训练,该工具包助开发者将文档转为定制企业 AI模型所需数据。训练中处理大量 PDF 文件与合成问答对,增强 VLM 处理复杂文档工作流的能力。
新预训练模型发布 :IBM 还宣布推出下一代TinyTimeMixers(TTM)模型,这一紧凑预训练模型专注多变量时间序列预测,有长达两年的长远预测能力。
© 版权声明
文章版权归作者所有,未经允许请勿转载。