AI21 Labs发布Jamba1.6系列:长文本处理新突破

AI快讯5小时前发布 niko
0 0
AiPPT - 一键生成ppt

Jamba1.6系列模型全新亮相 :AI21Labs不久前发布了Jamba1.6系列大型语言模型,此系列被赞誉为当下市场中处理长文本最为强大且高效的模型。相较于传统的Transformer模型,Jamba模型在应对长上下文时,展现出更快的速度与更高的质量,其推理速度比同类模型快了2.5倍,无疑是技术上的一大突破。

系列构成与商业优化 :Jamba1.6系列涵盖了Jamba Mini(12亿参数)和Jamba Large(94亿参数)。这一系列专门针对商业应用做了优化,具备函数调用、结构化输出(如JSON)以及基于现实的生成能力,应用范围广泛,无论是企业级智能助手还是学术研究领域,都能发挥重要作用。

开源许可与多语言支持 :该模型采用Jamba Open ModelLicense这一开源许可协议,遵循相关条款的用户可进行研究和商业使用。同时,Jamba1.6系列知识截止日期为2024年3月5日,支持英语、西班牙语等多种语言,充分满足全球用户需求。

性能评测表现卓越 :在性能评测环节,Jamba Large1.6在ArenaHard、CRAG和FinanceBench等多个基准测试中成绩斐然,分数超越同类竞争对手,展现出卓越的语言理解和生成能力,尤其是在长文本处理方面表现格外突出。

运行条件与强大能力:使用Jamba模型的用户需先安装相关Python库,且需要CUDA设备支持模型运行,可通过vLLM或transformers框架运行。在大规模GPU支持下,JambaLarge1.6能处理长达256K的上下文,这是先前模型难以企及的。模型链接:https://HuggingFace.co/ai21labs/AI21-Jamba-Large-1.6

© 版权声明
智谱清言 - 国产最强AI模型