阿里巴巴达摩院开源Babel多语言大型语言模型,展现卓越多语言能力

AI快讯3个月前发布 niko
29 0
AiPPT - 一键生成ppt

阿里巴巴达摩院的创新之举:开源多语言大型语言模型Babel

在当今的AI领域,不少大型语言模型对资源丰富的语言有所侧重,而众多拥有庞大用户群体的语言却被忽视。在此背景下,阿里巴巴达摩院开源的Babel多语言大型语言模型意义非凡。

Babel的语言覆盖优势

Babel支持全球使用人数最多的前25种语言,覆盖超90%世界人口。不仅如此,它还关注到斯瓦希里语、爪哇语等在开源LLM中鲜少涉及的语种,为数十亿使用者带来优质AI语言服务。

独特的层扩展技术

与传统方法不同,Babel运用独特的层扩展技术提升模型能力,以精巧方式增加“知识储备”,兼顾性能与计算效率。研究团队推出的Babel-9B专为单GPU推理和微调优化,Babel-83B作为830亿参数的模型,致力于树立开源多语言LLM新标杆。

出色的性能表现

研究团队对Babel进行严格评估,结果显示,Babel-9B和Babel-83B在多项基准测试中超越同等规模开源模型,在世界知识、推理等任务上表现优异。处理资源匮乏语言时,准确率比以往多语言LLM提升5%到10%。

强大的对话能力

经过监督微调后,Babel的聊天版本Babel-9B-Chat和Babel-83B-Chat展现强大对话能力,性能媲美顶尖商业AI模型,为开源社区注入新活力。

项目链接:https://babel-llm.github.io/babel-llm/,github链接:https://github.com/babel-llm/babel-llm

© 版权声明
Trea - 国内首个原生AI IDE