阿里巴巴达摩院的创新之举:开源多语言大型语言模型Babel
在当今的AI领域,不少大型语言模型对资源丰富的语言有所侧重,而众多拥有庞大用户群体的语言却被忽视。在此背景下,阿里巴巴达摩院开源的Babel多语言大型语言模型意义非凡。
Babel的语言覆盖优势
Babel支持全球使用人数最多的前25种语言,覆盖超90%世界人口。不仅如此,它还关注到斯瓦希里语、爪哇语等在开源LLM中鲜少涉及的语种,为数十亿使用者带来优质AI语言服务。
独特的层扩展技术
与传统方法不同,Babel运用独特的层扩展技术提升模型能力,以精巧方式增加“知识储备”,兼顾性能与计算效率。研究团队推出的Babel-9B专为单GPU推理和微调优化,Babel-83B作为830亿参数的模型,致力于树立开源多语言LLM新标杆。
出色的性能表现
研究团队对Babel进行严格评估,结果显示,Babel-9B和Babel-83B在多项基准测试中超越同等规模开源模型,在世界知识、推理等任务上表现优异。处理资源匮乏语言时,准确率比以往多语言LLM提升5%到10%。
强大的对话能力
经过监督微调后,Babel的聊天版本Babel-9B-Chat和Babel-83B-Chat展现强大对话能力,性能媲美顶尖商业AI模型,为开源社区注入新活力。
项目链接:https://babel-llm.github.io/babel-llm/,github链接:https://github.com/babel-llm/babel-llm
© 版权声明
文章版权归作者所有,未经允许请勿转载。