Magistral大语言模型发布:多语言推理与高吞吐量的新突破

AI快讯1天前发布 niko
0 0
AiPPT - 一键生成ppt

新模型登场:推理能力再升级

本周二,欧洲人工智能企业Mistral AI推出全新大语言模型系列Magistral,展现出强大的推理实力。该系列包括面向企业的MagistralMedium和24B参数的开源版Magistral Small。开源版采用Apache 2.0许可,可自由使用与商用;MagistralMedium能通过Le Chat界面和La Plateforme APi访问。

测试表现优异:多领域显身手

在基准测试里,Magistral成绩亮眼。与前身Mistral – Medium 3和DeepSeek系列对比,MagistralMedium在AIME2024测试中得分达73.6%,多数投票为64%时得分90%;MagistralSmall得分分别为70.7%和83.3%。此外,在GPQA Diamond和LiveCodeBench等高要求测试中也表现出色。MagistralMedium还展示了编程能力,一次输出代码就能模拟重力、摩擦力。

多语言推理:保持高保真度

Magistral模型擅长在多种语言中进行高保真推理,适用于英语、法语、西班牙语等多种语言。借助Le Chat中的FlashAnswers,Magistral Medium的token吞吐量比多数竞争对手多10倍,可实现大规模实时推理和用户反馈。

技术创新:自主研发流水线

Magistral应用了自主研发的可扩展强化学习流水线,采用自下而上的方法,依赖自身模型和基础设施。研究发现,基于文本的强化学习能保持甚至提升多模态理解等能力。为避免语言切换,在计算奖励时对对话进行归一化处理,并应用fastText分类器,使模型紧密跟踪用户语言。

云平台应用与成本分析

Mistral正将Magistral Medium应用于Amazon SageMaker等主流云平台,Azure AI、IBM WatsonX和GoogleCloud Marketplace也将跟进。在使用成本上,Magistral Medium定位高端,每百万输入token价格2美元,每百万输出token5美元,虽比老款上涨,但与外部竞品相比更具竞争力。

未来展望:快速迭代模型

Magistral推出后,Mistral计划从此版本开始快速迭代模型,持续提升其性能和应用范围。

© 版权声明
Trea - 国内首个原生AI IDE