大型语言模型竞争白热化：Llama 3 70B反超405B，企业巨头争相展示实力

AI快讯2年前 (2024)发布 niko

在人工智能领域中，“双12”的热闹场面令人瞩目。一系列大型模型的发布，不仅让行业内专业人士充满期待，也使得各企业巨头之间的竞争愈发激烈。其中，Llama系列的最新版本70B能够在性能上与之前405B版本相提并论，而谷歌的Gemini模型也推出了新的实验版，并迅速吸引了业界关注。

Llama 3.3：70B版本逆袭405B

Llama 3.3目前只有一个版本70B，却能在多个领域如指令遵循、数学、推理等超越了夏季发布的405B版本Llama 3.1，成绩相当引人注目。在语言、代码、长文本处理及多语种能力上，同样可以与405B版本一较高下。尽管在工具应用方面，70B与405B存在一定差距，但在成本控制上，Llama 3.3无疑更为经济。在合作的平台中，3.3的价格为0.1/0.4美元每百万输入/输出Token，远低于3.1版本的1美元及1.8美元。
Llama 3.3之所以能用更低的规模实现高效表现，归功于后训练技术的应用，特别是在线偏好优化技术的使用。这一成果标志着科技的新进展，使得Llama 3.3的模型权重已在官网和Hugging Face上开放下载。

Gemini模型的周岁生日

Gemini 1206模型的上线正好也是其一周岁生日。虽然以日期命名，这更像是一次常规更新的过程。在过去表现出色的Gemini 1114版本短暂地登顶后被超越，新版本Gemini 1206再次占据了榜首，在多个单项中取得佳绩。
谷歌AI Studio产品负责人表示，Gemini 1206拥有两百万Token的上下文窗口，用户可以通过谷歌AI Studio平台以及API端免费使用该模型。而谷歌首席科学家Jeff Dean则认为，这是一个庆典的完美方式，尽管也有观点认为，o1还未出现在此榜单，而GPT-4.5即将问世，意味着谷歌的领先地位可能不会持续太久。

其他重要更新

除了谷歌和Meta的兴奋话题外，还有传言称马斯克的xAI即将发布Grok 3模型。一些人发现正在测试的Grok 2 mini不复存在，意味深长地猜测这是为了迎接Grok 3的到来。而原本付费才能使用的Grok，现在也提供给用户免费使用版，尽管免费版的使用有所限制，但已经足够引起人们的关注。Grok自己也表示计划在这个月推出Grok 3。

结语

在这个热闹非凡的十二月，众多新模型的发布让消费者和专业用户跃跃欲试。面对Llama 3.3反超405B，以及Gemini的强势表现，加之马斯克的Grok 3和GPT-4.5的期待，无疑为人工智能领域增添了更多的兴奋点。随着这些技术的进步，未来的AI应用场景将更加丰富和多变。您最期待哪一款产品的表现？我们拭目以待。

# AI快讯

文章版权归作者所有，未经允许请勿转载。