在人工智能领域中,“双12”的热闹场面令人瞩目。一系列大型模型的发布,不仅让行业内专业人士充满期待,也使得各企业巨头之间的竞争愈发激烈。其中,Llama系列的最新版本70B能够在性能上与之前405B版本相提并论,而谷歌的Gemini模型也推出了新的实验版,并迅速吸引了业界关注。
Llama 3.3:70B版本逆袭405B
Llama 3.3目前只有一个版本70B,却能在多个领域如指令遵循、数学、推理等超越了夏季发布的405B版本Llama 3.1,成绩相当引人注目。在语言、代码、长文本处理及多语种能力上,同样可以与405B版本一较高下。尽管在工具应用方面,70B与405B存在一定差距,但在成本控制上,Llama 3.3无疑更为经济。在合作的平台中,3.3的价格为0.1/0.4美元每百万输入/输出Token,远低于3.1版本的1美元及1.8美元。
Llama 3.3之所以能用更低的规模实现高效表现,归功于后训练技术的应用,特别是在线偏好优化技术的使用。这一成果标志着科技的新进展,使得Llama 3.3的模型权重已在官网和Hugging Face上开放下载。
Gemini模型的周岁生日
Gemini 1206模型的上线正好也是其一周岁生日。虽然以日期命名,这更像是一次常规更新的过程。在过去表现出色的Gemini 1114版本短暂地登顶后被超越,新版本Gemini 1206再次占据了榜首,在多个单项中取得佳绩。
谷歌AI Studio产品负责人表示,Gemini 1206拥有两百万Token的上下文窗口,用户可以通过谷歌AI Studio平台以及API端免费使用该模型。而谷歌首席科学家Jeff Dean则认为,这是一个庆典的完美方式,尽管也有观点认为,o1还未出现在此榜单,而GPT-4.5即将问世,意味着谷歌的领先地位可能不会持续太久。
其他重要更新
除了谷歌和Meta的兴奋话题外,还有传言称马斯克的xAI即将发布Grok 3模型。一些人发现正在测试的Grok 2 mini不复存在,意味深长地猜测这是为了迎接Grok 3的到来。而原本付费才能使用的Grok,现在也提供给用户免费使用版,尽管免费版的使用有所限制,但已经足够引起人们的关注。Grok自己也表示计划在这个月推出Grok 3。
结语
在这个热闹非凡的十二月,众多新模型的发布让消费者和专业用户跃跃欲试。面对Llama 3.3反超405B,以及Gemini的强势表现,加之马斯克的Grok 3和GPT-4.5的期待,无疑为人工智能领域增添了更多的兴奋点。随着这些技术的进步,未来的AI应用场景将更加丰富和多变。您最期待哪一款产品的表现?我们拭目以待。