xAI的Grok-3模型在Chatbot Arena排行榜上超越GPT4.5-Preview

AI快讯1年前 (2025)发布 niko

xAI的最新力作Grok-3模型在AI领域掀起波澜 。近期，xAI发布消息，旗下的AI模型Grok-3在ChatbotArena排行榜上成绩斐然。被命名为“grok-3preview-02-24”的这款模型，展现出了卓越性能。

Grok-3优势尽显，超越gpt4.5-Preview 。在ChatbotArena排行榜上，xAI的Grok-3-Preview-02-24以1分优势战胜GPT4.5-Preview。Grok-3获得超3000票，与第一名并列。它在困难提示、编码任务等多个关键领域表现出色。要知道，ChatbotArena是通过人类偏好进行大规模语言模型评估的众包平台，采用Elo评级系统为模型排名，能全面衡量性能。

马斯克与xAI的新进展。这一成果彰显了xAI及其创始人埃隆·马斯克在AI发展领域的显著进步。马斯克一直主张开发符合人类价值观的强大AI，Grok-3在基准测试中的成功，突出了模型能力和xAI在竞争激烈的AI领域的进步。

测试阶段引发思考。值得关注的是，虽“grok-3preview-02-24”被称为最新生产模型，但其名称含“preview”，这表明它可能仍处于测试阶段，这一细节或许会引发关于其完全生产就绪性的探讨。

# AI快讯

文章版权归作者所有，未经允许请勿转载。