Grok 3发布:性能强劲,应用广泛,开源引关注

AI快讯3天前发布 niko
3 0
AiPPT - 一键生成ppt

今日,马斯克预告的人工智能模型Grok3正式亮相,其号称“地球上最聪明的人工智能”,发布会虽稍有延迟,但热度不减。直播中,马斯克与xAI团队全方位展示了Grok3的卓越性能,该模型在多项测试中表现出色,超越了谷歌、OpenAI和DeepSeek等公司的招牌模型。

Grok 3实际上是一个模型家族,包含非推理模型和推理模型。非推理模型的代表Grok 3和Grok 3 mini在多项基准测试中成绩优异,Grok3在AIME’24美国数学竞赛、GPQA和代码测试中大幅领先,Grok 3mini则可在牺牲一定准确性的前提下,实现更快回答。

推理模型Grok 3 Reasoning Beta和Grok 3 miniReasoning同样表现不俗,尽管在不加时的测试中与其他模型差距不大,但加时后优势明显,表明其思考质量可随时间提升,具有成长潜力。现场展示的Grok3推理模型在2025年AIME数学竞赛测试结果,以及生成3D动画代码和新游戏的能力,都令人印象深刻。

直播还发布了基于Grok 3构建的智能搜索引擎DeepseARCh,它能在回答问题时展示进度条和信源验证情况。Grok3的强大离不开马斯克仅用122天搭建的10万卡集群,后续扩展到20万卡集群,这体现了算力在大模型领域的重要性。

然而,Grok3也面临一些质疑。抢先体验用户分享的实际测试案例显示,其表现并非如宣传般完美,在部分测试中甚至翻车。此外,模型是否开源也备受关注,按照马斯克的说法,xAI通常在新模型发布后开源旧模型,此次可能开源的是Grok2 。

© 版权声明
智谱清言 - 国产最强AI模型