2月18日午间,马斯克旗下xAI公司正式亮相新一代大模型Grok 3。为展现其实力,马斯克将Grok3与DeepSeek、Gemini、chatgpt等大模型展开对比测试,结果显示,Grok3在数学、科学、编程等推理能力方面拔得头筹,在其他领域也表现卓越。

从性能层面看,Grok 3实力强劲。它不仅能够简单检索答案,更具备强大的推理能力,同时在计算资源使用上更加灵活高效。
不少人将Grok 3的性能与DeepSeek作比较,实则这种对比较为片面。实际上,Grok3与DeepSeek处于不同赛道,并非直接竞争对手,其对手仍是闭源高性能大模型,比如ChatGPT。
一方面,马斯克投入20万张高性能显卡,才促成Grok3诞生,走的是高成本创造高性能路线;而DeepSeek主打性价比,以低成本创造高效益。另一方面,Grok 3目前是闭源大模型,马斯克表示几个月后待Grok3成熟稳定,会开源Grok 2,Grok 3可能要到Grok 4发布时才开源;DeepSeek则凭借开源迅速走红,激活AI生态圈。此外,Grok3的体验受限,目前仅X的Premium+订阅用户可率先体验,高级功能收费颇高,SuperGrok高级订阅计划月费30美元,年费300美元,提供额外推理、深度搜索功能及无限量图像生成服务。美区账号已更新,英区、欧洲账号2月28日更新。可见,走“小而精”路线的Grok3与DeepSeek的“平民化”路线不同。

Grok 3的另一竞争对手是搜索引擎。其加持的DeepSeARCh自称下一代搜索引擎,能像AIAgent(智能体)一样理解用户提问意图,无需用户花费时间进行Google搜索、消化和总结,即“Agent十分钟,抵人类Google一小时”。
发布会上,马斯克展示了Grok3预测NCAA(疯狂三月)胜负数,这是巴菲特2014年发起的高额赌注活动,此前无人成功预测,此展示赚足眼球。发布会尾声,马斯克放出一段无机器感的男声,透露语音助手布局,预计一周内发布语音模式早期版本。

当下,擅长文字生成的大模型,如Grok3、DeepSeek、ChatGPT等,都在争夺下一个超级搜索入口,这让百度、谷歌等搜索引擎倍感压力。李彦宏推翻“闭源论”,宣布6月30日全面开源,并在百度搜索全量上线DeepSeek满血版。尽管百度搜索PC端未接入,但百度App已在“AI+”搜索入口接入DeepSeek,测试显示,DeepSeek生成的答案观点鲜明、思考有深度,而百度AI搜索仅为资讯总结。
从xAI工程师透露的信息可知,Grok 3仅在xAI内部运行2周。这反映出DeepSeek掀起的AI浪潮,让大模型成为行业重点项目,马斯克也不例外。
实际上,Grok 3对马斯克打造的生态意义重大,社交平台、自动驾驶等业务场景与大模型相互促进。与OpenAI相比,xAI的变现路径更丰富,Grok3可绑定X的社交生态,通过个性化内容创作、自动化营销方案等变现;OpenAI则主要依靠会员订阅和调取APi服务收费。
在数据方面,特斯拉拥有庞大的自动驾驶视觉数据,能为大模型提供多模态数据,助力生成强大的“自动驾驶大脑”,提升自动驾驶的环境感知、路径规划和决策能力。此外,马斯克布局的人形机器人Optimus搭载大模型,具备通往具身智能的潜力。

马斯克为大模型准备了社交平台、新能源汽车、人形机器人、脑机接口等丰富的落地场景,同时,这些领域的数据又为大模型提供充足养分。再加上Dojo超算平台,可降低其他场景的AI研发成本。场景、数据、算力三位一体,自我打通生态闭环,这正是马斯克做大模型的厉害之处,也是国内互联网大厂所担忧的。