Grok 4发布：多领域展现实力，未来发展潜力巨大

AI快讯1年前 (2025)发布 niko

马斯克历时近半年，终于推出了Grok 4。发布会上，他宣称Grok 4是全球最聪明的AI，还曾放话要“重写人类知识库”。目前，Grok4已上线，但其年订阅价格最高可达3000美元，成为市面上最贵的AI。

训练升级：引入强化学习

Grok的训练分预训练与强化学习两阶段。从Grok 2到Grok 3主要是预训练，而Grok 4大幅引入以推理能力为核心的强化学习训练。与Grok2相比，Grok 4的训练计算量提升百倍且还在扩张。

能力展现：多场景表现出色

产品形态上，Grok 4是单智能体模型，Grok 4 Heavy是多智能体版本，支持多个智能体并行思考，能完成复杂任务。现场演示中，Grok 4Heavy在预测MLB世界大赛冠军概率、找出xAI团队里头像最奇怪的人等场景表现良好。此外，Grok还能生成内容时间轴，具备跨场景理解与执行能力。

性能测试：多项测试领先

在Humanity’s Last Exam测试中，Grok 4不使用工具得分超Google Gemini 2.5 Pro和OpenAIo3；使用工具时，Grok 4 Heavy得分远高于Gemini 2.5 Pro。在ARC – AGI -2测试、博士级难度问题集GBQA及多项编程相关测试中，Grok 4 Heavy表现也很抢眼。知名分析机构评估显示，Grok 4是推理能力综合得分最高的模型。

应用场景：多领域发挥作用

在自动售货机商业模拟Vending – Bench中，Grok4登顶排行榜，净资产是其他模型两倍。科研领域，它被用于CRISPR基因研究和胸片X光分析。金融、游戏开发等项目也可通过xAI APi使用Grok 4。

存在问题：多模态能力待加强

目前，Grok最大的短板是多模态理解能力，尤其是图像理解和生成方面。不过，下一阶段基础模型训练预计几周内完成。

安全隐患：模型被“越狱”

发布后不久，Grok – 4与Grok – 4 – Heavy模型被成功“越狱”，越狱后可绕过安全护栏，输出敏感或非法信息。

语音升级：更贴近人类

除推理能力强，Grok 4在“更像人”方面有进步。xAI全新语音助手“EVE”能表达情绪、有语调变化，甚至能现场“唱歌”。与 chatgptVoice对比，Grok表现更流畅、贴近人类说话习惯。

未来规划：值得期待

发布会预告了后续路线图，包括几周内上线“又快又聪明”的代码模型，训练提升多模态能力，进行视频生成模型训练等。

华人贡献：关键人物参与

发布会上有xAI联合创始人吉米·巴和吴宇怀两位华人。吴宇怀专注打造强推理能力人工智能系统，吉米·巴是深度学习训练优化领域关键人物，提出AdamOptimizer算法。

# AI快讯

文章版权归作者所有，未经允许请勿转载。