Grok 4发布:多领域展现实力,未来发展潜力巨大

AI快讯10小时前发布 niko
3 0
AiPPT - 一键生成ppt

马斯克历时近半年,终于推出了Grok 4。发布会上,他宣称Grok 4是全球最聪明的AI,还曾放话要“重写人类知识库”。目前,Grok4已上线,但其年订阅价格最高可达3000美元,成为市面上最贵的AI。

训练升级:引入强化学习

Grok的训练分预训练与强化学习两阶段。从Grok 2到Grok 3主要是预训练,而Grok 4大幅引入以推理能力为核心的强化学习训练。与Grok2相比,Grok 4的训练计算量提升百倍且还在扩张。

能力展现:多场景表现出色

产品形态上,Grok 4是单智能体模型,Grok 4 Heavy是多智能体版本,支持多个智能体并行思考,能完成复杂任务。现场演示中,Grok 4Heavy在预测MLB世界大赛冠军概率、找出xAI团队里头像最奇怪的人等场景表现良好。此外,Grok还能生成内容时间轴,具备跨场景理解与执行能力。

性能测试:多项测试领先

在Humanity’s Last Exam测试中,Grok 4不使用工具得分超Google Gemini 2.5 Pro和OpenAIo3;使用工具时,Grok 4 Heavy得分远高于Gemini 2.5 Pro。在ARC – AGI -2测试、博士级难度问题集GBQA及多项编程相关测试中,Grok 4 Heavy表现也很抢眼。知名分析机构评估显示,Grok 4是推理能力综合得分最高的模型。

应用场景:多领域发挥作用

在自动售货机商业模拟Vending – Bench中,Grok4登顶排行榜,净资产是其他模型两倍。科研领域,它被用于CRISPR基因研究和胸片X光分析。金融、游戏开发等项目也可通过xAI APi使用Grok 4。

存在问题:多模态能力待加强

目前,Grok最大的短板是多模态理解能力,尤其是图像理解和生成方面。不过,下一阶段基础模型训练预计几周内完成。

安全隐患:模型被“越狱”

发布后不久,Grok – 4与Grok – 4 – Heavy模型被成功“越狱”,越狱后可绕过安全护栏,输出敏感或非法信息。

语音升级:更贴近人类

除推理能力强,Grok 4在“更像人”方面有进步。xAI全新语音助手“EVE”能表达情绪、有语调变化,甚至能现场“唱歌”。与chatgptVoice对比,Grok表现更流畅、贴近人类说话习惯。

未来规划:值得期待

发布会预告了后续路线图,包括几周内上线“又快又聪明”的代码模型,训练提升多模态能力,进行视频生成模型训练等。

华人贡献:关键人物参与

发布会上有xAI联合创始人吉米·巴和吴宇怀两位华人。吴宇怀专注打造强推理能力人工智能系统,吉米·巴是深度学习训练优化领域关键人物,提出AdamOptimizer算法。

© 版权声明
Trea - 国内首个原生AI IDE