GPT-4.5模型发布六小时登顶后迅速被超越OpenAI推出的GPT-4.5模型在发布后的短短六小时内,便在人工智能竞技场上崭露头角,荣登全任务分类榜首。然而好景不长,马斯克旗下xAI的Grok-3模型后来居上,成功反超,成为新的总榜第一名。
xAI Grok-3凭借特定任务优势实现逆转投票数据显示,GPT-4.5与Grok-3都获得了超过3000票,最终总分以1412对1411,Grok-3仅以一分之差险胜。原来,Grok-3在“带风格控制”和“困难提示词”这两个特定任务上,展现出比GPT-4.5更出色的能力,从而在总分上实现反超。
“六小时逆转”源于投票门槛巧合对于此次“六小时逆转”,不少用户心存疑虑。业内人士解释,竞争榜单设有投票门槛,只有在同一时间内票数达到3000票的模型才有资格上榜。这两款新发布的模型同时达标,实属巧合。
GPT-4.5高情商获认可尽管GPT-4.5刚发布时负面评价不少,但随着时间推移,用户对其高情商的认可度显著提升。OpenAI首席执行官萨姆・奥尔特曼分享了与GPT-4.5的对话,称首次收到用户请求承诺不再下架该模型。
GPT-4.5在“大模型狼人杀”中表现优异此外,GPT-4.5在一场类似“大模型狼人杀”的另类竞赛中,在合作、欺骗及策略制定等方面展现出超越人类的能力。各大AI模型在比赛中进行辩论、制定策略和投票,最终由被淘汰成员组成的陪审团决定胜者。
人工智能竞争激烈,未来充满变数这一系列事件表明,人工智能领域竞争日益激烈,各大模型在不同领域不断创新发展。未来谁能在这场智能竞赛中笑到最后,值得持续关注。
© 版权声明
文章版权归作者所有,未经允许请勿转载。