神秘steve模型现身,DeepSeek-R2再度延期引关注

AI快讯2天前发布 niko
6 0
AiPPT - 一键生成ppt

神秘stEVE模型引发多方猜测

近期,大模型竞技场秘密上线了名为steve的神秘模型。在公开页面难觅其踪,但前端代码能发现痕迹。网友通过对话得知它来自DeepSeek,知识截止时间为2023年10月。在表现方面,steve通过了“数r”等智力测试,不过也有题目答错。与V3对比代码编写,V3输出约800行,steve仅约300行。对于steve的身份,有人认为是R2、V4或旧版本升级,但也有人觉得其表现欠佳,可能不是R2,甚至可能是用DeepSeek蒸馏出的第三方模型。

DeepSeek-R2再度延期背后原因

上周有消息称,DeepSeek-R2再度延期。TheInformation爆料是因为CEO梁文锋对其表现不满,还有国内知情人士表示研发缓慢或因缺少英伟达H20芯片。实际上,人们对R2的期待已久。去年12月DeepSeek发布V3模型,今年3月升级。此前人们推测可用V3- 0324训练R2,且按R1发布节奏预测4月上线。4月底还疯传R2泄露参数,而DeepSeek最近更新是端午节前的新版R1——DeepSeek – R1- 0528。究竟何时能迎来R2,仍需等待。

© 版权声明
Trea - 国内首个原生AI IDE