DeepSeek V3-0324模型更新:推理与前端能力提升,代码能力比肩Claude 3.7 Sonnet

AI快讯2个月前发布 niko
2 0
AiPPT - 一键生成ppt

DeepSeek迎来重要更新,V3-0324模型亮相。就在前一晚,其悄然在HuggingFace上发布该模型。V3-0324模型参数达6850亿,与上一版本V3的6710亿相差无几,采用MoE架构,还遵循更开放的MIT开源协议。

从官方版本说明来看,V3-0324着重强化了推理能力与前端开发能力,写作风格与R1保持一致,还有其他方面的细微优化。如今,在DeepSeek官网关闭深度思考模式,即可直接使用V3-0324。

尽管V3-0324只是V3的小版本升级,并非众人期待的V4或R2,官方账号也未发布相关信息,但它一上线便备受关注。在国外大模型竞技场KCORES的测评里,V3-0324的代码能力得分328.3,超越普通版Claude3.7 Sonnet的322.3分,接近Claude 3.7Sonnet思维链版本的334.8分,排名第三。且排名靠前的模型中,开源免费的寥寥无几,V3-0324优势尽显。

上线不到一天,众多用户就对V3-0324展开测评。在小球弹跳测试中,V3-0324与o3-mini、R1对比,表现最佳。有用户称赞其“表现得像唯一排名第一的非推理模型”。让V3-0324生成网页,它能一气呵成写出800多行正确代码,在评论区,仅需简单指令就能生成完整登录页面,编码能力可与Claude3.7 Sonnet一较高下。

不过,实际测试中V3-0324并非全胜。在世超的测试里,让模型做画板,Claude 3.7Sonnet凭借取色器等优势胜出,V3-0324的UI设计不尽人意。但在小球弹跳测试中,V3-0324表现出色,老版本V3未能运行,Claude 3.7Sonnet的小球出现出画面问题。生成Saas登录页面时,V3-0324比V3更美观。

综合而言,V3-0324的代码能力较V3有显著提升,部分测试中可与Claude 3.7Sonnet比肩,但完全超越还有距离。值得一提的是,V3-0324在开源领域实力强劲,DeepSeek的APi价格便宜,与Claude 3.7Sonnet相比,价差最多达18倍。今晚,DeepSeek官方介绍此次更新,在数学、代码类评测上,V3-0324胜过GPT-4.5。按照发布节奏,R2可能也即将到来。在DeepSeek的开源攻势下,“OpenAI们”面临挑战。

© 版权声明
Trea - 国内首个原生AI IDE