DeepSeek V3小版本升级,V3-0324带来开源新体验

AI快讯3周前发布 niko
0 0
AiPPT - 一键生成ppt

DeepSeek V3小版本升级,亮点颇多

24日夜间,DeepSeek在用户群发布消息,其V3模型完成小版本升级,新版为DeepSeek-V3-0324。用户可前往官方网页、APP、小程序试用(关闭深度思考),且APi接口和使用方式不变。

升级特性显著,开源优势突出

V3-0324有两大惊艳特征,700GB以及MIT许可证,这意味着实现了MaC部署优化与开源。据文档显示,此版本重点提升了数学和编程能力,能力接近Claude3.7 Sonnet,却能无限制免费提供,对于常被Claude封号的用户而言是一大利好。

模型参数微调,功能有所优化

回顾V3版本,它是专家混合 (MoE) 巨头,参数为671B 。新发布的V3-0324模型参数略有放大,为685B。不仅训练数据更新,V3文档也有重要变动,优化了Function call,此前版本调用有问题,现在已支持调用函数。

实际应用出色,能力全面提升

国外网友评价,Deepseek V3更新后,让Anthropic有了竞争对手。在官网关闭深度思考按钮可体验新版能力,其前端编程能力更强,接近Claude3.7sonnet,上下文理解能力更精准。有用户测试生成能力,在特定提示词下,不同模型呈现不同理解。V3-0324在前端编程上表现出色,短时间完成电商网站代码编写,且具备多种实用效果。在数学能力测试中,也答对了年初大模型还会做错的小学生数学题。

开源意义重大,影响行业格局

V3-0324彻底支持MIT协议,更加开源。PerplexityCEO阿拉文德认为,DeepSeek的出现对AI巨头融资及创业企业都有重要影响。国外网友提到,DeepSeek正在实现Meta承诺做到的事。同时,蚂蚁集团用芯片训练AI模型,降低开发成本,当下是令人振奋的时代。

© 版权声明
Trea - 国内首个原生AI IDE