DeepSeek-V3新版上线:参数微调、性能提升与开源协议更新

AI快讯2个月前发布 niko
13 0
AiPPT - 一键生成ppt

DeepSeek-V3新版上线,带来多方面更新

3月24日晚间,DeepSeek在开源平台推出升级后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324。模型参数从6710亿增长到6850亿,虽增幅不大,但也体现了技术的演进。同时,该模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一变化赋予开发者更多自主权,允许模型蒸馏、商用等行为。

性能提升显著,多领域表现出色

众多体验者反馈,升级后的DeepSeek-V3在代码和数学等方面性能提升明显。一位海外AI博主表示,它在代码领域已能与AnthroPic的ClaudeSonnet3.5竞争。在智东西的测试中,DeepSeek-V3在网站开发和UI设计方面进步巨大。输入特定提示词后,它在2分钟内交付了一个400多行代码、设计精良的网站,采用多种先进设计元素,还具备响应式设计。相比之下,旧版在相同指令下表现较弱。

数学与文科能力改进,呈现新特点

在数学问题上,曾难倒旧版的题目,新版输出的token明显更长,虽答案仍错,但会进行一定反思并修改解题过程。文科类问题方面,新版回答更加全面,采用结构化模式,补充更多背景信息,生成速度也较理想。部分网友总结,新版DeepSeek-V3像是V3与R1的结合体,更倾向用长输出解决问题。

引发期待,未来版本可期

DeepSeek-V3新版的发布,让网友对R2和V4充满期待。随着技术的不断发展,DeepSeek后续版本将带来哪些惊喜,值得关注。

© 版权声明
Trea - 国内首个原生AI IDE