DeepSeek-V3-0324 带来多能力升级与融合新思路

AI快讯1年前 (2025)发布 niko

DeepSeek-V3-0324 发布，多领域能力升级3月24日，DeepSeek在HuggingFace上低调推出V3的“小版本”迭代“DeepSeek-V3-0324”，引发开发者社区关注。次日晚，官方发布报告，指出该版本在多个关键能力上有显著突破。

推理能力显著提升 新版V3模型在百科知识（MMLU-Pro，GPQA）、数学（MATH-500，AIME2024）和代码任务（LiveCodeBench）等方面表现出色，在相关评测集中取得超越GPT-4.5、Claude-Sonnet-3.7的成绩，使V3系列具备强力推理能力，用户可依任务难度选择模型，优化算力资源利用。

前端开发能力突出DeepSeek-V3-0324在前端开发场景表现亮眼，代码稳定性和准确性提升。有开发者测试生成800行代码无一错误，在前端视觉设计上接近顶级模型，能根据简单提示生成优质数字营销页面，官方报告也展示了其前端代码能力。

中文能力全面增强新版本V3在中文能力上明显进步，特别是中长篇文本创作质量更高、结构更完整、逻辑更严密。在联网搜索场景下，报告生成能力也显著提升，能从网络信息提取关键内容，生成详实准确且排版精美的报告。

开源策略持续友好DeepSeek在开源方面保持透明度和友好性。V3-0324作为小版本更新，私有化部署只需更新少量文件，现有用户升级成本低，几乎可无缝迁移。模型参数约660B，开源版本上下文长度为128K，采用MIT许可证。

模型融合与发展路线此次更新展示了DeepSeek将V系列和R系列融合成新模型的路线，采用与V3相同base模型，改进后训练方法，借鉴R1的强化学习技术，验证和公示了纯RL路线，为行业提供开源的高效迭代思路。

# AI快讯

文章版权归作者所有，未经允许请勿转载。