开源模型新突破:DeepSeek-V3-0324惊艳亮相
近日,一款参数仅660B的开源模型DeepSeek-V3-0324引发全球网友关注。它在数学和编程性能上,成功超越了GPT-4.5和Claude3.7,其新版本发布令全球为之疯狂,推理能力提升近20%,且模型权重已全面开源。
性能全面提升,多领域表现卓越
在性能方面,DeepSeek-V3-0324全面超越Claude3.7。新版借鉴DeepSeek-R1中的强化学习技术,在数学、代码类评测集上超越GPT-4.5。推理能力上,相较于第一代V3,基准测试准确率大幅提升,如MMLU-Pro从75.9提升到81.2 ,GPQA从59.1提升到68.4等。
前端开发任务中,该模型生成代码可用性更高,网页和游戏前端界面更美观,执行效率也得到提升。中文写作任务基于R1优化,中长篇文本创作风格和质量提升,多轮交互式内容重写、翻译质量和信函写作等方面均有改进。中文搜索场景下,对报告分析能力增强,输出更详实准确,排版清晰。此外,APi函数调用准确性提高,修复之前V3版本问题。
国外网友积极体验,好评不断
国外网友对DeepSeek-V3-0324热情高涨。网友「Haider」称赞其编程能力,称新更新远超预期,是最强大的完全免费AI。他用新模型构建的「声波可视化器」游戏效果惊人。@BrainYoung也利用其改进制作了酷炫的three.js游戏。
官方使用指南,助力用户体验
官方在网页和应用中,使用带有特定日期的统一系统提示词。模型温度参数T_model在网页和应用环境中设为0.3,还设置API温度T_api映射机制,将输入的API温度1.0自动调整为模型最优温度0.3。DeepSeek-V3-0324模型结构与DeepSeek-V3相同,支持函数调用、JSON输出和FIM完成等功能。