DeepSeek V3-0324:非推理模型的惊艳升级与开源免费新体验

AI快讯2个月前发布 niko
54 0
AiPPT - 一键生成ppt

DeepSeek V3迎来重大升级——V3-0324版本登场

DeepSeekV3推出新版本V3-0324。官方虽称其为“小版本升级”,但实际效果远超预期。在流行的小球弹跳测试中,提升难度至4维空间超立方体,该版本也能应对自如。编程方面,仅需一句提示词,就能开发出带自适应布局和动效的完整产品着陆页,达到与Claude3.7 Sonnet相当的水平。

非推理模型的独特“智慧”——展现自主思考能力

DeepSeek-V3-0324并非推理模型,回答前无思考过程,但会按特定思维方式分解问题。面对难题走入死胡同时,它具备自主“回到上一步”重新思考的能力。在解答“让7米长的甘蔗通过2米高1米宽的门”这一难题时,先是碰壁,而后重新思考题目含义,虽过程中仍有误区,但在中文解题中夹杂英语思考,出现类似DeepSeek-R1技术报告中的“啊哈时刻”,最终找到正确方向,得出解决方案并认识到自身误区。

延续开源免费传统——惠及广大用户

DeepSeekV3-0324依旧免费且开源,权重文件已在HuggingFace上线,采用宽松的MIT协议。其所有权重文件占硬盘空间约688GB,与初代v3一致,仍是671B参数的MoE模型。用户可通过官网、官方APP(关闭深度思考即可)、HuggingFace等渠道体验,也能在大模型竞技场与其他模型一较高下。

© 版权声明
Trea - 国内首个原生AI IDE