DeepSeek-V3-0324 神秘亮相,引发AI领域震动 2025年3月24日,中国人工智能研究机构DeepSeek在HuggingFace平台低调发布旗舰语言模型的最新版本——DeepSeek-V3-0324 。此次发布毫无预告,如一颗投入技术社区的石子,迅速激起千层浪。
685亿参数巨兽,架构调整引猜测 DeepSeek向来作风低调。当日清晨,新模型在HuggingFace悄然上线,无官方公告与新闻发布会。新版本参数量达685亿,较去年12月发布的DeepSeek-V3的671亿有所增加,这一变化引发对潜在架构调整的诸多猜测。虽官方未披露详细技术参数,却已让社区为之兴奋。多方消息称,DeepSeek仅通过群组消息通知升级,模型在HuggingFace开源供免费下载,且第三方平台快速提供APi支持,彰显社区强大响应能力。
性能大幅飞跃,数学编程能力提升此次更新核心亮点是性能提升。虽公司定位为“小版本更新”,但初步测试表明,模型在数学能力和前端设计方面进步明显。多位评测者称其编程能力大幅提升,接近Claude3.5水平,还有评测者分享生成的样例图像,效果“相当不错”。此外,新模型或带来更人性化对话体验,不过因官方未发布基准测试数据,这些评估尚待验证 。
开源新姿态,MIT协议促发展与之前版本不同,DeepSeek-V3-0324采用更为宽松的MIT开源协议,这一改变获广泛认可。技术评论者指出,模型不仅编程能力增强,开源协议也更开放。685亿参数的模型在开源平台提供,体现DeepSeek对开源社区愈发开放的态度。HuggingFace评论区反响热烈,因其开源与性能提升优势,该模型被视为潜在行业变革者,或挑战闭源模型地位。
优化用户体验,无缝切换受好评DeepSeek此次更新优化了用户体验。用户在官网关闭“深度思考”功能,就能直接使用V3-0324版本,API接口和使用方法不变。这种无缝切换设计降低使用门槛,获社区好评。同时,第三方平台提供API访问,展现生态系统快速适应能力。
未来展望,或是R2前奏虽此次更新为“小版本升级”,但影响超预期。技术社区猜测这是否为即将推出的DeepSeek-R2做准备。此前,DeepSeek的R1模型在逻辑推理和数学任务上与OpenAI的o1模型竞争,V3-0324的发布或为下一代推理模型积累技术基础。虽DeepSeek未确认R2发布日期,但社区期待不断升温。
低调中强势崛起,AI格局或生变DeepSeek-V3-0324的发布延续该公司低调风格却表现出色。从685亿参数规模,到性能提升,再到开源策略,为AI领域注入新活力。开发者和研究人员已迫不及待投入测试,随着更多评测结果出炉,它能否撼动现有AI格局值得关注,而DeepSeek也正稳步迈进全球AI竞赛。