DeepSeek-V3-0324 模型横空出世 :昨晚,DeepSeek 悄然发布 DeepSeek-V3-0324模型,虽官方称其为“小版本迭代”,但实际表现却给业界带来巨大惊喜。
多领域能力显著提升 :该模型在代码生成、前端开发等方面进步明显,在大模型竞技场测试 KCORES 中,代码能力得分 328.3 分,超越普通版Claude 3.7 Sonnet,直逼其思维链版本。在 Aider LLM Leaderboard排行榜的多语言基准测试中,DeepSeek-V3-0324 得分 55%,在非思考/推理模型中排名第二。
高性价比优势凸显 :测试显示,在表现良好的模型里,DeepSeek-V3-0324 成本最低,仅约为 R1 的 1/5。Claude Sonnet3.7 ThINKing 的花费是它的 33 倍,o1 更是其 167 倍。
参数架构与开源特性 :DeepSeek-V3-0324 包含 685B 参数,采用 MoE 架构,激活参数 370 亿。它支持 4-bit 量化,在512GB M3 Ultra Mac 上运行速度达 20+ token/s,磁盘占用 352GB。模型采用 MIT 许可,比上一版 V3 更开放。
实际应用效果出色 :网友实测,X 博主 Deepanshu Sharma 用简单提示词就能让新版 V3 一键生成 800+行代码且无错运行。在经典弹跳小球测试、20 小球物理模拟测试等中,DeepSeek V3-0324 均表现出色。
对行业竞争的影响 :这样免费且高性能的模型,给 OpenAI、AnthroPic 等闭源商业模型带来不小压力。此次更新或为 R2 的前置版本,随着R2 临近,全球 AI 竞争格局或面临洗牌。
© 版权声明
文章版权归作者所有,未经允许请勿转载。