DeepSeek-R1-0528：复杂推理与编程能力升级的国产AI新秀

AI快讯1年前 (2025)发布 niko

DeepSeek-R1-0528低调登场。业内翘首以盼R2模型之际，DeepSeek悄然推出DeepSeek-R1-0528，延续其命名传统，如之前的DeepSeek-V3-0324，虽版本号不变，实则升级显著。

深度思考与推理能力增强 ：该模型沿用DeepSeek V3 Base模型，投入更多算力，深度思考能力大幅提升。以AIME 2025测试为例，旧版R1平均每题用12K tokens，新版R1-0528则需23K tokens，准确率从70%提升至87.5%。有网友实测，它连续思考复杂问题可达25分钟。
编程能力媲美顶尖模型 ：在LiveCodeBench基准测试中，DeepSeek-R1-0528成绩能与o3-mini（High）和o4-mini（Medium）媲美，部分场景超越gemini 2.5 Flash。生成页面代码时，R1-0528输出728行，多于Claude 4 Sonnet的542行，且细节处理更优。数学推理方面，它是唯一能稳定正确回答“9.9 – 9.11等于多少”的模型，搭建单词评分系统一次提示即可生成前后端文件并运行。
适配中文语境与写作提升 ：国外模型面对中文语境易“水土不服”，DeepSeek-R1-0528作为本土AI，在语言对话上更贴合国人需求。幻觉率降低45% – 50%，创意写作方面，输出论文、小说等更顺畅，逻辑与情节自然。

此次更新，DeepSeek依旧“低调内卷”，虽有人质疑，但更多人期待它成为“国产之光”，推动AI让普通人触及更多可能。

文章版权归作者所有，未经允许请勿转载。