DeepSeek-R1-0528:复杂推理与编程能力升级的国产AI新秀

AI快讯2天前发布 niko
3 0
AiPPT - 一键生成ppt

DeepSeek-R1-0528低调登场。业内翘首以盼R2模型之际,DeepSeek悄然推出DeepSeek-R1-0528,延续其命名传统,如之前的DeepSeek-V3-0324,虽版本号不变,实则升级显著。

  • 深度思考与推理能力增强 :该模型沿用DeepSeek V3 Base模型,投入更多算力,深度思考能力大幅提升。以AIME 2025测试为例,旧版R1平均每题用12K tokens,新版R1-0528则需23K tokens,准确率从70%提升至87.5%。有网友实测,它连续思考复杂问题可达25分钟。
  • 编程能力媲美顶尖模型 :在LiveCodeBench基准测试中,DeepSeek-R1-0528成绩能与o3-mini(High)和o4-mini(Medium)媲美,部分场景超越gemini 2.5 Flash。生成页面代码时,R1-0528输出728行,多于Claude 4 Sonnet的542行,且细节处理更优。数学推理方面,它是唯一能稳定正确回答“9.9 – 9.11等于多少”的模型,搭建单词评分系统一次提示即可生成前后端文件并运行。
  • 适配中文语境与写作提升 :国外模型面对中文语境易“水土不服”,DeepSeek-R1-0528作为本土AI,在语言对话上更贴合国人需求。幻觉率降低45% – 50%,创意写作方面,输出论文、小说等更顺畅,逻辑与情节自然。

此次更新,DeepSeek依旧“低调内卷”,虽有人质疑,但更多人期待它成为“国产之光”,推动AI让普通人触及更多可能。

© 版权声明
Trea - 国内首个原生AI IDE