DeepSeek V3.1升级上线,多项特性引关注
昨日晚间,DeepSeek宣布将线上版本模型升级为DeepSeekV3.1,其上下文窗口从原有的64k扩展到128k,用户可通过网页、App、小程序体验。同时,App和网页端的“深度思考(R1)”改为“深度思考”,不过官方未对这一改动发布消息。
Base版本开源,代码资料可下载
该模型已上传至Hugging Face,目前仅开源了未经指令微调的Base版本,其配置文件、脚本代码和模型权重均可下载。与DeepSeek – V3 -0324相比,参数量和张量类型无明显变化。
多领域能力提升,体验效果显著
智东西对新模型进行体验,发现其在多个领域有不同程度的提升。编程方面,开发个人网站时,代码长度增加,网页布局更合理、栏目规划更丰富;开发小游戏虽有不足,但能在短时间完成。历史问题回答上,信息量增加、细节更丰富且有事实依据,回答语气活泼、解释更丰满。此外,在回答比较类问题时采用“端水”策略,诗歌创作保持特色,数学能力虽过程曲折但能得出正确答案。
网友反馈积极,期待更多开源
网友使用后反馈,新模型打造的小球弹跳效果更符合物理定律,还可调整多项参数。不少网友蹲守DeepSeek的HuggingFace主页,期待后续更多版本的DeepSeek V3.1开源。
© 版权声明
文章版权归作者所有,未经允许请勿转载。