在AI领域发展的当下,DeepSeek模型掀起热潮,各大国产GPU公司纷纷投身适配工作,其中的策略与发展值得关注。
适配模型的抉择 :从适配Deepseek模型角度,芯片厂商动作可分为适配原生R1和V3模型,以及由R1蒸馏而来的小模型。DeepseekR1定位推理优先,适用于深度逻辑分析场景;DeepseekV3是通用大语言模型,满足多领域自然语言处理需求;DeepSeek-R1系列蒸馏模型则是轻量级版本,适合轻量级部署与资源受限场景。不同厂商适配的模型类型有别,华为昇腾、海光信息明确适配DeepSeekR1及V3原版模型,而摩尔线程、壁仞科技等主要支持DeepSeek-R1系列蒸馏模型(参数规格在1.5B – 8B之间)。
适配的技术路线差异:除适配模型种类不同,各厂商技术路线也有区别,适配难度各异。从技术生态和应用场景看,DeepSeek模型运行适配依赖英伟达硬件和编程语言,厂商适配能力取决于对原始开发生态的兼容性,是否兼容CUDA影响适配大模型的难易程度。从性能表现看,不同GPU计算能力不同,影响DeepSeek处理大规模深度学习任务的速度,部分GPU在能效比上更适合低功耗运行DeepSeek。
主流芯片公司的适配情况:华为昇腾拥有全栈AI能力,硬件上昇腾910芯片适合大规模模型训练,软件生态方面CANN异构计算架构和MindSpore框架有优势,但依赖CUDA生态时可能损失性能。海光信息的海光DCU兼容“类CUDA”环境,擅长高性能计算,在智算中心应用成熟,但软件工具链成熟度待提升。燧原科技在云端AI训练与推理有优势,邃思芯片针对大模型优化,支持主流框架并提供自动化编译工具,但生态影响力较弱。沐曦的GPU通用性与CUDA兼容性好,理论算力高,但产品量产进度和落地案例少,需验证稳定性。天数智芯兼容CUDA生态,但高端算力不足。壁仞科技单芯片算力峰值高,但软件栈成熟度待提升。昆仑芯与百度PaddlePaddle深度绑定,摩尔线程聚焦图形渲染与AI融合场景,云天励飞/太初元碁侧重边缘端推理,龙芯目前GPU产品处于早期阶段,适配DeepSeek不成熟。
DeepSeek的商用模式:在商用方面,DeepSeek有云上部署和本地化部署两种模式。云上部署通过华为云等平台提供服务,企业按使用量付费,无需本地部署硬件。本地化部署有一体机形式,包括推理一体机和训推一体机,面向不同需求企业;企业也可自行部署,满足对性能和安全性要求极高的企业。当前企业用户多先在公有云测试,再考虑其他形式,中小企业倾向云服务,而对数据安全和高性能算力需求高的企业会部署一体机,私有化部署市场正蓬勃发展。
芯片公司的商业化进展:在DeepSeek概念里,昇腾和海光商业化进展良好。昇腾因DeepSeek一体机发布,产业联盟不断扩大,超80家企业基于昇腾适配或上线DeepSeek系列模型,预计未来两周还有20多家企业上线,且昇腾芯片本地化服务优势明显。海光与DeepSeek合作覆盖智算中心、金融、智能制造等多场景,推出多种解决方案,赋能不同领域企业升级。
国产GPU的发展机遇:随着DeepSeek一体机等应用推广,市场对国产芯片需求增加。DeepSeek推动大模型私有化部署,为国产芯片带来机会,后训练部分今年预计有更多非英伟达卡加入。到2026年、2027年,国内部分算力将由国产芯片承担。DeepSeek降低无效训练和并行计算需求,使国产芯片在特定任务中能效比可达英伟达GPU的75%。不仅GPU芯片,AI推理侧有细分优势的ASIC、FPGA等芯片也有发展机会,但国产芯片公司在互联和生态等方面还需完善。