3月1日,在连续开展五天开源日活动后,DeepSeek又有新动作,公开了利润率这一关键信息,同时还分享了基础设施中关键的EP(多专家并行)组件代码。据其公开信息推算,理论上一天总收入可达562027美元,成本利润率高达545%。
这一行为是DeepSeek对自身“盈利能力”的直接回应。自DeepSeekR1成为热门话题,对其模型能力的质疑渐消,但关于高性价比、成本及“烧钱”问题仍存诸多质疑。有硅谷从业者表示,此次公布的数据会让英伟达等企业忧虑,也促使从业者反思。
在国内AI领域,这次重要开源引发了一场“风波”,涉及两家中国AI Infra公司——尤洋创办的潞晨科技和袁进辉创立的硅基流动。
DeepSeek的技术分享在知乎发布后,不少用户@尤洋让其点评。此前在DeepSeek被广泛部署时,尤洋就持反对态度,还曾计算过部署DeepSeek的成本收益,得出相关AIInfra公司“月亏四亿”的结论。
此次DeepSeek开源周虽未针对具体质疑,但公布的高利润率与尤洋计算相悖。尤洋四小时后发文回应,称其计算方法不适用于MaaS盈亏评估,坚持“基于大模型的Mass服务不赚钱”的立场,随后潞晨科技宣布一周后停供DeepSeekAPi。
硅基流动是国内较早为DeepSeek提供部署服务的公司之一,在承接需求过程中出现一些争议。袁进辉与尤洋此前就有过“交锋”,此次DeepSeek官方数据公布后,袁进辉评论称其颠覆认知,认为MaaS成功关键在于技术实力和用户基础。
之后尤洋发文直接批评硅基流动,袁进辉回应并抖出“潞晨代码抄袭”旧案,不过双方争论内容后均删除,而这些争论在知乎等平台引发广泛讨论。
这场争论的核心议题之一是如何计算以及AIInfra是否巨亏。DeepSeek此前发布多项核心技术,提升了大模型训推硬件效率。在相关文章中,其以理论成本和利润计算为开源周画上句号。
DeepSeek的计算方式有其特点,成本仅核算等量租用GPU费用,收入则将各类Token消耗按API价格计算,算出理论成本利润率为545%。这是典型的“最大可能性”推算,因为DeepSeek的APP和网页免费且体验不保证流畅。
尤洋认为该数据对计算MaaS成本无参考价值,毕竟MaaS作为企业服务,稳定性至关重要,云厂商需准备冗余,实际使用中MaaS厂商可能亏本。
那么为何部署DeepSeek亏本,而其自身推理却赚钱?袁进辉指出,很多供应商因V3/R1架构与主流模型差异大,难以达到最佳效率。且过去云厂商IaaS层以CPU为核心,而DeepSeek的稀疏架构需特调适配。
大模型一体机因可改造硬件层,性能和稳定性更高,硅基流动就与华为昆仑合作推出DeepSeek一体机。DeepSeek在模型架构、软件算法及芯片层都做了优化,开源的5个提高推理效率模块,理论上能让其他MaaS厂商复现。
这些争论让AI Infra公司进入大众视野。此前它们作为底层基础设施服务提供商,鲜受关注,DeepSeek带来的海量需求使其获得面向广泛用户的机会。
然而,随着DeepSeek连续开源AI Infra研究成果,独立AIInfra公司面临“存在感危机”。若想在提供DeepSeek模型部署服务中“存活”,需采用其技术方案,卷到极致并提供额外服务,扩大用户规模以摊薄成本。
袁进辉认为,开源是影响AIInfra公司未来的关键变量,模型开源后外界有机会在infra或芯片能力上超越模型厂。另一个变量是技术周期,它模糊了不同技术角色公司的竞争界限。
在这场竞争中,AI Infra公司虽优势不明显,但也获得了前所未有的机会。在当下,是否押注“下一代云”的机会,将成为区分这些公司的关键决策。