近期,DeepSeek在AI领域掀起波澜,因其以低算力成本训练出高性能AI大模型,打破物理算力至上逻辑,对行业领军者OpenAI形成强烈冲击,从而备受关注。
自2025年1月末上线,基于DeepSeekV3模型的官方App成绩斐然,下载量飙升,已登顶全球140多个国家应用商店,日活突破2000万,在多地取代ChatGPT成为热门AI应用。
然而,其高效低成本特质引发争议。训练大模型依赖英伟达AI显卡算力,像马斯克xAI的“Supercluster”超级计算中心,由10万个液冷英伟达H100GPU组成,价值超40亿美元。而中国市场受限,只能获取低性能阉割版显卡如H800。但DeepSeek-V3模型仅用2048块H800芯片,历经两个月便实现6710亿参数训练成果,训练效率比Meta的Llama3提升11倍。

各方对DeepSeek算力争议观点不一。马斯克等怀疑其隐瞒真实算力,美国白宫和FBI展开调查其是否通过新加坡中转获H100显卡,英伟达称新加坡是交易中转站,不代表产品最终使用地。OpenAI主张“数据蒸馏”观点,质疑DeepSeek使用其闭源数据,目前尚未有调查结果。还有观点认为DeepSeek通过算法优化降低物理算力成本,获吴恩达等AI权威认同,李飞飞团队也以低成本训练出性能可观的S1模型。
随着争议不断,DeepSeek在多个国家面临局部封禁。韩国暂时禁止员工访问,澳大利亚以“国家安全”为由禁止在政府设备上使用,美国部分政府部门通过行政命令禁止,意大利则实施全面封禁。对此,中国外交部强调中方重视数据隐私安全,反对泛化国家安全概念。

尽管如此,全球科技巨头对DeepSeek态度开放。英伟达、亚马逊、微软等纷纷接入,英伟达接入后可助ToB用户高效构建AI智能体,微软CEO盛赞其创新,苹果CEO也给予好评,腾讯、华为等科技企业也宣布旗下产品接入。相比之下,OpenAI陷入窘境,一方面调查数据是否被DeepSeek未经授权获取,一方面调整商业策略。
DeepSeek以其独特的创新思路,颠覆了算力为王的传统概念,为AI行业带来新的发展方向与思考。