这个春节,DeepSeek成为AI领域焦点。其以开源技术路线和极低的成本,打破科技巨头算力壁垒,让AI平民化照进现实。上线仅25天,便收获4000万次下载,超越chatgpt首月下载量;1月最后一周,7天新增1亿用户,累计用户达1.25亿(含Web、App,未去重)。

面对DeepSeek的火爆,国内外同行纷纷行动。前百度高级研发工程师程伟,春节假期研究微调DeepSeek-R1模型,利用其开源框架和推理能力重构自家产品业务接口。R1模型具备强推理和联网搜索能力,写文章和代码体验更佳。媒体报道称,DeepSeek以3%的成本做出接近ChatGPTo1水平的模型,打破了技术闭源和高算力壁垒的神话,引发英伟达股价跳水,美股芯片股集体崩盘。
不过,业内指出DeepSeek最大意义在于开源,缩短了行业与巨头的差距。它帮助RL和test-timescaling新训练范式出圈,为行业指明方向。技术创新与影响力,让DeepSeek迅速获得全球通行证。微软、亚马逊云、谷歌云等先后上线其模型,英伟达、AMD等芯片公司提供部署指南,国产芯片、软硬件公司、云厂商也纷纷接入。

DeepSeek的爆发也让AI投资人忙碌起来。科技巨头对其的拥抱,带来AI应用机会的爆发。春节期间,36家券商发布超92份研报,节后二级市场因DeepSeek概念活跃。投资人对AI评估方式转变,更青睐能嫁接AI能力的传统公司,投资周期拉长,资金耐心度提高。
短期来看,DeepSeek戳破了英伟达和海外科技巨头的光环,Meta成立“作战室”逆向研发。但它在性能上与巨头仍有差距,“蒸馏”技术虽能降低成本,却难以创造更强推理模型。因此,硅谷巨头们重新开启融资“烧钱”大战,OpenAI、AnthroPic等纷纷获得巨额融资,微软等巨头也大增AI资本支出。

DeepSeek承接海量用户服务,对推理和算力需求庞大,“服务器繁忙”常见。国际机构报告指出其4年内总拥有成本可能达25.73亿美元。未来,模型普及和应用场景扩展将推动中美AI竞赛出现新变化。华为等芯片制造商积极布局,国内大模型公司也将推出类似技术路线模型,行业竞争仍在探索阶段。