创新工场董事长李开复在接受彭博社采访时判断,国内基座大模型最终可能仅存DeepSeek、阿里巴巴、字节跳动三家。
在人工智能热度攀升后,李开复成为互联网行业中常对其发表见解的大佬之一。此次他提出国内大模型市场将从“百模大战”演变为这三家的三足鼎立,引发关注。
李开复对这一论断颇具信心,其领导的零一万物成为全面拥抱DeepSeek旗下大模型的首个“AI六小虎”。今年年初,在DeeppSeek-R1尚未广泛知名时,李开复就宣布零一万物不再进行万亿参数模型的预训练,转而专注于务实、小而快且具商业性价比的模型。
实际上,“AI六小虎”中多家已暂停大模型迭代,其他中小规模AI厂商也在大模型领域沉寂。2023年的“百模大战”是特殊现象。当时投资机构因缺乏优质标的,在AI赛道看到希望,大量资本涌入成为导火索。彼时互联网投资遇冷,大消费赛道停滞,而chatgpt的出现为市场注入活力,部分国内企业跟风开展大模型业务。
但AI大模型与互联网底层逻辑不同,大模型是技术与资本双密集型。以Meta的LLaMA3为例,其训练耗费大量GPU时长和高昂成本。从2024年起,一级市场投资者对大模型投资谨慎,因为这是巨头的游戏。
2024年初夏,巨头价格战让中小厂商受限。2025年初,DeepSeek凭借高效低成本优势成为行业新标杆,且其大模型开源,引发基座大模型价值重估,众多AI模型厂商面临生存困境。
李开复选择DeepSeek、阿里巴巴、字节跳动有其原因。DeepSeek势头强劲;阿里巴巴的通义千问Qwen模型在开发者社区声誉颇高;字节跳动虽坚持闭源,但旗下抖音为豆包大模型提供海量用户支持,抖音拒绝其他AI产品投放,力挺豆包。
技术领先的DeepSeek、技术资本兼备的阿里、流量充沛的字节跳动,李开复的这一判断或具前瞻性。