DeepSeek-R1开启大模型新时代
2025年春节前夕,DeepSeek-R1横空出世,如同夜空中绽放的烟火,瞬间吸引了行业目光。云服务器工程师紧急调优芯片适配该模型,从事Agent ToB业务的厂商也被客户催着验证性能、部署模型。它成为中国大模型发展的分水岭,重塑了行业叙事逻辑。
推理模型崛起
OpenAI的模型发展分为GPT系列和o系列。2024年发布的o1是里程碑,o系列聚焦“结构化推理”能力,是对GPT系列的补充。未来GPT系列可能逐渐退场,自2025年4月30日起,GPT4将在chatgpt中被GPT4o取代。大模型范式从预训练参数ScalingLaw转向强化学习推理计算带来的新Scaling Law,推理模型成为大模型第二程的关键。
国内厂商积极跟进
面对o系列和DeepSeek-R1的影响,国内大厂反应迅速。以DeepSeek-R1发布为节点,科大讯飞、百度、阿里、腾讯、字节等厂商纷纷发布推理模型,如讯飞星火X1、文心大模型X1、通义千问Qwen-QwQ-32B、混元T1、豆包1.5等。这些厂商基础模型能力较强,达到GPT – 4水平,为迈入大模型第二阶段奠定基础。
六大推理模型混战o3
o3是OpenAI目前最强大的推理模型,在多项基准测试中表现出色。但国内六大推理模型也各有亮点。DeepSeek-R1提供推理大模型训练思路,成本低;阿里千问系列在B端业务占比重;百度文心大模型X1采用协同训练,增强Agent能力;科大讯飞星火X1基于全国产算力训练,在行业端领先;豆包模型有价格竞争力;腾讯混元借助推广实现逆袭。
大模型国产化趋势
国产推理大模型在榜单上崭露头角,但大模型发展仍面临“卡脖子”问题,如英伟达暂停RTX5090D销售。在此背景下,全国产化技术路径成为选择。科大讯飞优化技术提升推理性能,星火X1在通用任务评测中表现突出。随着国际环境不确定性增加,全栈国产化大模型有望成为主流。