DeepSeek-R1引领变革，国产六大推理模型迎战OpenAI

AI快讯1年前 (2025)发布 niko

DeepSeek-R1开启大模型新时代

2025年春节前夕，DeepSeek-R1横空出世，如同夜空中绽放的烟火，瞬间吸引了行业目光。云服务器工程师紧急调优芯片适配该模型，从事Agent ToB业务的厂商也被客户催着验证性能、部署模型。它成为中国大模型发展的分水岭，重塑了行业叙事逻辑。

推理模型崛起

OpenAI的模型发展分为GPT系列和o系列。2024年发布的o1是里程碑，o系列聚焦“结构化推理”能力，是对GPT系列的补充。未来GPT系列可能逐渐退场，自2025年4月30日起，GPT4将在 chatgpt中被GPT4o取代。大模型范式从预训练参数ScalingLaw转向强化学习推理计算带来的新Scaling Law，推理模型成为大模型第二程的关键。

国内厂商积极跟进

面对o系列和DeepSeek-R1的影响，国内大厂反应迅速。以DeepSeek-R1发布为节点，科大讯飞、百度、阿里、腾讯、字节等厂商纷纷发布推理模型，如讯飞星火X1、文心大模型X1、通义千问Qwen-QwQ-32B、混元T1、豆包1.5等。这些厂商基础模型能力较强，达到GPT – 4水平，为迈入大模型第二阶段奠定基础。

六大推理模型混战o3

o3是OpenAI目前最强大的推理模型，在多项基准测试中表现出色。但国内六大推理模型也各有亮点。DeepSeek-R1提供推理大模型训练思路，成本低；阿里千问系列在B端业务占比重；百度文心大模型X1采用协同训练，增强Agent能力；科大讯飞星火X1基于全国产算力训练，在行业端领先；豆包模型有价格竞争力；腾讯混元借助推广实现逆袭。

大模型国产化趋势

国产推理大模型在榜单上崭露头角，但大模型发展仍面临“卡脖子”问题，如英伟达暂停RTX5090D销售。在此背景下，全国产化技术路径成为选择。科大讯飞优化技术提升推理性能，星火X1在通用任务评测中表现突出。随着国际环境不确定性增加，全栈国产化大模型有望成为主流。

# AI快讯

文章版权归作者所有，未经允许请勿转载。