o3-mini与DeepSeek R1激烈对决，谁能称霸AI领域？

AI快讯1年前 (2025)发布 niko

AI领域的激烈竞争从未停歇，近日DeepSeekR1与OpenAI的o3-mini展开了一场引人瞩目的实力较量。这一竞争态势吸引了众多科技爱好者与专业人士的目光，成为行业内热议的焦点。

在基准测试环节，o3-mini展现出强劲实力。在数学代码等基准测试中，o3-mini凭借出色表现拿下最高成绩。特别是在「物理模拟」这一高难度挑战中，o3-mini优势明显，直接超越DeepSeekR1，凸显其卓越的物理推理能力。相关测试结果表明，o3-mini在处理复杂物理场景时，能够更精准地模拟和计算，而DeepSeekR1则出现了明显的「反重力」现象，暴露出其在物理模拟方面的不足。

编码能力方面，o3-mini同样表现出色。在代码补全基准Codeforces排名中，相较于o1系列模型，o3-mini进步显著。ArtificialAnalysis的评估显示，o3-mini在人工分析质量指数上与DeepSeekR1匹配，且在价格、速度等方面具有优势。每百万个token的输入/输出定价为1.1美元/4.4美元，低于许多DeepSeek R1API。速度与o1-mini相似，达到170个token/秒。众多开发者对o3-mini的编码能力给予高度评价，认为它是目前最佳的编程模型之一。

全网实测进一步验证了o3-mini的强大实力。OpenAI研究科学家SebastienBubeck指出，o3-mini在理解和解析arXiv论文方面达到全球领先水平，能针对冷僻问题给出有用答案，成为科研人员的得力伙伴。在AI物理领域，Hyperbolic联创YuchenJin测试发现，o3-mini成功生成四维超立方体（Tesseract）内反弹小球的Python代码，而R1表现则相对逊色。此外，o3-mini还在克隆应用、生成游戏等方面展现出高效与智能，如仅用8秒就能用单个Python文件写一个Twitter克隆应用，用一句话就能生成完整的太空游戏。

从市场反馈来看，OpenAI凭借o3-mini重新赢得用户青睐。开发者MckayWrigley已用o3-mini模型代替工作流中的o1模型，发现其不仅成本降低，性能还更优。尽管OpenAI在企业客户中的份额有所下降，但2024年其整体仍保持快速增长，ChatGPT付费订阅用户、企业模型采用率及新订阅计划收入均有显著提升。OpenAI一方面与美国政府合作确保领先地位，另一方面寄希望于更高级模型驱动的ChatGPT高价订阅实现增长。

# AI快讯

文章版权归作者所有，未经允许请勿转载。