o3-mini与DeepSeek R1激烈对决,谁能称霸AI领域?

AI快讯4小时前发布 niko
0 0

AI领域的激烈竞争从未停歇,近日DeepSeekR1与OpenAI的o3-mini展开了一场引人瞩目的实力较量。这一竞争态势吸引了众多科技爱好者与专业人士的目光,成为行业内热议的焦点。

在基准测试环节,o3-mini展现出强劲实力。在数学代码等基准测试中,o3-mini凭借出色表现拿下最高成绩。特别是在「物理模拟」这一高难度挑战中,o3-mini优势明显,直接超越DeepSeekR1,凸显其卓越的物理推理能力。相关测试结果表明,o3-mini在处理复杂物理场景时,能够更精准地模拟和计算,而DeepSeekR1则出现了明显的「反重力」现象,暴露出其在物理模拟方面的不足。

编码能力方面,o3-mini同样表现出色。在代码补全基准Codeforces排名中,相较于o1系列模型,o3-mini进步显著。ArtificialAnalysis的评估显示,o3-mini在人工分析质量指数上与DeepSeekR1匹配,且在价格、速度等方面具有优势。每百万个token的输入/输出定价为1.1美元/4.4美元,低于许多DeepSeek R1API。速度与o1-mini相似,达到170个token/秒。众多开发者对o3-mini的编码能力给予高度评价,认为它是目前最佳的编程模型之一。

全网实测进一步验证了o3-mini的强大实力。OpenAI研究科学家SebastienBubeck指出,o3-mini在理解和解析arXiv论文方面达到全球领先水平,能针对冷僻问题给出有用答案,成为科研人员的得力伙伴。在AI物理领域,Hyperbolic联创YuchenJin测试发现,o3-mini成功生成四维超立方体(Tesseract)内反弹小球的Python代码,而R1表现则相对逊色。此外,o3-mini还在克隆应用、生成游戏等方面展现出高效与智能,如仅用8秒就能用单个Python文件写一个Twitter克隆应用,用一句话就能生成完整的太空游戏。

从市场反馈来看,OpenAI凭借o3-mini重新赢得用户青睐。开发者MckayWrigley已用o3-mini模型代替工作流中的o1模型,发现其不仅成本降低,性能还更优。尽管OpenAI在企业客户中的份额有所下降,但2024年其整体仍保持快速增长,ChatGPT付费订阅用户、企业模型采用率及新订阅计划收入均有显著提升。OpenAI一方面与美国政府合作确保领先地位,另一方面寄希望于更高级模型驱动的ChatGPT高价订阅实现增长。

© 版权声明

相关文章

暂无评论

暂无评论...