OpenAI推出GPT-4.1系列:上周,OpenAI下一代大模型发布传闻不断,如今GPT-4.1系列正式登场,阵容涵盖旗舰版GPT-4.1、高性价比的GPT-4.1mini和超轻量的GPT-4.1 nano。此次更新面向开发者,通过APi接口服务。
编码能力强化 :在SWE-benchVerified基准测试中,GPT-4.1得分54.6%,远超GPT-4o的33.2%,甚至高于GPT-4.5的38.0%。在代码处理细节上更精进,减少无关编辑频率。前端开发者也受益,其生成的网页应用更出色,输出Token限制提升。
指令遵循提升 :在Scale’sMultiChallenge和IFEval测试中,GPT-4.1得分提升,能更精准执行复杂指令。合作伙伴案例显示其在复杂场景中表现更佳,减轻开发者负担。
长文本处理能力 :全系支持100万Token上下文窗口,在长文本理解和处理上能力强化。新评估基准测试结果表明其性能优势明显,为相关应用场景带来福音。
多模态能力出色 :GPT-4.1家族视觉理解能力保持高水平,GPT-4.1mini在部分视觉基准测试中表现优于GPT-4o,旗舰版在长视频理解上取得新SOTA成绩。
新定价体系诱人 :GPT-4.1系列价格优化,推理效率提升。不同版本有不同定价,Prompt Caching和BatchAPI有折扣,降低开发者成本。
竞争与展望:GPT-4.1被视为对竞争对手的回应,虽有进步,但在某些基准测试中与对手仍有差距。其命名体系增加用户理解成本,但此次发布解决了开发者核心痛点,未来或有更多动作。
© 版权声明
文章版权归作者所有,未经允许请勿转载。