OpenAI推出三款新模型 :当地时间5月15日凌晨,OpenAI正式向chatgpt用户发布GPT-4.1、GPT-4.1mini以及GPT-4.1nano三款人工智能模型。其中,GPT-4.1能为软件工程师编写或调试代码提供高效支持,在编程能力、指令执行和运行速度上,都比GPT-4o更出色。
性能测试表现优异 :在SWE-benchVerified软件工程基准测试中,GPT-4.1得分55%,远超GPT-4o的33%和GPT-4.5的38%。在Scale的MultiChallenge指令执行测试里,其得分38%,较GPT-4o的28%提升了10%。而且,该模型冗余输出减少50%,获早期企业用户高度评价。
小参数模型各有特色 :GPT-4.1 mini将取代GPT-4o mini,成为新默认模型,供所有ChatGPT用户使用。GPT-4.1nano则是目前速度最快、成本最低的模型,支持100万token的上下文窗口,在多项基准测试中表现优于GPT-4o mini,适合分类、自动补全等任务。
模型访问与使用权限 :三款模型均可通过ChatGPT界面左上角“更多模型”下拉菜单选择。目前,GPT-4.1向ChatGPTPlus、Pro和Team订阅用户推出,企业版与教育版用户未来几周陆续开放权限。GPT-4.1 mini供所有免费和付费用户使用,GPT-4.0mini将从ChatGPT全面下架。
上下文长度与应用场景:在APi中,GPT-4.1可处理最多100万个token的输入,适用于多文档审阅、财务分析等企业场景。虽大规模输入场景中表现可能下降,但在数十万token级别内性能稳健。
与前代模型对比:2025年2月发布的GPT-4.5着重提升无监督学习能力等,但多数用户认为其性能提升“温和”,在数学和编程方面不及o系列模型,API使用成本高。而GPT-4.1聚焦速度与指令执行实用性,在代码辅助和指令遵循性上表现更好。
API定价情况 :GPT-4.1通过OpenAI API提供,每百万输入token收费2美元,缓存输入0.5美元,输出8美元。轻量版GPT-4.1mini费用更低。相比之下,谷歌的Flash-Lite和Flash模型价格更具竞争力。
模型集成与安全考量:GPT-4.1最初仅面向第三方开发者,在用户要求下引入ChatGPT平台。此前发布时因未附带安全报告遭批评,OpenAI解释其并非前沿模型,无需遵循相同安全报告要求。发布新模型当天,OpenAI承诺更频繁公开内部AI模型安全评估结果。