OpenAI发布GPT-4.1系列 :OpenAI此次推出的GPT-4.1系列,涵盖了GPT-4.1、GPT-4.1 mini以及GPT-4.1nano三个版本。值得注意的是,该系列为APi专供。不过,非开发者也无需失望,其能力将通过融入最新版本的GPT-4o在chatgpt中得以体现。
突出优势展现:GPT-4.1系列具备两大显著优势。其一为长上下文,三个型号均拥有100万token上下文窗口;其二是性价比高,以较低成本即可畅享接近GPT-4o的模型品质。
能力对比凸显实力 :在编码能力上,GPT-4.1在SWE-benchVerified测试中得分高于GPT-4o和GPT-4.5。指令遵循方面,在MultiChallenge基准中,GPT-4.1得分也优于GPT-4o。长上下文方面,在Video-MME基准测试里,GPT-4.1刷新成绩,表现突出。此外,GPT-4.1 mini在多项测试中超越GPT-4o,而GPT-4.1nano则是速度最快、成本最低的模型,在部分测试中也有出色表现。
新评估平台与数据集发布 :OpenAI开源了评估平台OpenAI-MRCR,用于测试模型检索和理解信息的能力。同时发布数据集Graphwalks,以评估多跳上下文推理能力,GPT-4.1在该基准上性能出色。
价格与市场比较 :相较于GPT-4.5 Preview,GPT-4.1系列价格大幅降低。然而,与DeepSeek R1相比,其性价比仍有提升空间。
© 版权声明
文章版权归作者所有,未经允许请勿转载。