GPT-5于8月8日凌晨1点由OpenAI发布,即日起向免费、Plus、Pro、Team用户推出,企业和教育用户一周内可获访问权限。一经问世,便登上大模型竞技场榜首,在文本、编程、数学等方面排名第一。
该模型将非推理与推理模型融合,支持按需思考,即依据任务难度自行判断是否思考并给出合适回答。它还拥有四种“人格”,分别为愤世嫉俗者、机器人、倾听者和书呆子。OpenAI CEO SamAltman认为,GPT-5 达到了博士级别的智能 ,能完成日常规划等任务。
在技术能力上,GPT-5 在多项基准测试中表现优异,如在SWE – bench验证测试中得分74.9%,在AiderPolyglot测试中得分88%。其在数学、编码、视觉感知和健康方面表现突出,事实性错误较o3减少80%。长背景信息性能也有显著提升,在OpenAI – MRCR指标中优于o3和GPT – 4.1。
编程能力上,GPT-5获得Cursor创始人认可。现场演示显示,它能根据任务自动思考,创建交互式演示。还可通过提示词引导其是否开启思考。通用Agent明星创企Manus联合创始人称,GPT – 5 在各种智能体任务中表现出色。
在APi方面,所有GPT -5模型最多可接受272000个tokens,并生成最多128000个推理及输出tokens,总上下文长度为400000个tokens。GPT – 5支持新的verbosity参数和最低模式 ,让开发人员对模型回复有更多控制权。
安全方面,OpenAI为GPT-5 引入了安全完成的训练形式,使其尽可能给出有用答案,同时保持安全。它还改善了GPT系列模型阿谀奉承的问题,减少了过度讨好和无意义表情符号的使用。
不过,GPT-5的发布也存在争议。OpenAI在发布会使用“视觉骗局”呈现基准测试,夸大了能力提升。其在真实使用场景中的性能与体验,还有待市场反馈。但OpenAI的估值已飙升至5000亿美元。