北京时间8月8日凌晨一点,OpenAI夏季发布会登场,备受期待的GPT-5正式亮相。此前OpenAI在前沿模型上并不领先,如今GPT-5的出现有望使其重回榜首。
能力全方位提升:GPT-5在多个领域表现卓越,在文本、WebDev、视觉感知等能力领域排名居首,在硬提示、编码、数学等方面也独占鳌头,在“峰会”测试中保持着最高的Arena分数,真正实现了“屠榜”。SamAltman将GPT-4o比作中学生,GPT-5则像博士级专家。Altman断言它是世界上编码、写作、医疗保健领域最强的模型,不仅智能实现“巨大飞跃”,还减少了幻觉问题。
告别“幻觉”更可靠:GPT-5系列有GPT-5、mini、nano、chat四个版本,Chat版可用于语言学习。通过路由系统,能为复杂查询切换版本。在降低幻觉方面成效显著,联网搜索时回答出错概率比GPT-4o低45%,独立思考时比OpenAIo3低80%。还引入犬儒、机器人、倾听者、学霸四种人格模式,用户可自主设定互动方式,此外还能更改聊天窗口颜色主题。
代码能力逆天:Altman预测GPT-5强大的编码能力将开启“软件按需生成”时代。在多个编码基准测试中,GPT-5表现优于其他模型。现场演示中,它能在几秒内编写数百行代码生成网站前端界面,还能创作出画面精致、物理效果准确的3D游戏。
更安全更“诚实”:OpenAI对GPT-5进行超五千小时测试,重点确保其不向用户撒谎。虽幻觉减少,但“自信地撒谎”仍是大模型问题,不过GPT-5处理多步骤任务更可靠。对于敏感提示,它采用“安全补全”机制,在保证安全的同时提供有帮助的信息。
使用方式与展望 :所有chatgpt用户可免费体验GPT-5,Plus订阅用户使用次数更多,Pro订阅用户可访问GPT-5Pro版本。达到上限后会切换到“迷你版”。GPT-5将取代一系列旧模型,不同版本有不同Token定价。OpenAI还在APi中发布“Minimal”参数。此外,微软全系平台已上线GPT-5。Altman认为GPT-5是迈向通用人工智能的重要一步,但相比真正的AGI仍有不足。