Karpathy亲测GPT-5 Pro编码能力:Claude一小时搞不定的问题 它10分钟解决

AI快讯6秒前发布 niko
1 0

AI领域大牛Andrej Karpathy的一条推文,让OpenAI的GPT-5 Pro再次成为编码圈热议的焦点——面对Claude Code调试一小时仍未解决的技术难题,GPT-5 Pro仅用十分钟便输出了直接可用的解决方案。

Karpathy在推文中激动表示:“必须再吹一波OpenAI的GPT-5 Pro,真的太强了!”他提到,自己工作流中遇到的棘手问题,Claude Code折腾一小时都没搞定,换用GPT-5 Pro后,十分钟就拿到了“开箱即用”的结果。更有趣的是,当他把GPT-5 Pro的解法交给Claude评估时,后者居然写了“两段小作文”疯狂夸赞。

Karpathy亲测GPT-5 Pro编码能力:Claude一小时搞不定的问题 它10分钟解决

这一体验,让Karpathy直言“GPT-5 Pro目前确实甩其他编码模型好几条街”。他回忆,三周前还觉得OpenAI的Codex在基准编辑和体验上不如Claude Code,但GPT-5 Pro的表现“完全超出预期”。

OpenAI CEO奥特曼(Sam Altman)很快回应了Karpathy的赞赏,并透露了一组关键数据:**集成GPT-5后的Codex,过去两周内使用量增长了约10倍**。他表示,内部有一个“非常高效的模型”支撑了这一增长,而Codex在PR(拉取请求)任务中的表现,已大幅超越Devin、GitHub Copilot、Cursor Agent等竞品。

Karpathy亲测GPT-5 Pro编码能力:Claude一小时搞不定的问题 它10分钟解决

开发者亲测:GPT-5 Pro的“解决问题能力”远超竞品

GPT-5 Pro的优势,不止体现在Karpathy的案例中。一位开发者测试后表示,用GPT-5 Pro仅需6分钟就能完成应用开发,支持图像、文本、箭头等元素的自由组合;另一位开发者提到,多轮交流后,GPT-5 Pro能将SMILES(简化分子输入线输入系统)转换为ASCII代码,功能实用性远超预期。

HubSpot联合创始人也认可GPT-5 Pro的实力,称其“在复杂编码任务上的表现令人印象深刻”——尽管Codex的用户体验仍略逊于Claude Code,但差距正在快速缩小。

编码模型之争:GPT-5 Pro凭什么“领先一截”?

当前编码领域,Claude Code、Gemini、Grok Code等模型各有拥趸,但GPT-5 Pro的核心竞争力在于“理解问题的深度”。Karpathy解释,自己会定期轮换使用各类工具,但GPT-5 Pro“不是简单生成代码,而是能抓住问题核心,输出更符合实际需求的解决方案”。

有网友问Karpathy是否尝试过Grok-code-fast-1,他回应“尚未测试,但已列入计划”,但同时强调:“就目前而言,GPT-5 Pro的编码能力确实领先一截。”

更有意思的是,Karpathy常用“模型互评”评估性能——让所有模型生成内容,再让每个模型给结果排名。测试中,AI并未偏向自己的输出,反而能客观识别优秀内容,而GPT-5 Pro的结果往往排名第一。

对于开发者而言,选择编码模型的核心是“解决问题的效率”。GPT-5 Pro用10分钟解决Claude Code1小时未搞定的问题,Codex两周使用量暴增10倍,这些数据都指向一个结论:**GPT-5 Pro正在成为编码领域的“新王者”**。

参考资料

https://x.com/karpathy/status/1964020416139448359

https://x.com/sama/status/1964032346975588371

本文来自微信公众号“新智元”,作者:桃子,36氪经授权发布。

© 版权声明