AI编写代码的时代正加速到来 。AnthroPic首席执行官DarioAmodei近日大胆预言,未来3到6个月,AI将编写90%的代码,12个月内,几乎所有代码都可能由AI完成。这一预言并非空穴来风,随着一系列重磅AI产品发布,程序员群体的危机感与日俱增。
诸多AI产品展现出强大的编码能力。编码能力再破天花板的Claude3.7 ,以及Windsurf’s Wave 4 ,还有此前热门的OpenAIo3大模型、独立开发者青睐的Cursor ,都是行业内的标杆产品。在最新的Agentic Coding Evalution榜单中,Sonnet3.7以67%的得分率在初级人员开发评估达成度中位居榜首,GPT-4.5和Sonnet 3.5也表现出色,得分均超60%,凸显了这些模型强大的编程实力。
不同模型在编程方面各有侧重。GPT-4.5在架构和跨系统交互任务上表现突出,Claude 3.7Sonnet则在原始编码和代码编辑方面更胜一筹。以实际案例来看,o3模型在Elo得分2727分对应的编程竞赛中,排名高居175名,该竞赛有全球168076名程序员参赛,o3击败了99.9%的程序员,Claude3.7 sonnet表现预计更优。
不仅在模型层,产品开发层面也有重大升级。字节跳动的Trae海外版接入Claude-3.7-Sonnet、GPT-4o等国际大模型,具备IDE能力,让编程小白也能接近实现编程梦想,进一步拉低了程序员的门槛。而且,Trae海外版完全免费,相比Cursor每月20美元的付费订阅,优势明显。
国外网友利用Trae和内置的Claude3.7 ,依据简单设计草图和提示,就能自动生成3D动画地球代码。还有大神PieterLEVEls仅用3小时,靠ai开发一款游戏,上线13天便赚得67000美元。国内也有人进行尝试,有人用Trae的Builder模式和Chat模式,输入特定Prompt,几分钟生成“Todo日历”应用代码,Trae还能协助部署开发环境。
大模型代码水平快速提升,正从多方面逼近人类。Sonnet 3.7成为首个可靠代码长度上千行的模型,Actionscaling关键能力让模型能持续迭代解决开放式问题。虽然目前AI在与客户对接需求等方面尚有不足,但Devin等产品的AIAgent能力不断增强,未来人人都可能成为产品经理。