周五凌晨,美国初创企业OpenAI开展直播活动,正式推出最新大模型GPT-4.5,并作为预览研究逐步向用户开放。
在AI产业风云变幻的当下,描述这款被OpenAI长期雪藏的大模型颇具挑战。OpenAI在新闻稿中表明,GPT-4.5堪称公司有史以来规模最大且性能最佳的聊天模型,其计算效率相较于GPT-4实现了超10倍的跃升。
作为“规模法则”指引下的成果,GPT-4.5拥有更广泛的知识库,对人类意图的理解能力大幅增强,“情商”也更高。预计在改善写作、编程以及解决实际问题等方面,GPT-4.5将发挥更大作用,且模型的幻觉现象会有所减少。
OpenAI强调,GPT-4.5展现出更为强大的审美直觉与创造力,在写作和设计领域表现尤为卓越。
不过,OpenAI也承认,作为非思维链模型,GPT-4.5已无缘“宇宙最强大模型”的角逐。
在GPT-4.5的系统卡/说明书中,OpenAI指出,与之前的推理模型相比,GPT-4.5并未引入7个全新的前沿能力,且在多数准备度能力评估中,其表现逊于o1、o3-mini和深度研究模型。同时,OpenAI坚信推理将成为未来AI模型的核心能力。
成为公司史上最大模型,让GPT-4.5的未来充满变数。OpenAI表示,GPT-4.5是一个极为庞大且计算密集型的模型,这使其比GPT-4o成本更高,且无法替代GPT-4o。公司正在评估是否长期在APi中保留它,开发者和用户的反馈将决定这款大模型的命运。
每月支付200美元订阅费的chatgpt Pro用户在发布当天即可使用GPT-4.5,下周起,其余付费用户也将陆续迎来更新。
作为最新一代非推理旗舰大模型,GPT-4.5有一独特“本领”:擅长诱骗其他AI“打钱”。
依据OpenAI提供的说明书,“高情商”的GPT-4.5在捐赠诈骗方面成绩斐然。
在一项测试中,GPT-4.5试图操纵另一个模型(GPT-4o)“捐赠”虚拟货币时,成功率远超OpenAI其他可用模型,包括o1和o3-mini这样的推理模型。研究发现,GPT-4.5似乎在对抗中形成了一种“小额诈骗”策略,因此单笔骗到的钱比deepreseARCh模型少一半。
此外,GPT-4.5在诱使GPT-4o透露秘密代码词方面也胜过OpenAI的所有模型,比o3-mini高出10个百分点。
OpenAI表示,该模型在这一特定基准类别中尚未达到其内部设定的“高”风险阈值。公司承诺,在实施“足够的安全干预措施”将风险降至“中等”前,不会发布达到高风险阈值的模型。