今日凌晨,OpenAI推出GPT-4.5,这款被其称作最大最好的聊天模型引发广泛关注。OpenAICEO萨姆·阿尔特曼评价其交互自然,仿佛是与有思想的人对话。
GPT-4.5在与人类的交互中展现出独特优势,早期测试显示它知识库广泛,具有高情商,能领会用户暗示,在写作、设计、编程等方面能力突出。与OpenAIo1等推理模型不同,它在回答问题时更通用、智能。例如,面对用户朋友取消约会的抱怨,它能领会用户沮丧情绪;在解释AI对齐必要性时,回答更自然,引导用户思考。
在性能表现上,GPT-4.5在准确性、幻觉测试方面优于GPT系列其他模型,人类偏好测试中更受青睐。多语言性能评估里,它也超越GPT-4o。不过,在一些基准测试中,它的能力有差异,如在SWE-Bench Verified测试中超过GPT-4o但低于部分模型,在SWE-Lancer评估中略高于o1,深度研究得分最高。
从功能特性看,GPT-4.5目前可通过搜索获取最新信息,支持文件和图像上传,能用画布编写和代码,但不支持chatgpt中的语音模式等多模态功能。其训练知识截止到2023年10月。
价格方面,GPT-4.5每百万Tokens价格75美元,相比GPT-4o上涨30倍,与DeepSeek相比,输入价格达到惊人倍数。尽管如此,它无法完全替代GPT-4o。
在发布动态上,ChatGPTPro用户已能选择使用GPT-4.5,后续将陆续向Plus、Team、Enterprise和Edu用户推出。OpenAI首席研究官MarkChen表示,GPT-4.5是无监督学习路径成果,OpenAI通过无监督学习和推理两种互补范式推进AI能力,该模型更适合人类协作。
总的来说,GPT-4.5凭借广泛知识库、精准意图理解等优势,有望在多领域深入应用,增强与人类协作场景。但目前高昂定价或成应用普及门槛。