2025 年 2 月 27 日,OpenAI 正式亮相其最新力作——语言模型 GPT-4.5。此版本率先以研究预览版的形式,面向 chatgpt Pro用户(每月订阅费 200 美元)开放。GPT-4.5 基于 GPT-4o 构建,被赞誉为“史上最大、知识储备最丰富”的模型,在多个关键领域实现了重大突破。
功能亮点:更智能、交互更自然
GPT-4.5在众多领域展现出卓越的进步。通过监督微调(SFT)与强化学习(RLHF)训练,该模型大幅降低了“幻觉”现象(即错误或虚构信息)的出现频率,同时增强了情感智能,提升了与用户交互的自然程度。例如在PersonQA 测试中,GPT-4.5 的幻觉率仅 19%,远低于 GPT-4o 的 52%。在用户体验上,GPT-4.5在写作和编程任务中表现优异,能生成更具创造力与审美直觉的内容,还能更精准理解用户意图。X 用户 Simon Willison试用后评价:“它在知识深度和生成内容(如绘制鹈鹕)上表现出色,交互体验更自然。”此外,该模型支持文件和图像上传,并集成了 ChatGPT的画布工具,不过目前暂未支持语音、视频或屏幕共享等多模态功能。
数据与安全:确保质量与隐私
OpenAI 表明,GPT-4.5的训练数据来源广泛,涵盖公开数据、专有合作伙伴数据以及内部定制数据集,所有数据都经过严格筛选,以保证质量并保护隐私。在安全层面,模型配备Moderation APi 和分类器,能有效防止有害内容的生成。第三方评估中,Apollo ReseARCh 和 METR 对 GPT-4.5的欺骗风险和自主性进行测试,结果显示总体风险为“中等”,尤其在化学、生物、放射性核材料(CBRN)和说服力领域风险中等,网络安全和模型自主性风险较低。OpenAI已采取措施,如预训练过滤 CBRN 数据并监控潜在滥用情况,以保障安全性。
用户反馈:能力获赞但速度待提升
首批用户反馈显示,GPT-4.5 在知识广度和创造性方面备受好评。X 用户 @pckraftwerk称赞其“写作和编码能力明显增强,幻觉现象减少”。然而,速度问题也引起关注。Simon Willison 指出,通过 API 使用时,GPT-4.5响应速度较慢,可能影响实时应用场景。他还透露,该模型使用的训练计算资源比 GPT-4 多 10 倍,性能提升背后是巨大投入。此外,OpenAI明确表示,GPT-4.5 并非专为深度推理设计,建议用户在需要复杂推理时选择 o1 或 o3-mini 模型,这一定位引发部分讨论。
市场影响与未来展望:推动革新与功能拓展
作为 OpenAI 的最新成果,GPT-4.5 被视为将在写作、编程和问题解决等领域推动生产力变革的重要力量。其多语言表现出色,在 MMLU基准测试中,英语准确率达 0.896,西班牙语 0.8840,阿拉伯语 0.8598,全面超越 GPT-4o。业内人士预测,随着 GPT-4.5逐步推广,其强大功能和较高安全性将进一步巩固 OpenAI 在 AI 领域的领先地位。未来,OpenAI计划依据用户反馈优化模型,可能扩展语音和视频等功能,进一步丰富应用场景。
结语
GPT-4.5 的发布,充分展现了 OpenAI 在技术上的进取精神,以及对安全和用户体验的高度重视。尽管速度问题有待解决,但这款模型无疑为 AI发展翻开了新的篇章。正如 OpenAI 在声明中所言:“我们期望 GPT-4.5 能为用户带来更智能、更可靠的助手体验。”