GPT-4.5详细解读：技术创新与安全评估并进

AI快讯1年前 (2025)发布 niko

OpenAI于2025年2月27日发布的GPT-4.5系统卡报告，引发行业广泛关注。GPT-4.5作为研究预览版，是OpenAI在大语言模型领域的又一力作。

在训练方法上，GPT-4.5采用新监督技术，结合传统的监督微调与人类反馈强化学习，并有所扩展。同时，它推进了无监督学习边界，增强世界模型准确性，降低幻觉率，还通过扩展思维链推理，更有逻辑地处理复杂问题。此外，新的可扩展对齐技术提升了模型的可操控性等能力。

安全评估方面，GPT-4.5进行了内部评估和外部红队测试。在禁止内容、越狱鲁棒性、幻觉、公平性与偏见、指令层次等评估内容上，与GPT-4o相比各有表现。红队评估中，其在对抗性提示下表现有进步但未达最佳。ApolloReseARCh和METR的评估也分别得出相应结果。

准备框架评估里，GPT-4.5计算效率比GPT-4提高10倍以上，被安全咨询小组评为中等风险，在网络安全、化学与生物威胁、说服力、模型自主性等方面有不同程度的风险评估及缓解措施。

多语言性能上，在14种语言的MMLU测试集中，GPT-4.5平均优于GPT-4o，全球化适用性更强。

综合来看，GPT-4.5在能力与安全性上有所提升，训练方法和数据处理体现创新，安全评估与风险缓解措施到位，但说服力和生物威胁能力的中等风险仍需关注。OpenAI坚持迭代部署，以持续改进模型。

文章版权归作者所有，未经允许请勿转载。