GPT-4.5详细解读:技术创新与安全评估并进

AI快讯3个月前发布 niko
58 0
AiPPT - 一键生成ppt

OpenAI于2025年2月27日发布的GPT-4.5系统卡报告,引发行业广泛关注。GPT-4.5作为研究预览版,是OpenAI在大语言模型领域的又一力作。

在训练方法上,GPT-4.5采用新监督技术,结合传统的监督微调与人类反馈强化学习,并有所扩展。同时,它推进了无监督学习边界,增强世界模型准确性,降低幻觉率,还通过扩展思维链推理,更有逻辑地处理复杂问题。此外,新的可扩展对齐技术提升了模型的可操控性等能力。

安全评估方面,GPT-4.5进行了内部评估和外部红队测试。在禁止内容、越狱鲁棒性、幻觉、公平性与偏见、指令层次等评估内容上,与GPT-4o相比各有表现。红队评估中,其在对抗性提示下表现有进步但未达最佳。ApolloReseARCh和METR的评估也分别得出相应结果。

准备框架评估里,GPT-4.5计算效率比GPT-4提高10倍以上,被安全咨询小组评为中等风险,在网络安全、化学与生物威胁、说服力、模型自主性等方面有不同程度的风险评估及缓解措施。

多语言性能上,在14种语言的MMLU测试集中,GPT-4.5平均优于GPT-4o,全球化适用性更强。

综合来看,GPT-4.5在能力与安全性上有所提升,训练方法和数据处理体现创新,安全评估与风险缓解措施到位,但说服力和生物威胁能力的中等风险仍需关注。OpenAI坚持迭代部署,以持续改进模型。

© 版权声明
Trea - 国内首个原生AI IDE