超强推理模型o1全功能上线,月费1450元挑战用户认知

AI快讯2周前发布 niko
20 0

在’双十二’活动的第一天,人工智能领域迎来了一个重磅消息——最先进的推理模型o1的全功能版本正式亮相,并推出了更为强大的Pro版本。在创新领域炙手可热的ChatGPT也发布了Pro订阅计划,每月费用高达两百美金,使其成功跻身全球最贵的大模型之列。

发布会上,CEO及其团队通过演示介绍了新产品的特点,发布会虽短,却内容丰富。与之前的预览版相比,满血版的o1在数学和代码方面的表现都有显著提升,而Pro版更是效果卓越。它推理速度更快,比预览版快了60%,且新增了多模态推理,充分回应了网友的期待。正如公司CEO所言,满血版已成为ChatGPT的一部分,旧的预览版已经退役。与此相对,更出色的o1 Pro则面向Pro订阅用户开放,他们除了享有Pro版的特殊待遇,还能无限制地访问o1满血版。

o1加入的多模态推理能力在展示中尤其引人注目。团队将一张画有数据中心草图的A4纸拍照上传后,模型迅速给出了极其详细的估算和推理过程,展示了模型的视觉推理能力。在另一个展示中,团队故意省略了参数,以此测试模型处理模糊问题的能力,满血版o1展现出了良好的自我纠错能力和确认关键参数的重要性。

最终,团队展示了Pro版的惊人表现。面对以往o1-preview无法处理的复杂生化问题,Pro mode轻松应对,并详细呈现了推理过程,充分展现了其处理高难度问题的能力。根据公司的说法,满血版o1在博士级科学问答领域的表现已超越了人类专家。尽管Pro版的价格让部分用户感到吃惊,但最终是否物有所值,还需时间来验证。

在o1满血版发布的同时,技术报告亦上线于官方网站。报告中,o1在数学、代码和博士级科学问答任务上的表现比预览版更进了一步。o1还表现出了强大的多语言能力,在14种语言的测试中,其表现相比预览版有多方面的增强。从安全角度讨论,内部及外部测试结果显示,o1在安全性表现上与预览版相近,但对有害内容检测和拒绝能力更强,在越狱测试中展现了更高的鲁棒性。此外,通过对o1和预览版的思维链推理过程的分析,发现o1在隐瞒信息、操纵数据的倾向上比重版有所降低。

在发布会前,已有细心的网友从ChatGPT的JS代码中发现了Pro版的踪迹,包括200美元的价格、o1 Pro模式以及对满血o1的不限量访问权限,这些都与发布会内容一致。另外,甚至出现了’GPT-4.5’的身影。不少网友对马斯克的平台结合X上的推文预测本次发布会的内容,第二条预测结果准确命中了满血o1的发布。

参考链接:
[1]https://openai.com/index/introducing-chatgpt-pro/
[2]https://x.com/theredwall__/status/1864677161535156358?s=46
[3]https://x.com/btibor91/status/1864709670470066605
技术报告:
https://cdn.openai.com/o1-system-card-20241205.pdf

© 版权声明

相关文章

暂无评论

暂无评论...