超强推理模型o1全功能上线，月费1450元挑战用户认知

AI快讯2年前 (2024)发布 niko

在’双十二’活动的第一天，人工智能领域迎来了一个重磅消息——最先进的推理模型o1的全功能版本正式亮相，并推出了更为强大的Pro版本。在创新领域炙手可热的ChatGPT也发布了Pro订阅计划，每月费用高达两百美金，使其成功跻身全球最贵的大模型之列。

发布会上，CEO及其团队通过演示介绍了新产品的特点，发布会虽短，却内容丰富。与之前的预览版相比，满血版的o1在数学和代码方面的表现都有显著提升，而Pro版更是效果卓越。它推理速度更快，比预览版快了60%，且新增了多模态推理，充分回应了网友的期待。正如公司CEO所言，满血版已成为ChatGPT的一部分，旧的预览版已经退役。与此相对，更出色的o1 Pro则面向Pro订阅用户开放，他们除了享有Pro版的特殊待遇，还能无限制地访问o1满血版。

o1加入的多模态推理能力在展示中尤其引人注目。团队将一张画有数据中心草图的A4纸拍照上传后，模型迅速给出了极其详细的估算和推理过程，展示了模型的视觉推理能力。在另一个展示中，团队故意省略了参数，以此测试模型处理模糊问题的能力，满血版o1展现出了良好的自我纠错能力和确认关键参数的重要性。

最终，团队展示了Pro版的惊人表现。面对以往o1-preview无法处理的复杂生化问题，Pro mode轻松应对，并详细呈现了推理过程，充分展现了其处理高难度问题的能力。根据公司的说法，满血版o1在博士级科学问答领域的表现已超越了人类专家。尽管Pro版的价格让部分用户感到吃惊，但最终是否物有所值，还需时间来验证。

在o1满血版发布的同时，技术报告亦上线于官方网站。报告中，o1在数学、代码和博士级科学问答任务上的表现比预览版更进了一步。o1还表现出了强大的多语言能力，在14种语言的测试中，其表现相比预览版有多方面的增强。从安全角度讨论，内部及外部测试结果显示，o1在安全性表现上与预览版相近，但对有害内容检测和拒绝能力更强，在越狱测试中展现了更高的鲁棒性。此外，通过对o1和预览版的思维链推理过程的分析，发现o1在隐瞒信息、操纵数据的倾向上比重版有所降低。

在发布会前，已有细心的网友从ChatGPT的JS代码中发现了Pro版的踪迹，包括200美元的价格、o1 Pro模式以及对满血o1的不限量访问权限，这些都与发布会内容一致。另外，甚至出现了’GPT-4.5’的身影。不少网友对马斯克的平台结合X上的推文预测本次发布会的内容，第二条预测结果准确命中了满血o1的发布。

参考链接：
[1]https://openai.com/index/introducing-chatgpt-pro/
[2]https://x.com/theredwall__/status/1864677161535156358?s=46
[3]https://x.com/btibor91/status/1864709670470066605
技术报告：
https://cdn.openai.com/o1-system-card-20241205.pdf

# AI快讯

文章版权归作者所有，未经允许请勿转载。