OpenAI 开放全能AI模型GPT-4o，功能升级引领AI新时代

AI快讯2年前 (2024)更新 niko

在人工智能技术快速发展的今天，AI产品的竞争激烈程度日益加剧。据媒体报道，OpenAI于近日举行了春季线上直播活动，宣布推出了新旗舰AI模型——GPT-4o，并计划推出Mac版ChatGPT。这一系列动作预示着AI产品将迈入一个新的阶段，为用户提供更为丰富的交互体验和更高级别的智能服务。

GPT-4o的全面开放与性能提升

GPT-4o是一款集合了实时跨文本、音频和视觉推理能力的全能AI模型。该模型向所有用户免费开放，其API定价仅为GPT-4 Turbo的一半，而处理速度是GPT-4 Turbo的两倍。对于付费的ChatGPT Plus用户，他们将享有增加5倍的调用额度，并能优先体验GPT-4o的全新macOS桌面应用和最新语音及视频功能。

在实时语音翻译方面，GPT-4o展现了自然流畅的语转换能力，几乎可以取代传统的同声传译。它不仅响应快速、回答准确，还能根据用户的指令改变说话的语气，从生硬到幽默，从严肃到娇羞，GPT-4o都能轻松应对。此外，GPT-4o还能根据指令高歌一曲，其音效与真人演唱别无二致。

实时视频交互与屏幕内容理解

GPT-4o的实时视频交互能力也是此次升级的亮点之一。通过视频，GPT-4o可以理解线性方程，甚至学会“看脸色”，通过分析人的表情和语调判断情绪。此外，GPT-4o能够直接查看用户的屏幕，并根据屏幕显示的内容回答问题。例如，用户展示一段代码，GPT-4o便能够理解代码的功能并指出其中的错误，或对数据图表进行解读。

合作伙伴关系的深化与生态构建

发布节奏之快令人应接不暇，仅半小时的直播中便展示了众多苹果设备的应用，显示出OpenAI与苹果合作的紧密关系。从今日起，无论是免费还是付费用户，均可体验GPT-4o的新功能。目前，测试阶段的新功能仅限于ChatGPT Plus用户，但预计将在未来几周内全面向公众开放。文本和图像输入功能已在当天推出，而语音和视频功能则将在随后的几周内上线。

开放API与技术普及

OpenAI还宣布向开发人员开放GPT-4o的API，以便他们基于此进行AI应用的开发和部署。与GPT-4-Turbo相比，新模型的速度快了两倍，价格减少了一半，速率限制也放宽到了五倍。

面向未来的展望

在发布结束后，OpenAI的CTO Mira Murati暗示了公司未来的发展方向，她表示，OpenAI将持续推动技术的界限，不久将发布名为“下一件大事”的创新产品。此外，OpenAI联合创始人Sam Altman在社交媒体上留下了“her”的神秘信息，似乎在暗示GPT-4o在AI领域所取得的成就。

随着OpenAI新品发布会的举行，我们有理由相信，AI行业将迎来新一轮的创新浪潮。谷歌和其他AI领域的竞争者将如何回应这一挑战，值得我们共同期待。

# AI快讯

文章版权归作者所有，未经允许请勿转载。