OpenAI 开放全能AI模型GPT-4o,功能升级引领AI新时代

AI快讯6个月前更新 niko
9 0 0

在人工智能技术快速发展的今天,AI产品的竞争激烈程度日益加剧。据媒体报道,OpenAI于近日举行了春季线上直播活动,宣布推出了新旗舰AI模型——GPT-4o,并计划推出Mac版ChatGPT。这一系列动作预示着AI产品将迈入一个新的阶段,为用户提供更为丰富的交互体验和更高级别的智能服务。

GPT-4o的全面开放与性能提升

GPT-4o是一款集合了实时跨文本、音频和视觉推理能力的全能AI模型。该模型向所有用户免费开放,其API定价仅为GPT-4 Turbo的一半,而处理速度是GPT-4 Turbo的两倍。对于付费的ChatGPT Plus用户,他们将享有增加5倍的调用额度,并能优先体验GPT-4o的全新macOS桌面应用和最新语音及视频功能。

在实时语音翻译方面,GPT-4o展现了自然流畅的语转换能力,几乎可以取代传统的同声传译。它不仅响应快速、回答准确,还能根据用户的指令改变说话的语气,从生硬到幽默,从严肃到娇羞,GPT-4o都能轻松应对。此外,GPT-4o还能根据指令高歌一曲,其音效与真人演唱别无二致。

实时视频交互与屏幕内容理解

GPT-4o的实时视频交互能力也是此次升级的亮点之一。通过视频,GPT-4o可以理解线性方程,甚至学会“看脸色”,通过分析人的表情和语调判断情绪。此外,GPT-4o能够直接查看用户的屏幕,并根据屏幕显示的内容回答问题。例如,用户展示一段代码,GPT-4o便能够理解代码的功能并指出其中的错误,或对数据图表进行解读。

合作伙伴关系的深化与生态构建

发布节奏之快令人应接不暇,仅半小时的直播中便展示了众多苹果设备的应用,显示出OpenAI与苹果合作的紧密关系。从今日起,无论是免费还是付费用户,均可体验GPT-4o的新功能。目前,测试阶段的新功能仅限于ChatGPT Plus用户,但预计将在未来几周内全面向公众开放。文本和图像输入功能已在当天推出,而语音和视频功能则将在随后的几周内上线。

开放API与技术普及

OpenAI还宣布向开发人员开放GPT-4o的API,以便他们基于此进行AI应用的开发和部署。与GPT-4-Turbo相比,新模型的速度快了两倍,价格减少了一半,速率限制也放宽到了五倍。

面向未来的展望

在发布结束后,OpenAI的CTO Mira Murati暗示了公司未来的发展方向,她表示,OpenAI将持续推动技术的界限,不久将发布名为“下一件大事”的创新产品。此外,OpenAI联合创始人Sam Altman在社交媒体上留下了“her”的神秘信息,似乎在暗示GPT-4o在AI领域所取得的成就。

随着OpenAI新品发布会的举行,我们有理由相信,AI行业将迎来新一轮的创新浪潮。谷歌和其他AI领域的竞争者将如何回应这一挑战,值得我们共同期待。

© 版权声明

相关文章

暂无评论

暂无评论...