随着圣诞节的第九天的到来,为广大第三方开发者带来一份特别的礼物——升级版的o1 API。o1 API作为最新、最强大的模型支持,为开发者消息、结构化输出、视觉功能和函数调用能力打开了新的大门,极大地扩展了开发语音类App的潜力,并实现了成本的大幅降低。
全新功能与优化体验
自9月推出o1预览版以来,开发者们基于API构建了众多应用程序,包括智能体、客户支持、财务分析及编程工具等,取得了显著的进展。这一次,不仅解决了API中缺少的一些核心功能,还引入了推理强度参数,使得在处理简单问题时能够节省时间与成本,而在复杂问题上则能够灵活分配更多资源。
新增的开发者消息功能,是系统消息的升级形式,允许开发者完全控制模型遵循指令的顺序,而视觉输入功能为产业如制造业、科学研究等领域带来便利。通过案例演示,模型能够识别出故意填错数字的表格图片中的错误,并修正。此外,API中的结构化输出使开发者可以直接提取JSON,并以清晰直观的方式显示错误和修正方案。
API功能综合评估
o1模型的升级不仅增强了函数调用能力,其结构化输出能力也得到了显著提升,它在根据特定条件指令执行任务时表现更佳,且编码方面的性能也远超过预览版本和其他模型。在实时性上,o1 API运行速度更快,成本更低,因为它使用的推理Token比之前的预览版本减少了60%。
虽然目前暂不推出更高级版本的API,但OpenAI从今天起将开放函数调用、编码、结构化输出等重要功能的访问权限给第五级用户,并在未来几周内扩展到所有用户。
实时API技术的新突破
Realtime API自10月初公测以来,已经向开发者们展示了其强大的实时语音能力,现在可以通过支持WebRTC实现更多功能。开发者可以构建更多酷炫的应用,例如订餐AI助手或旅游AI助手等。WebRTC支持动态比特率调整和回声消除,使得实时API在网络变化中更加稳定。一个通过HTML代码演示的demo清晰展示了音频元素、对等连接等如何与API连接,提供了方便的操作方式。与WebSocket相比,Realtime API集成的代码行数大大减少,使得开发者更容易上手,极大地简化了集成流程。
偏好微调与定制化体验升级
开发者现在可以通过新的微调方法——偏好微调,配合直接偏好优化(DPO),创建更符合用户偏好的定制模型。该方法适用于需要考虑语气、风格和创造力的任务,帮助模型学会区分响应间的差异。通过上传偏好数据,微调过程将优化模型,使模型更能满足客户需求。
这一次的发布是开发者的大礼包。o1 API的全面升级、实时API的技术新突破以及偏好微调功能,均为开发者提供了更加丰富和便捷的工具。OpenAI持续推出新功能,致力于提升开发者体验和产品质量,并简化了登录、注册、获取API密钥的流程,进一步方便了开发者的加入和使用。同时,官方YouTube页面也将公开这些开发者日视频,提供更多学习和交流的机会。