Orpheus TTS开源模型：带来超低延迟与高情感表现的文本转语音新体验

AI快讯1年前 (2025)发布 niko

3月19日 ，一款名为OrpheusTTS的开源文本转语音模型闪亮登场。此模型凭借接近人类的情感表达、自然流畅的语音效果以及超低延迟的实时输出流特性，迅速吸引众人目光。

Orpheus TTS主打低延迟与高情感表现。在超低延迟方面，其默认延迟约200毫秒，通过对输入流与模型的KV缓存优化，延迟可压缩至25 -50毫秒，充分满足实时对话需求。在情感表达上，语音输出自然且流畅，能很好地贴近人类情感，支持多样的语调变化，极大提升了交互体验。而实时输出流特性，使其支持流式音频生成，保证语音生成与输入同步，适用于虚拟助手、客服系统等多种场景。

得益于低延迟与高自然度，OrpheusTTS在实时对话领域展现出广泛潜力。无论是智能语音助手、在线教育，还是虚拟主播和游戏角色配音，该模型都能提供更人性化的语音交互体验。其开源性质更为开发者带来了更多定制可能。

OrpheusTTS凭借情感表达、自然效果和超低延迟的组合，将TTS技术提升到新高度。它不仅提高了语音合成质量，还通过实时输出流为动态交互场景开辟了新局面。未来，这款模型有望成为开源TTS领域的标杆。

模型地址：https://github.com/canopyai/Orpheus-TTS

# AI快讯

文章版权归作者所有，未经允许请勿转载。