近日,在竞争激烈的播客领域,Podcastle平台有重大动作,全新的AI文本转语音模型Asyncflowv1.0正式亮相。此模型为用户带来惊喜,提供了多达450种以上不同的AI语音选项,极大地丰富了用户的选择空间。不仅如此,Podcastle还向开发者开放APi接口,方便开发者将这一强大的文本转语音功能集成到自身应用程序中。
Podcastle的创始人ArtoYeritsyan透露,开发文本转语音模型一直是公司的目标,但过去因训练成本高昂和数据需求大而搁置。随着大型语言模型技术的进步,Podcastle去年取得关键突破,成功构建出高质量语音模型。值得一提的是,去年获得的1350万美元A轮融资为其技术创新提供了有力支持。
价格方面,Podcastle展现出明显优势。其文本转语音服务定价为每500分钟约40美元,而竞争对手ElevenLabs则收取99美元。除价格优势外,Podcastle的语音克隆功能也迎来升级。训练过程从之前需朗读70句不同句子,大幅缩短至现在仅需几秒录音。这得益于去年推出的MagicDust AI技术,显著提升了音频录制质量。
实际测试中,新生成语音虽稍带机器人感,但能较好模仿说话者语调。Podcastle表示,该功能会持续改进,用户也可通过不同录音样本训练出多样声音效果。
Yeritsyan指出,Podcastle除成本优势外,将音频、视频、播客和AI驱动的叙述工具整合到重新设计的网站中,这一独特举措将使其在竞争中脱颖而出。目前虽多数用户用其进行音频内容创作,但视频制作需求正逐渐增长。入口:https://podcastle.ai/ai-voices 。
© 版权声明
文章版权归作者所有,未经允许请勿转载。