VALL_E_X语音克隆带6款模型-整合版
温馨提示:
本文最后更新于 2024年04月17日,已超过 508 天没有更新。若文章内的图片失效(无法正常加载),请留言反馈或直接联系我。
简介:
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。
使用教程
1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。
2.模型将用您的音频提示相同的声音合成给定文本的语音。
3.该模型还倾向于保留您给定语音的情感和声学环境。
图片:
添加好友,回复“源码”获取该资源
- 本文标签: 源码大全
- 本文链接: https://www.wtyicyai.com/article/12248
- 版权声明: 本文由余怡原创发布,转载请遵循《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权