AI开源

GPT-SoVITS

目前中文最佳,支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆。

标签:

目前中文最佳,支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆。

主要特点:

输入5秒人声样本,体验即时语音合成转换。

仅用1分钟的训练数据微调模型,以提高语音相似性和真实感。

不同于训练集的语言推理,目前支持英语、日语和中文。

集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。

相关导航

暂无评论

暂无评论...