GPT-SoVITS

目前中文最佳，支持通过5秒音频克隆、1分钟音频克隆，也支持通过完整训练来克隆。

主要特点：

输入5秒人声样本，体验即时语音合成转换。

仅用1分钟的训练数据微调模型，以提高语音相似性和真实感。

不同于训练集的语言推理，目前支持英语、日语和中文。

集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注，帮助初学者创建训练数据集和GPT/SoVITS模型。

相关导航

一种强大的文本生成音频模型，具有声音克隆和多种语音合成应用方面的功能。通过使用该模型，您可以生成高质量、个性化的音频内容

一个强大的深度学习文本到语音工具包，具有高度的可定制性和多语言支持。

一个声音克隆工具，可使用任何人类音色，将一段文字合成为使用该音色说话的声音，或者将一个声音使用该音色转换为另一个声音。

一个带web界面的声音克隆工具，使用你的音色或任意声音来录制音频

一个用于实施代码的推理模型的项目。它提供了一种简便的方法来使用训练好的模型，以便生成代码。

一种用于构建人工智能代理的反应式运行时

暂无评论...