目前中文最佳,支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆。
主要特点:
输入5秒人声样本,体验即时语音合成转换。
仅用1分钟的训练数据微调模型,以提高语音相似性和真实感。
不同于训练集的语言推理,目前支持英语、日语和中文。
集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。
相关导航
暂无评论...
目前中文最佳,支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆。
主要特点:
输入5秒人声样本,体验即时语音合成转换。
仅用1分钟的训练数据微调模型,以提高语音相似性和真实感。
不同于训练集的语言推理,目前支持英语、日语和中文。
集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。