GPT-SoVITS

目前中文最佳，支持通过5秒音频克隆、1分钟音频克隆，也支持通过完整训练来克隆。

主要特点：

输入5秒人声样本，体验即时语音合成转换。

仅用1分钟的训练数据微调模型，以提高语音相似性和真实感。

不同于训练集的语言推理，目前支持英语、日语和中文。

集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注，帮助初学者创建训练数据集和GPT/SoVITS模型。

相关导航

一个带web界面的声音克隆工具，使用你的音色或任意声音来录制音频

一种强大的文本生成音频模型，具有声音克隆和多种语音合成应用方面的功能。通过使用该模型，您可以生成高质量、个性化的音频内容

一个强大的深度学习文本到语音工具包，具有高度的可定制性和多语言支持。

一个声音克隆工具，可使用任何人类音色，将一段文字合成为使用该音色说话的声音，或者将一个声音使用该音色转换为另一个声音。

MessAuto 是一款 macOS 平台自动提取短信验证码并粘贴回车的软件，百分百由Rust开发，适用于任何APP，是 2FHey 的免费替代品。

腾讯AI实验室推出的 AI 绘图模型，效果类似 ControlNet，可以控制图片生成的效果

暂无评论...