AI音频工具AI声音克隆AI极客工具音频精选

GPT-SoVITS

一款强大的开源声音克隆工具,只需5秒声音样本就能零样本文本到语音(TTS)转换。

标签:
GPT-SoVITS是一款强大的开源Python RAG框架。它主要用于声音克隆和文本到语音转换。只需5秒声音样本就能零样本文本到语音(TTS)转换,输入1分钟训练数据即可微调模型,提升声音相似度和真实感。支持中文、英文、日文的语音推理,还具备跨语言支持能力,可进行与训练数据集不同语言的推理。其WebUI集成了声音伴奏分离、自动训练集分割等工具,方便初学者创建训练数据集和模型,并且完全本地运行,安全可靠,能杜绝隐私泄露