comfyui_llm_party>🖥️GPT-SoVITS
comfyui_llm_party
时间:2025/11/03

🖥️GPT-SoVITS

“GPT-SoVITS”节点用于将输入的文本转换为语音(TTS),支持多语言和参考音色克隆。它结合 GPT 模型和 SoVITS 声码器,可以根据输入的文字、参考音频和提示文本生成拟真的人声语音文件,并返回音频对象和保存路径。该节点适合个性化语音合成、配音、语音助手等场景。
🖥️GPT-SoVITS-节点参数说明
输出参数
audio音频对象(包含波形和采样率)。
audio_path生成的音频文件路径。
控件参数
text要合成的文本。
text_lang输入文本语言(如 zh、en、ja、yue、ko 等)。
ref_audio_path参考音频路径,用于克隆音色。
prompt_text提示文本,提供额外的语气或风格参考。
prompt_lang提示文本的语言。
text_split_method文本切分方式(cut0 ~ cut5,不同规则影响停顿)。
batch_size批处理大小(通常设为 1)。
media_type输出音频格式(wav、raw、ogg、aac)。
GPT_weights_path自定义 GPT 模型权重路径。
Sovits_weights_path自定义 SoVITS 声码器权重路径。
is_enable是否启用该节点。


配置说明

   使用该节点之前,需要先先到GitHub下载GPT-SoVITS,可以使用git命令复制仓库: https://github.com/RVC-Boss/GPT-SoVITS.git

   下载之后双击go-API-v2.bat启动,等待启动完毕后,便可以执行工作流了。

广告

可加入知识星球获取所有示例工作流

广告

微信扫码入群,加入AIGC大家庭,与大家一起交流学习