插
件
列
表

ComfyUI原生节点

ComfyUI第三方插件

comfyui_llm_party

时间：2025/11/03

🖥️GPT-SoVITS

“GPT-SoVITS”节点用于将输入的文本转换为语音（TTS），支持多语言和参考音色克隆。它结合 GPT 模型和 SoVITS 声码器，可以根据输入的文字、参考音频和提示文本生成拟真的人声语音文件，并返回音频对象和保存路径。该节点适合个性化语音合成、配音、语音助手等场景。

🖥️GPT-SoVITS-节点参数说明

输出参数
audio	音频对象（包含波形和采样率）。
audio_path	生成的音频文件路径。
控件参数
text	要合成的文本。
text_lang	输入文本语言（如 zh、en、ja、yue、ko 等）。
ref_audio_path	参考音频路径，用于克隆音色。
prompt_text	提示文本，提供额外的语气或风格参考。
prompt_lang	提示文本的语言。
text_split_method	文本切分方式（cut0 ~ cut5，不同规则影响停顿）。
batch_size	批处理大小（通常设为 1）。
media_type	输出音频格式（wav、raw、ogg、aac）。
GPT_weights_path	自定义 GPT 模型权重路径。
Sovits_weights_path	自定义 SoVITS 声码器权重路径。
is_enable	是否启用该节点。

配置说明

使用该节点之前，需要先先到GitHub下载GPT-SoVITS，可以使用git命令复制仓库： https://github.com/RVC-Boss/GPT-SoVITS.git 。

下载之后双击go-API-v2.bat启动，等待启动完毕后，便可以执行工作流了。

可加入知识星球获取所有示例工作流

微信扫码入群，加入AIGC大家庭，与大家一起交流学习