ComfyUI_Sonic插件

前言

ComfyUI_Sonic 是一个 AI 语音驱动的嘴型同步插件,用于实现 AI 数字人、虚拟角色、动画生成 的音频驱动动画效果。它可以将音频波形数据转换为嘴型变化数据,从而驱动 AI 角色的嘴型动画,实现“语音-嘴型匹配”。


安装方法

第一种

通过manager搜索 sonic下载即可。

FjEGOu5fqnqyxFcYoLAP_25YwqkP

第二种

  1. 进入 ComfyUI 的 custom_nodes 目录,并打开cmd
  2. 使用以下命令克隆仓库:
git clone https://github.com/smthemex/ComfyUI_Sonic.git

FhAleyKdhYUx-pi3jZn7DxPSs6VQ

  1. 进入文件夹
cd ComfyUI_Sonic
  1. 安装相应库文件

==虚拟环境==

pip install -r requirements.txt

==内置python环境==

python -m pip install -r requirements.txt

模型下载

模型下载:点击下载1|点击下载2(两个链接中的文件都要下载),按以下目录结构放置

ComfyUI/models/sonic/
    |-- audio2bucket.pth
    |-- audio2token.pth
    |-- unet.pth
    |-- yoloface_v5m.pt
    |-- whisper-tiny/
        |--config.json
        |--model.safetensors
        |--preprocessor_config.json
    |-- RIFE/
        |--flownet.pkl

image-20250521174602680

SVD checkpoints下载: svd_xt.safetensors | svd_xt_1_1.safetensors(这两个文件随便选择一个下载,svd_xt_1_1小一些)按以下目录结构放置

ComfyUI/models/checkpoints
    ├── svd_xt.safetensors  or  svd_xt_1_1.safetensors