FantasyTalking Model Loader

节点功能:加载一个“说话人驱动的视频生成模型”中的音频条件投影模块(Audio Condition Projection Model),用于将音频特征转化为可用于视频生成的条件输入。

输出参数

参数名称说明
model封装了加载后的 FantasyTalking 投影模型和权重的字典

控件参数

参数名称说明
model从 ComfyUI/models/diffusion_models 目录中选择 Fantasy Talking 模型
base_precision设置模型加载时所使用的张量精度。可选值包括: - "fp32":32位浮点精度。 - "bf16":bfloat16 精度,推荐用于较新 GPU。 - "fp16":半精度浮点,显存占用小,速度快。

下图所示,为加载所需的模型,可以在kj的huggingface官方仓库找到模型的下载地址。