Wan2.1_14B_FusionX 中文安装文档

模型介绍

FusionX 是基于 WAN 2.1 14B 精细融合多种研究模型构建的高性能视频生成模型,强化运动表现、场景一致性与细节还原度,实际表现可媲美部分顶级闭源模型。

主要特性

  • 支持标准 prompt 与 negative prompt
  • 输出流畅、电影风格的视频,时间一致性强
  • 可直接替代 WAN 2.1 的 T2V 模型,效果更佳
  • 搭配 SageAttn 时渲染速度提升达 50%
  • 完全支持 VACE 工作流
  • 针对 ComfyUI + Kaji Wan Wrapper 深度优化

模型安装方式

FusionX目前提供fp量化方式的模型和gguf量化的模型,同时可以配合ComfyUI官方支持wan2.1模型,也可以配合KiJai支持的wan2.1模型,所以模型较多而且复杂,请严格按照教程完成安装和模型放置。

一、diffusion_model下载:

该地址下载相应的模型,根据需求下载,比如文生视频模型,图生视频模型,phantom模型等,剩下两个是GGUF量化过的大模型,使用GGUF量化模型需要在ComfyUI中安装GGUF插件

WAN_FusionX_VACE模型可以在huggingface下载到GGUF量化后的模型。

根据需求下载相应的模型之后,放置到ComfyUI/models/diffusion_models文件夹当中。

二、umt5_xxl模型下载

该模型作为视频生成中对提示词进行编码的模型,必须下载并且放置到指定位置,目前wan2.1的生态中存在两种支持方式,一个是ComfyUI官方和kijai团队,两个团队对wan2.1的支持使用了不同的umt5模型,所以当我们使用ComfyUI官方节点完成视频生成需要使用官方的umt5模型,使用Kijai的wanvideowrapper插件完成视频生成需要使用kijai的umt5模型

1、ComfyUI官方umt5模型下载

huggingface的ComfyUI官方模型地址中,可以下载umt5模型,建议下载scaled模型,对显存占用较少。

下载之后放置到:ComfyUI\models\text_encoders文件夹即可。

2、Kijai的umt5模型下载

在kijai维护的huggingface仓库中,可以选择其中一个,下载umt5模型,放置位置和上面一致

三、Clip_vision模型下载

在使用图生视频的过程中,需要配合Clip_Vision模型完成图片视觉信息的提取,该模型在ComfyUI维护的官方仓库中可以下载。

该模型放置在:ComfyUI\models\clip_vision位置中。