Wan2.1_14B_FusionX 中文安装文档

模型介绍

FusionX 是基于 WAN 2.1 14B 精细融合多种研究模型构建的高性能视频生成模型，强化运动表现、场景一致性与细节还原度，实际表现可媲美部分顶级闭源模型。

主要特性

支持标准 prompt 与 negative prompt
输出流畅、电影风格的视频，时间一致性强
可直接替代 WAN 2.1 的 T2V 模型，效果更佳
搭配 SageAttn 时渲染速度提升达 50%
完全支持 VACE 工作流
针对 ComfyUI + Kaji Wan Wrapper 深度优化

模型安装方式

FusionX目前提供fp量化方式的模型和gguf量化的模型，同时可以配合ComfyUI官方支持wan2.1模型，也可以配合KiJai支持的wan2.1模型，所以模型较多而且复杂，请严格按照教程完成安装和模型放置。

一、diffusion_model下载：

在该地址下载相应的模型，根据需求下载，比如文生视频模型，图生视频模型，phantom模型等，剩下两个是GGUF量化过的大模型，使用GGUF量化模型需要在ComfyUI中安装GGUF插件。

WAN_FusionX_VACE模型可以在huggingface下载到GGUF量化后的模型。

根据需求下载相应的模型之后，放置到ComfyUI/models/diffusion_models文件夹当中。

二、umt5_xxl模型下载

该模型作为视频生成中对提示词进行编码的模型，必须下载并且放置到指定位置，目前wan2.1的生态中存在两种支持方式，一个是ComfyUI官方和kijai团队，两个团队对wan2.1的支持使用了不同的umt5模型，所以当我们使用ComfyUI官方节点完成视频生成需要使用官方的umt5模型，使用Kijai的wanvideowrapper插件完成视频生成需要使用kijai的umt5模型。

1、ComfyUI官方umt5模型下载

在huggingface的ComfyUI官方模型地址中，可以下载umt5模型，建议下载scaled模型，对显存占用较少。

下载之后放置到：ComfyUI\models\text_encoders文件夹即可。

2、Kijai的umt5模型下载

在kijai维护的huggingface仓库中，可以选择其中一个，下载umt5模型，放置位置和上面一致。

三、Clip_vision模型下载

在使用图生视频的过程中，需要配合Clip_Vision模型完成图片视觉信息的提取，该模型在ComfyUI维护的官方仓库中可以下载。

该模型放置在：ComfyUI\models\clip_vision位置中。