ComfyUI高质量精选系列文章

置顶

Qwen-image-edit模型安装与使用

Qwen-Image-Edit 是 Qwen 团队推出的图像编辑模型，基于 Qwen-Image 能力强化而来，支持语义级别和外观级别的编辑，不仅能进行物体添加、删除、旋转、风格转换等复杂修改，还能精准处理中文和英文文字，保持字体和细节一致；在多个公开基准上达到领先效果，适合用于图像创意、修图和文字编辑等多种场景。

发布时间：2025/9/11

Qwen-image模型安装与使用

Qwen-Image是阿里巴巴 Qwen 团队发布的首个图像生成基础模型。它是一个基于 Apache 2.0 许可证开源的 20B 参数 MMDiT（多模态扩散变换器）模型。该模型在复杂文本渲染和精准图像编辑方面取得了显著进展，实现了包括英语、中文在内的多种语言的高保真输出。

发布时间：2025/8/29

Wan2.2 视频生成用法

Wan2.2是阿里巴巴开源的视频生成模型，采用 Mixture-of-Experts 架构（推理激活约 14B 参数），支持生成最高 720P 的 5 秒视频；相比 Wan2.1 扩充了大规模图像与视频数据，结合精细化的审美标注实现更强的电影级画面表现力，并在零样本泛化和视频动感上显著提升，适合高质量视频创作场景。

发布时间：2025/8/22

Flux-Kontext开源模型安装与使用

FLUX.1 Kontext是Black Forest Labs推出的突破性多态模型编辑模型，支持文本和图像同时输入，能够智能理解图像上下文并执行精准编辑。其开发版本是一个拥有120亿参数的开源辐射变形模型，具有出色的上下文理解能力和角色一致性保持，即使经过多次迭代编辑，也能确保人物特征、结构图布局等关键要素保持稳定...

发布时间：2025/6/28

Flux全生态汇总

Flux 是一款由黑森林实验室（Black Forest Labs）推出的先进图像生成模型，专为高质量文生图与图生图任务设计，具有极高的画面细节保留与风格一致性表现。该模型融合了黑森林实验室在风格迁移、控制生成、多模态融合等领域的技术积累，适用于摄影艺术、原画创作、商业广告等多种创意场景...

发布时间：2025/6/20

万相LoRA训练

万相 LoRA 模型的训练原则与 Flux LoRA 保持一致，均强调在数据集准备前需充分识别和区分主要特征与次要特征。在万相的视频训练中，还需特别注意其采用硬编码的 16 帧率机制，因此数据集中的**视频素材必须严格按照 16 帧每秒进行帧率控制。**若帧率不符合要求，即便帧数充足，仍有可能被训练流程自动丢弃...

发布时间：2025/6/5

Wan2.1 FushionX用法

FusionX 是基于 WAN 2.1 14B 精细融合多种研究模型构建的高性能视频生成模型，强化运动表现、场景一致性与细节还原度，实际表现可媲美部分顶级闭源模型...

发布时间：2025/6/14

蒙版检测

在 ComfyUI 中，蒙版（Mask）是图像生成流程中非常核心的组成部分，主要用于控制图像的生成区域与保留区域，实现更加精准、可控的编辑与合成。它本质上是一张黑白图，用于告诉模型“哪里需要改变，哪里保持原样”...

发布时间：2025/6/9

高清放大方法对比

由于大模型本身的性能限制，在 ComfyUI 中进行初步图像生成时通常只能以较低的分辨率（如 512×512 或 1024×1024）输出。然而，实际使用场景往往对图像的清晰度和尺寸有更高要求，因此图像的放大、修复或高清处理成为必不可少的环节。当前市面上存在众多放大模型和插件，不同的风格、用途及生成内容对放大方案的要求也存在显著差异，这为选择合适的方案带来了不小的挑战...

发布时间：2025/6/9

FLUX-LoRA-人物一致性-训练

人物一致性一直是图像生成中的难点之一。受到 Mick 大佬的实践经验启发，发现可以通过 LoRA 模型对人物特征进行有效控制，从而实现高一致性的人物生成。但是在实际应用前，需要完成一系列准备工作，包括数据集的生成、处理，以及 LoRA 模型的训练。为系统呈现这一完整流程，后续内容将以多篇文章的形式进行复现，并结合过程中的关键步骤与对比结果，全面展示人物一致性控制的可行方法与效果表现...

发布时间：2025/6/5

ComfyUI资源网站

在深入学习 ComfyUI 之后，用户将逐步接触到各种与 AI 生成相关的资源平台。当前，随着 AI 行业的迅猛发展和大量资本的涌入，网络上出现了许多模型分享与工作流下载的网站。然而，真正高质量的一手资料和核心资源，依然主要来自于科研与开源社区的前沿力量。以下四大平台，几乎构成了 ComfyUI 用户获取模型、源码、工作流的基础生态...

发布时间：2025/6/3