ComfyUI_LayerStyle_Advance

LayerUtility: JoyCaption2 Split(Advance)

节点功能:基于加载的 JoyCaption2 模型,可为输入图像生成专业格式的描述文本。


LayerUtility: JoyCaption2 Split(Advance)-节点参数说明
输入参数
image输入的图像列表。
joy2_model由 LoadJoyCaption2Model 节点加载的模型与设备。
extra_options附加参数结构,包括扩展信息与角色名等。
输出参数
text每张图像对应的生成文本,格式为字符串数组。
控件参数
caption_type指定生成的描述风格。可选值包括: - Descriptive(正式描述) - Descriptive (Informal)(轻松口语风格) - Training Prompt(训练用提示) - MidJourney - Booru tag list - Booru-like tag list - Art Critic - Product Listing - Social Media Post
caption_length生成描述的长度要求。可选值包括: - any - very short - short - medium-length - long - very long 或指定字符数(如 30~260)
user_prompt用户自定义提示词,用于引导描述内容。
max_new_tokens最大生成 token 数量。
top_pnucleus sampling 截断概率,控制多样性。
temperature温度系数,控制采样随机性。
  • Descriptive:客观描述图像内容,语言中性、清晰,适用于通用图像识别任务。
  • Descriptive (Informal):描述图像内容但更具口语化和随意感,适合轻松场景或社交平台。
  • Training Prompt:专为模型训练设计,通常结构化明确,方便模型学习图像与文字之间的对应关系。
  • MidJourney:模仿 MidJourney 风格的提示词,通常以简短、有美学导向的关键词构成,用于 AI 图像生成。
  • Booru tag list:使用类似 Danbooru 图站的标签格式,关键词以英文小写、下划线连接,精细标注图像元素。Booru-like tag list:类似 Booru,但可能不完全遵循其标准,稍微自由一些的标签列表。
  • Art Critic:从艺术评论视角出发,对图像进行评价和解释,常用于艺术作品的生成或理解。
  • Product Listing:类似商品描述风格,强调功能、特点和适用场景,适用于电商类图像或商品推广。
  • Social Media Post: 模仿社交媒体发布内容,风格生动、引人注目,适合用作生成图像的标题或文案。

caption_length: 精确控制描述长度。

user_prompt: 自定义引导提示词,设置为cloud后,则与cloud有联系的场景描述更多了。