ComfyUI-Impact-Pack>Simple Detector (SEGS)
ComfyUI-Impact-Pack

Simple Detector (SEGS)

节点功能:使用 BBOX_DETECTOR 进行目标检测,并可选择性地结合 SAM_MODEL 或 SEGM_DETECTOR 来生成改进的 SEGS。
Simple Detector (SEGS)-节点参数说明
输入参数
bbox_detector主检测器模型(如 YOLO, RTMDet)。
image输入图像(单张)。
sam_model_opt可选 SAM 模型,用于从 SEGS 中心点生成精细掩码。推荐用于人脸、人物、边界清晰对象。
segm_detector_opt可选语义分割模型,用于掩码细化,若未提供 SAM 可作为替代方案。
输出参数
SEGS包含结构化区域的元组 (H, W), [SEG, SEG, ...],每个 SEG 含图像、掩码等字段。
控件参数
bbox_threshold主检测器的置信度阈值。默认值为 0.5。
bbox_dilation对 bbox 掩码进行膨胀或腐蚀的像素值。默认值为 0。正值为膨胀,负值为腐蚀。
crop_factorbbox 裁剪区域的放大倍数。默认值为 3.0。
drop_size忽略宽或高小于该值的检测目标。默认值为 10。有效过滤误检的小目标,建议值为 10~50。
sub_thresholdSAM 或语义分割掩码的置信度阈值。默认值为 0.5。控制细化掩码中的区域保留强度。
sub_dilationSAM 或 Segm 掩码的膨胀像素。默认值为 0。正值扩展边界,负值收缩掩码。
sub_bbox_expansionSAM 推理时 bbox 的扩展像素。默认值为 0。控制 SAM 提示区域大小。
sam_mask_hint_thresholdSAM 多点掩码提示的合并阈值。默认值为 0.7。控制 SAM 掩码生成的点筛选精度。
post_dilation对最终输出的 SEGS 掩码做统一膨胀或腐蚀。默认值为 0。用于最后阶段的整体边界修整。

bbox_threshold:目标检测器的置信度阈值。

  • 如果未能成功检测到目标,可以尝试降低该值以放宽筛选标准
  • 如果检测结果中包含过多无关区域或背景干扰,可尝试提高该值,以增强目标筛选的精准度

bbox_dilation:检测框膨胀像素值,正值膨胀,负值收缩。

crop_factor:裁剪区域相对于检测框的倍数。如下,1.0的时候只显示裁剪目标区域。

drop_size:在检测过程中,若某个目标的 bbox 宽度或高度小于该数值,将被判定为无效目标并被丢弃,即不会生成对应的 mask 或 cropped image。

以下drop_size=10,此时还能生成相应的mask

以下drop_size=100,由于检测框bbox小于该尺寸被丢弃,没有生成相应的mask。

在启用了 sam_model_opt segm_detector_opt 时,节点会为已有的 bbox 区域进一步生成细化的 mask(掩膜)。而剩下的几个sub_参数则是基于连接启用 sam_model_opt segm_detector_opt 后使用的。

其中sub_thresholdsub_dilation、sub_bbox_expansion的使用方法和之前提到的bbox_threshold、bbox_dilation一样

这里看一下sub_dilationsub_bbox_expansion的区别。

参数名作用对象影响方式应用阶段
sub_dilation掩膜(mask)本体对掩膜图像执行膨胀/收缩操作掩膜生成后
sub_bbox_expansion掩膜的外接 bbox 区域在生成掩膜前扩大 crop 区域边界掩膜生成前(裁剪前)

sam_mask_hint_threshold 是在启用 SAM 掩膜生成(即 sam_model_opt 被使用)时,用于控制 SAM 在参考提示(hint)掩膜时,哪些区域被视为“前景”的判断阈值。如果本身检测就很精准,该值就没有影响。

数值范围行为效果
较低(如 0.3)宽松,更多区域被视为前景 → 掩膜可能更大
较高(如 0.8)严格,只有置信度高的区域才作为前景 → 掩膜更干净、精细

post_dilation:对最终 mask 再次膨胀处理

广告

可加入星球获取所有示例工作流~

广告

微信扫码入群,加入AIGC大家庭吧!

如您有任何疑问和网站建议,也欢迎加入我们的QQ交流群!

QQ群:128763578