ComfyUI_LayerStyle_Advance

LayerMask: Object Detector YOLO World(Obsolete)

节点功能:基于YOLO模型的对象检测器,用于在图像中检测特定对象并返回检测框和预览图像。


LayerMask: Object Detector YOLO World(Obsolete)-节点参数说明
输入参数
image输入图像,支持多图批量处理。
输出参数
bboxes每张图像对应的边界框集合,格式为 [x1, y1, x2, y2]。
preview预览图像,图中绘制了选中的边界框。
控件参数
yolo_world_model所选的 YOLO-WORLD 模型 ID。可选项包括:yolo_world/v2-x, v2-l, v2-m, v2-s, l, m, s。 推荐 v2-x 用于效果优先,v2-s 用于速度优先。
confidence_threshold检测置信度阈值,范围为 0~1。置信度越高,结果越精准但检测项越少。建议初始值为 0.05,再按需调节。
nms_iou_threshold非极大值抑制的 IOU 阈值,范围为 0~1。控制相邻框的合并,建议设置为 0.3。数值越高,保留的重叠框越多。
prompt自然语言类目提示词。
sort_method检测框排序方式。 可选值如下: • area:按面积排序。 • left2right:按 X 轴排序。 • top2bottom:按 Y 轴排序。 • random:随机排序。
bbox_select检测框选择方式。 可选值如下: • all:全部返回。 • first:第一个框。 • last:最后一个框。 • range:指定范围。 • index:指定索引。
select_index指定选中的框索引,如 0,1 或 1-3。

confidence_threshold(置信度阈值)越高,检测结果越精准,但也更容易漏检一些目标,比如下图,0.5的时候有一部分车辆没检测到;相反,阈值越低,检测到的目标数量更多,但可能会引入误检,将非目标类别的物体也误判为目标。

nms_iou_threshold它是前一步的操作。它是检测框间交并比(IoU)的一个阈值,当两个检测框的IoU大于该值,系统会选择置信度较高的检测框,同时剔除低置信度的框。所以这个值不用怎么调整,如果预览图中某个物体上有多个框,则需要把这个值调大


从下图可以看到,yolo_world比yolo_world_v2更强,l>m>s

关于其他参数的用法大家可参照LayerMask: Object Detector Florence2(Advance)节点文章