bbox_threshold:目标检测器的置信度阈值。
- 如果未能成功检测到目标,可以尝试降低该值以放宽筛选标准
- 如果检测结果中包含过多无关区域或背景干扰,可尝试提高该值,以增强目标筛选的精准度
bbox_dilation:检测框膨胀像素值,正值膨胀,负值收缩。
crop_factor:裁剪区域相对于检测框的倍数。如下,1.0的时候只显示裁剪目标区域。
drop_size:在检测过程中,若某个目标的 bbox 宽度或高度小于该数值,将被判定为无效目标并被丢弃,即不会生成对应的 mask 或 cropped image。
以下drop_size=10,此时还能生成相应的mask
以下drop_size=100,由于检测框bbox小于该尺寸被丢弃,没有生成相应的mask。
在启用了 sam_model_opt 或 segm_detector_opt 时,节点会为已有的 bbox 区域进一步生成细化的 mask(掩膜)。而剩下的几个sub_参数则是基于连接启用 sam_model_opt 或 segm_detector_opt 后使用的。
其中sub_threshold、sub_dilation、sub_bbox_expansion的使用方法和之前提到的bbox_threshold、bbox_dilation一样。
这里看一下sub_dilation和sub_bbox_expansion的区别。
参数名 | 作用对象 | 影响方式 | 应用阶段 |
---|---|---|---|
sub_dilation | 掩膜(mask)本体 | 对掩膜图像执行膨胀/收缩操作 | 掩膜生成后 |
sub_bbox_expansion | 掩膜的外接 bbox 区域 | 在生成掩膜前扩大 crop 区域边界 | 掩膜生成前(裁剪前) |
sam_mask_hint_threshold 是在启用 SAM 掩膜生成(即 sam_model_opt 被使用)时,用于控制 SAM 在参考提示(hint)掩膜时,哪些区域被视为“前景”的判断阈值。如果本身检测就很精准,该值就没有影响。
数值范围 | 行为效果 |
---|---|
较低(如 0.3) | 宽松,更多区域被视为前景 → 掩膜可能更大 |
较高(如 0.8) | 严格,只有置信度高的区域才作为前景 → 掩膜更干净、精细 |
post_dilation:对最终 mask 再次膨胀处理