节点功能:基于Segment Anything Model (SAM) 的高级图像分割和处理。该节点可为给定图像中的指定目标生成准确的像素级遮罩。
基于检测到的bbox精准分割蒙版
节点功能:基于Segment Anything Model (SAM) 的高级图像分割和处理。该节点可为给定图像中的指定目标生成准确的像素级遮罩。
输入参数 | |
image | 输入的图像张量。 |
bboxes | 每张图像对应的一组 bbox 列表。 |
输出参数 | |
image | 叠加 alpha 通道的 RGBA 图像。 |
mask | 掩码图,范围为 [0~1]。 |
控件参数 | |
sam2_model | SAM2 模型文件名,支持 2.0 与 2.1 多个大小版本。 |
precision | 模型精度,选项包括 fp16、bf16、fp32。 |
bbox_select | 控制选择哪种 bbox,选项为 all、first、by_index。all 表示使用所有 bbox,first 表示仅用第一个,by_index 可手动指定索引(适合复杂过滤需求)。 |
select_index | 逗号分隔的索引字符串,如 "0,2"。 |
cache_model | 是否在处理后将模型缓存到 GPU/CPU 以复用。 |
detail_method | 掩码细化方法。 VITMatte:基于视觉 Transformer 架构,效果精细但依赖模型文件的边缘细化算法。 VITMatte(local):本地化的 VITMatte,同样精细且在本地运行,对设备要求高。 PyMatting:基于 Python,灵活开源,在复杂场景精细度稍逊的边缘处理算法。 GuidedFilter:轻量级,计算量小,适合在设备性能有限时保留细节的边缘细化算法。 |
detail_erode | 腐蚀次数(trimap中黑区扩大)。越大则抠图边界越硬,常配合细节细化使用,默认 6 已较清晰。 |
detail_dilate | 膨胀次数(trimap中白区扩大)。越大则边缘更模糊,适当调节获得柔和边缘。 |
black_point | 蒙版映射中黑点阈值。 |
white_point | 蒙版映射中白点阈值。 |
process_detail | 是否启用 mask 细化后处理。 |
device | 模型推理设备,可选 cuda 或 cpu。 |
max_megapixels | VITMatte 模型最大处理分辨率(单位:百万像素)。 |
基于检测到的bbox精准分割蒙版