节点功能:基于 Florence-2 视觉基础模型识别并分割图像中的各种物体区域。
一般图像的分割只需用基础模型就行
在不更换提示词的情况下,模型一般默认都是对图片中的主体进行分割,整体上base_ft和large_ft表现更好,large_ft分割的更干净精准
- Region to Segmentation (区域分割):无需文本提示,自动识别图像中的所有可分割对象/区域
- Referring Expression Segmentation (参考表达式分割): 通过自然语言描述锁定特定目标(如"穿红裙子的女孩")
- Open Vocabulary Detection (开放词汇检测): 可检测训练数据中未出现的类别(如新兴产品名称)
这里更换了提示词为“upper clothes”,在Region to Segmentation模式下,此时base和large模型表现更好。
更换到Referring Expression Segmentation模式后,各模型的表现情况。
更换到Open Vocabulary Detection模式后,各模型表现情况是一样的。
试过好多种情况,该插件使用的模型分割效果不是很行,对于一般比较分明的单个物体分割还行,场景稍复杂的情况下就不行。语义分割推荐使用SegmentAnythingUltra相关节点。