视觉定位

场景

视觉定位，根据自然语言文本描述在图像中定位出特定目标的任务，代表模型有Grounding DINO、Florence等

3 次提及3 个连接最近出现: 2026-05-24

关系图谱

关系 (3)

应用于 (3)

弱监督 CPL++框架并行思考

相关文章 (3)