Wesum AI

视觉定位

场景

视觉定位,根据自然语言文本描述在图像中定位出特定目标的任务,代表模型有Grounding DINO、Florence等

3 次提及3 个连接最近出现: 2026-05-24

关系图谱

关系 (3)

相关文章 (3)