Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
视觉定位
视觉定位
场景
视觉定位,根据自然语言文本描述在图像中定位出特定目标的任务,代表模型有Grounding DINO、Florence等
3 次提及
3 个连接
最近出现: 2026-05-24
关系图谱
关系 (3)
应用于 (3)
弱监督
CPL++框架
并行思考
相关文章 (3)
1.
极市平台 - TPAMI2026|弱监督视觉定位SOTA!北大彭宇新团队开源CPL++:无需密集标注,让视觉定位模型学会“自我纠偏”
2.
机器之心 - TPAMI2026北大彭宇新团队提出CPL++框架,实现视觉定位模型的「自知之明」和「自我纠错」
3.
机器之心 - ICML2026|首个视觉语言模型并行思考框架,一文解析内在机制