Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
VLM
VLM
技术
视觉语言模型,文中探讨其在几何任务上的感知瓶颈
8 次提及
11 个连接
最近出现: 2026-04-29
关系图谱
关系 (11)
应用于 (5)
Direct Preference Optimization
图像生成
具身智能
图像分类
黑箱模型优化
使用技术 (3)
VLA
Goal2Skill
CARPRT
使用 (2)
淘宝
Earth2Ocean
基于 (1)
GEN-1
相关文章 (8)
1.
量子位 - VLM解几何题总翻车?GEODPO从「看」入手:用结构化表示+DPO优化,让模型先看懂再推理丨ICLR'26
2.
InfoQ - 大模型驱动下的生成式搜推:淘宝闪购全链路重构实践|QCon北京
3.
量子位 - Generalist最新长文定调:具身原生才是正道,中国玩家原力灵机已交卷
4.
Founder Park - 对话Ribbi:所有人都在做创作工具,我们在做一个有品味、会进化的「人」
5.
极市平台 - CVPR2026|无需额外训练!零成本迁移实现水下世界的精准开放词汇分割(数据集开源)
6.
具身智能之心 - VLA真的能走通吗?从pi0.7和VISTA出发看VLA的四大问题
7.
具身智能之心 - 让机器人到厨房里做一顿晚餐!清华等推出Goal2Skill:破解长时序操作难题
8.
机器之心 - 无需训练,如何提升黑箱VLM?CARPRT用「类别感知」给出答案