Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
VLM
VLM
技术
VLM,视觉语言模型,融合计算机视觉与自然语言处理技术,用于图像/视频理解与多模态推理
23 次提及
29 个连接
最近出现: 2026-06-28
关系图谱
关系 (30)
使用技术 (16)
VLA
Goal2Skill
CARPRT
RAM
PrediMem
WEM
DIAL
G0.5
PhysX-Omni
PhysX-Anything
PaliGemma-2
PhysForge
Dexterity-BEV
VeraRetouch
ABot-Earth
Language-Action Pretraining
应用于 (9)
Direct Preference Optimization
图像生成
具身智能
图像分类
黑箱模型优化
人形机器人
3D生成
机器人
边缘计算
基于 (3)
GEN-1
UAM
VLA
使用 (2)
淘宝
Earth2Ocean
相关文章 (23)
1.
量子位 - VLM解几何题总翻车?GEODPO从「看」入手:用结构化表示+DPO优化,让模型先看懂再推理丨ICLR'26
2.
InfoQ - 大模型驱动下的生成式搜推:淘宝闪购全链路重构实践|QCon北京
3.
量子位 - Generalist最新长文定调:具身原生才是正道,中国玩家原力灵机已交卷
4.
Founder Park - 对话Ribbi:所有人都在做创作工具,我们在做一个有品味、会进化的「人」
5.
极市平台 - CVPR2026|无需额外训练!零成本迁移实现水下世界的精准开放词汇分割(数据集开源)
6.
具身智能之心 - VLA真的能走通吗?从pi0.7和VISTA出发看VLA的四大问题
7.
具身智能之心 - 重磅分享!RoboMemArena:一个全面且富有挑战性的机器人记忆基准
8.
具身智能之心 - WEM:把“世界”和“自我”分开,具身世界模型才能走得更远
9.
具身智能之心 - 让机器人到厨房里做一顿晚餐!清华等推出Goal2Skill:破解长时序操作难题
10.
机器之心 - 无需训练,如何提升黑箱VLM?CARPRT用「类别感知」给出答案
11.
DeepTech深科技 - 大模型外挂“三维物体知识库”来了,大幅增强机器人长程自主操作能力
12.
具身智能之心 - 清华&字节最新UAM:让机器人学会动手,却不忘记如何看懂世界
13.
量子位 - 把VLM塞进隐式世界模型,小鹏机器人新框架让机器人长出物理直觉
14.
具身智能之心 - 把VLM塞进隐式世界模型,小鹏机器人新框架让机器人长出物理直觉
15.
具身智能之心 - 不是VLA已死,是核心矛盾未破!星海图G0.5凭架构创新突破SOTA
16.
量子位 - 大晓机器人x南洋理工PhysX-Omni统一物理3D生成!一个框架搞定刚体-软体-关节体
17.
AI科技评论 - NTU曹子昂教授团队:破解3D标注成本难题,只需一张图片丨CVPR2026
18.
量子位 - 首次!纯人类视频预训练VLA灵巧操作,少量数据微调就能部署成功
19.
机器之心 - ICML2026PhysForge框架来了,让3D资产从静态模型变成可交互对象
20.
机器之心 - BEV杀入具身智能:跨维智能把机器人数据带上Scaling快车道
21.
量子位 - 0.6BVLM重塑AI修图推理流程,支持手机端侧部署,vivo+浙大出品
22.
CVer - 高德发布ABot-Earth:生成式三维地球模型,2D遥感影像生成3D世界!
23.
具身智能之心 - 看完LA4VLA后发现,移除视觉VLA反而学得更好。