Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
多模态
多模态
场景
多模态,AI同时理解和处理文本、图像、音频、视频等多种数据模态的综合应用领域,代表模型/产品有GPT-4o、Claude 3.5、Gemini等
3 次提及
6 个连接
首次出现: 2026-04-08
最近出现: 2026-04-20
关系图谱
关系 (3)
使用技术 (2)
MODMAP
VTLA
应用于 (1)
具身智能
相关文章 (3)
1.
极市平台 - CVPRF2026|博洛尼亚大学开源MODMAP:跨视图调制+跨模态映射,3D异常定位更精准
2.
机器之心 - 国内首个!加入六维力的全感知数采,让VLA模型进化出力触觉
3.
具身智能之心 - 不是VLA或者WAM,具身的终极目标是把人类的能力复制放大.......