Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Qwen3-VL
Qwen3-VL
模型
Qwen3-VL,阿里云开发的基础视觉语言模型,支持图像与视频理解及视觉智能体能力
24 次提及
28 个连接
首次出现: 2026-03-30
最近出现: 2026-06-24
关系图谱
关系 (28)
基于 (8)
SpatialPoint
BARD-VL
CodePercept-8B-S1
CodePercept
CodePercept-8B-R1
AutoMoT
AFUN
Qwen-Robot
应用于 (6)
数据标注
3D生成
多模态理解
AI安全
图像生成
人形机器人
使用 (6)
PhysAssets 数据集
DreamLite
StarVLA
FreeOcc
VLA-JEPA
TeleAI
竞争 (5)
MOSS-VL
GPT-5
Gemini 3.1 Pro
Cosmos-Predict2
Unlimited OCR
使用技术 (2)
自回归模型
Transformer
发布 (1)
CMU
相关文章 (24)
1.
量子位 - 将深度信息作为VLM核心输入!视启未来×清华×IDEA帮机器人看懂物理世界
2.
机器之心 - CVPR2026|1分钟单图变4D视频!AI看图直接脑补物理规律
3.
CVer - CVPR20261分钟单图变4D视频!PhysGM:看图直接脑补物理规律
4.
量子位 - 准确回答视频细节!11B模型挑战视频理解「证据级」任务,开源可商用
5.
AIGC开放社区 - 比肩Z-Image!手机上实时图像生成、编辑模型!字节开源
6.
机器之心 - CVPR2026Highlight|让AI像电影人一样「看」视频,8B小模型反超GPT-5与Gemini-3.1-Pro
7.
机器之心 - 上智院联合复旦等开源BARD-VL:多模态Diffusion模型新SOTA
8.
CVer - 刷新SOTA!BARD-VL:多模态扩散模型重磅开源
9.
机器之心 - VLA的PyTorch时刻已至!港科大联手社区开源StarVLA:一个框架揭秘所有主流VLA
10.
机器之心 - CVPR2026别卷推理了!当前大模型STEM短板在于「视觉感知」,代码才是破局关键
11.
AI科技评论 - 代码驱动的视觉感知:为什么说「看得懂代码」才是大模型攻克理科题的真正钥匙|CVPR2026
12.
CVer - CVPR2026上海交大和阿里Qwen团队新作CodePercept:代码驱动的视觉感知
13.
机器之心 - RSS-2026港科大(广州)开源首个无需训练的开放词汇3D占据地图构建系统
14.
机器之心 - ICML2026AutoMoT-B2D&nuScense双SOTA,重新思考VLM和端到端驾驶的结合
15.
CVer - ICML2026小米汽车新作AutoMoT:重新思考VLM和端到端驾驶的结合
16.
量子位 - 11个数据集全拿SOTA!机器人终于既会“看”又会“动”了
17.
CVer - CVPR2026最佳论文候选!港中深王方鑫团队提出3DReflecNet:大规模3D重建数据集
18.
机器之心 - 图片越糊越危险?西湖大学发现多模态大模型「攻击舒适区」
19.
通义大模型 - Qwen-Robot发布:打通大模型到物理世界的最后一公里
20.
机器之心 - 沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍
21.
新智元 - 刚刚,百度开源拿下全球第一!作者疑似DeepSeek出走大神
22.
机器之心 - LeCun、谢赛宁转发的世界模型与VLA共融方案:中关村学院ECCV2026—VLA-JEPA
23.
极市平台 - ECCV2026|LeCun、谢赛宁转发的世界模型与VLA共融方案VLA-JEPA
24.
具身智能之心 - 人形机器人最难的不是走路,而是手脚并用,TeleAI提出OASIS实现仿真数据和模型闭环