Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Qwen3-VL-4B
Qwen3-VL-4B
模型
Qwen3-VL-4B,阿里云通义千问团队的多模态大模型,支持 256K 长上下文、3D 空间定位与长视频理解
6 次提及
11 个连接
首次出现: 2026-04-13
最近出现: 2026-06-11
关系图谱
关系 (11)
使用技术 (4)
微调
GRPO
SME2
HQQ
应用于 (2)
图像生成
多模态理解
基于 (2)
Video-o3
VLM³
使用 (2)
快手
MNN
发布 (1)
阿里巴巴
相关文章 (6)
1.
极市平台 - CVPR2026PortraitCraft挑战赛|开源5万张高质量数据集,首届多模态人像构图理解与生成大赛邀你打榜
2.
量子位 - SFT别急着接RL!你的多模态大模型可能一直在“带伤训练”
3.
极市平台 - ICML2026|让多模态大模型像人类一样看视频:原生工具调用长视频理解新框架Video-o3
4.
量子位 - 快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理
5.
CVer - Meta新作VLM³:视觉语言模型可以精通3D任务
6.
通义大模型 - 端侧AI提速80%?如何让Qwen3-VL在手机起飞