Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Qwen2.5-VL-7B
Qwen2.5-VL-7B
模型
Qwen2.5-VL-7B,阿里云开发的70亿参数视觉语言模型,擅长图像与文本处理,支持视觉问答和文档理解等任务
7 次提及
7 个连接
首次出现: 2026-04-03
最近出现: 2026-06-25
关系图谱
关系 (7)
基于 (5)
GTR-Turbo
Video-o3
SE-GA
PolyV
VideoTemp-o3
应用于 (1)
多模态理解
使用技术 (1)
RAG
相关文章 (7)
1.
量子位 - 别再花钱请GPT当老师了!GTR-Turbo用「历史经验」自我蒸馏,训练成本砍半,效果反超丨CVPR'26
2.
新智元 - 多模态大模型别盲目刷题!诊断-生成-强化闭环,找准盲点ICML'26
3.
极市平台 - ICML2026|让多模态大模型像人类一样看视频:原生工具调用长视频理解新框架Video-o3
4.
机器之心 - GUIAgent「记与学」双修,长程任务有了专属记忆增强型自进化框架
5.
AI科技评论 - CVPR2026模型适应性研究盘点:从保留旧知识,到适应真实世界
6.
PaperWeekly - ICML2026快手提出Agentic长视频框架,统一时序定位与深度理解
7.
机器之心 - 从「找视频」到「产视频」:快手RaG推动推荐系统迈向完全生成时代