Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
LLaVA-OneVision-2.0
LLaVA-OneVision-2.0
模型
基于编解码器密集视频输入策略的开源视频理解大模型
2 次提及
8 个连接
首次出现: 2026-05-20
最近出现: 2026-06-03
关系图谱
关系 (8)
使用技术 (4)
LoongForge
OneVision-Encoder
视频编解码器
多模态理解
基于 (2)
OneVision-Encoder
Qwen3-8B
发布 (1)
格灵深瞳
应用于 (1)
视频生成
相关文章 (2)
1.
InfoQ - 对话灵感实验室:全帧率VLM、低成本与分层部署,业务现场不止需要炫技模型
2.
机器之心 - 多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读