Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
视频理解
视频理解
场景
视频理解,AI 对视频内容进行时序分析、动作识别和语义推理的综合应用,代表企业有 Google、字节跳动
6 次提及
6 个连接
首次出现: 2026-04-13
最近出现: 2026-06-27
关系图谱
关系 (6)
应用于 (6)
多模态理解
GPT-5
v-HUB
Lance
Video-o3
HYDRA-X
相关文章 (6)
1.
PaperWeekly - 屡刷高分却不实用?南大团队揭示最强模型实际仅得49分
2.
极市平台 - CVPR2026Highlight艾伦AI研究所等发布VideoNet:1000种专业动作难倒GPT-5,更细致的视频理
3.
AI科技评论 - AI会笑吗?BIGAI&上交大团队:多模态大模型是否真的能get到视频笑点|ACL2026
4.
AIGC开放社区 - 图像、视频一模搞定!字节全能原生多模态本地可部署
5.
极市平台 - ICML2026|让多模态大模型像人类一样看视频:原生工具调用长视频理解新框架Video-o3
6.
量子位 - 单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题