Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
TIPSv2
TIPSv2
模型
谷歌 DeepMind 开源的多模态模型,在密集 Patch-Text 对齐任务上取得最优表现
2 次提及
13 个连接
首次出现: 2026-04-27
最近出现: 2026-04-27
关系图谱
关系 (14)
使用技术 (6)
多粒度文本描述
多模态理解
Vision Transformer
Self-Supervised Learning
EMA
ViT
竞争 (3)
PE-core G/14
DINOv3
SigLIP2
应用于 (2)
多模态理解
图像生成
使用 (2)
Gemini Flash
Gemini 2.0
发布 (1)
Google DeepMind
相关文章 (2)
1.
机器之心 - CVPR2026谷歌DeepMind重磅开源多模态TIPSv2:实现Patch-Text对齐的最优表现
2.
CVer - CVPR2026谷歌提出多模态TIPSv2:新型图像-文本编码器模型