TIPSv2

模型

TIPSv2，谷歌 DeepMind 开源的多模态模型，通过细粒度密集 Patch-Text 对齐和空间感知实现出色的视觉语言表征

2 次提及13 个连接首次出现: 2026-04-27最近出现: 2026-04-27

关系图谱

关系 (14)

使用技术 (6)

多粒度文本描述多模态理解 Vision Transformer Self-Supervised Learning EMA ViT

竞争 (3)

PE-core G/14 DINOv3 SigLIP2

应用于 (2)

多模态理解图像生成

使用 (2)

Gemini Flash Gemini 2.0

发布 (1)

Google DeepMind

相关文章 (2)