ViT

技术

ViT，Vision Transformer，将 Transformer 架构应用于计算机视觉的模型结构，广泛用于图像分类、目标检测等视觉任务

10 次提及11 个连接最近出现: 2026-06-27

关系图谱

关系 (11)

使用技术 (8)

MODMAP TIPSv2 OlmoEarth 视觉Token压缩 DIAL UniMedVL SAViT HYDRA

竞争 (1)

应用于 (1)

多模态理解

基于 (1)

相关文章 (10)