Wesum AI

VHTformer

模型

VHTformer,基于 Transformer 的多模态感知模型,通过自注意力和交叉注意力实现视觉、触觉与文本的三模态融合

1 次提及1 个连接首次出现: 2026-04-01最近出现: 2026-04-01

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)