Wesum AI

Token Superposition Training

技术

在预训练前半程将连续token的embedding叠加,后半程切回标准训练的方法

1 次提及2 个连接首次出现: 2026-05-14最近出现: 2026-05-16

关系图谱

关系 (2)

发布 (1)

竞争 (1)

相关文章 (1)