Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
预训练
预训练
场景
大语言模型的基础训练阶段,TST旨在提升该阶段的训练吞吐量
1 次提及
4 个连接
首次出现: 2026-05-14
最近出现: 2026-05-22
关系图谱
关系 (1)
应用于 (1)
TST
相关文章 (1)
1.
PaperWeekly - 不改架构、不加算力:NousResearch巧用Token叠加,预训练提速2.5倍