Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Prompt与Decoding分离
Prompt与Decoding分离
技术
将 Prompt 处理与 Decoding 解耦的工程优化技术,结合多级缓存降低时延
1 次提及
1 个连接
首次出现: 2026-04-30
最近出现: 2026-04-30
关系图谱
关系 (1)
使用技术 (1)
GRAM
相关文章 (1)
1.
InfoQ - 京东广告大模型实战:GRAM架构如何在50ms内完成生成式推荐?