Wesum AI

PD分离

技术

PD分离,将大模型推理的预填充(Prefill)与解码(Decode)阶段拆分到不同GPU实例的架构技术,典型应用包括Mooncake、DeepSeek等大模型推理优化

2 次提及4 个连接首次出现: 2026-04-22最近出现: 2026-05-21

关系图谱

关系 (4)

使用技术 (2)

创建 (1)

应用于 (1)

相关文章 (2)