Wesum AI

Prefix Cache

技术

Prefix Cache(前缀缓存),一种优化大模型推理性能的技术,通过复用公共前缀(如系统提示词)的 KV Cache 减少重复计算

1 次提及1 个连接首次出现: 2026-04-22最近出现: 2026-04-22

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)