Wesum AI

vLLM

技术

vLLM,源自 UC Berkeley 的开源大语言模型推理与服务引擎,采用 PagedAttention 技术实现高吞吐量内存管理与加速部署

4 次提及5 个连接首次出现: 2026-04-07最近出现: 2026-06-05

关系图谱

关系 (5)

应用于 (2)

使用技术 (2)

使用 (1)

相关文章 (4)