Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
vLLM
vLLM
技术
vLLM,源自 UC Berkeley 的开源大语言模型推理与服务引擎,采用 PagedAttention 技术实现高吞吐量内存管理与加速部署
4 次提及
5 个连接
首次出现: 2026-04-07
最近出现: 2026-06-05
关系图谱
关系 (5)
应用于 (2)
AI金融
AI安全
使用技术 (2)
MiniCPM5-1B
混元 Hy3 Preview
使用 (1)
商汤科技
相关文章 (4)
1.
AIGC开放社区 - 企业AI智能体大排雷:138场顶级分享抖出的落地实情
2.
量子位 - 刚刚,国产AI自己造了AI,全球首例!
3.
智东西 - 全球AI工厂4万亿激战!这家国产厂商领先一个身位了
4.
机器之心 - 首字延迟降低3.6倍!腾讯混元提出Stem稀疏注意力算法,长文推理加速新SOTA