Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
vLLM
vLLM
产品
通用开源推理框架,已正式采用 TokenSpeed 的 MLA kernel
4 次提及
5 个连接
首次出现: 2026-05-07
最近出现: 2026-06-26
关系图谱
关系 (5)
使用 (3)
TokenSpeed
腾讯混元 Hy3 preview
Qwen3.5
合作 (1)
摩尔线程
使用技术 (1)
KV Cache
相关文章 (4)
1.
机器之心 - 英伟达力荐,小团队两个月开源一款「光速级」智能体推理引擎
2.
InfoQ - 从兼容CUDA到自我进化,摩尔线程想用MUSA解决真正的难题
3.
腾讯混元 - 首字延迟降低3.6倍,腾讯混元提出Stem稀疏注意力算法,长文推理加速新SOTA
4.
量子位 - 大模型最后一层竟是推理累赘?绕开对齐税,奥数准确率暴涨22.4%!