Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
SGLang
SGLang
技术
SGLang,面向大语言模型和多模态模型的高性能服务/推理框架,支持企业级规模化部署与推理加速。
13 次提及
16 个连接
首次出现: 2026-04-30
最近出现: 2026-06-19
关系图谱
关系 (18)
使用 (9)
智谱AI
NVIDIA
xAI
NVIDIA
摩尔线程
DeepSeek V4
Qwen3
GLM-5
KV Cache
使用技术 (6)
MoE
Speculative Decoding
MiniCPM5-1B
HiCache
OSCAR
slime
合作 (2)
摩尔线程
阿里云
发布 (1)
RadixArk
相关文章 (13)
1.
InfoQ - 智谱首秀工程实战经验!CodingAgent日均数亿次调用,GLM-5把长上下文推理的底层问题全逼出来了
2.
机器之心 - 拿下1亿美元种子轮!SGLang团队创立RadixArk,打造下一代开放AI基础设施
3.
人工智能学家 - 1亿美金!英伟达AMD英特尔破天荒联手,投给了这支团队
4.
新智元 - 1亿美金!英伟达AMD英特尔破天荒联手,投给了这支团队
5.
机器之心 - ICML2026拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代
6.
量子位 - 国产GPU组了个开源局,把SGLang等核心开发者都摇来了!
7.
机器之心 - 国产GPU首获全球顶级推理框架「原生门票」:MUSA合入SGLang主线
8.
InfoQ - 从兼容CUDA到自我进化,摩尔线程想用MUSA解决真正的难题
9.
量子位 - 刚刚,国产AI自己造了AI,全球首例!
10.
阿里云开发者 - Tair联手SGLang共建DeepSeekV4分层缓存架构
11.
机器之心 - 超越TurboQuant,面向长上下文推理的真2-bitKVQuantization算法问世
12.
PaperWeekly - 超越TurboQuant!KVCache压到真2-bit,长上下文推理又快又稳
13.
AI寒武纪 - 太狠了,智谱把GLM-5.2的炼丹炉直接开源了,Fable5级别的开源模型很快可能达到