Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Speculative Decoding
Speculative Decoding
技术
推测解码技术,通过小模型预测与大模型验证加速大模型推理,常用于降低 LLM 推理延迟
64 次提及
50 个连接
首次出现: 2026-03-31
最近出现: 2026-06-29
关系图谱
关系 (52)
使用技术 (40)
Claude Sonnet 4.6
JoyAI-LLM Flash
Seeduplex
DeepSeek R1
Drift-AR
NES
SSD
SAGUARO
GLM-5
GRAM
GPT Image 2
Gemma 4
TokenSpeed
Google DeepMind
Blackwell
Qwen3
LLaMA 3
SGLang
AntAngelMed
DeepSeek V3
Nemotron
是石科技
RTX Spark
Gemma 4 12B
MiMo-V2.5-Pro
MiMo-V2.5-Pro-UltraSpeed
MiMo-V2.5-Pro UltraSpeed
GLM-5.2
WeLM
DeepSeek V4
DeepSeek-V4-Pro-DSpark
DeepSeek-V4-Flash-DSpark
DeepSeek
DSpark
DeepSpec
Qwen
Gemma
DeepSeek V4-Pro
DSpark
深度求索 DeepSeek
应用于 (8)
Attention Mechanism
AI芯片
Claude Sonnet 4.6
AI编程助手
代码生成
边缘计算
AI基础设施
图像生成
发布 (3)
Google
北京大学
深度求索 DeepSeek
基于 (1)
DSpark
相关文章 (64)
1.
DeepTech深科技 - 对话戴国浩:拆解Token经济学,重新理解AI的成本与价值
2.
AI寒武纪 - 「CC源码解读」ClaudeCode真正的秘诀(很可能)并非在于模型
3.
AIGC开放社区 - 美团之后,京东也开始自研大模型了
4.
字节跳动Seed - Seed全双工语音大模型发布:懂倾听、抗干扰,走向更自然的交互
5.
新智元 - 刚刚,豆包「成精」了!一夜告别机械感,上亿人手机全量上线
6.
特工宇宙 - 豆包「打电话」升级Seeduplex:周围再吵,只认准你的声音
7.
计算机司令部 - 【国联民生计算机】Token“通胀”呼唤超节点
8.
AI前线 - 不设KPI,MiniMax发6亿港元股票,员工满年限即可全拿;曝苹果游说特朗普采购中国长鑫存储芯片;阿里内部推“一人团队
9.
CVer - Drift-AR:一个熵信号,同时加速AR与视觉解码两大瓶颈,实现5.5倍加速+单步生成!
10.
机器之心 - 不写Prompt,连按Tab完成重构:蚂蚁CodeFuse团队提出无指令代码编辑框架NES
11.
机器之心 - 比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」
12.
数字生命卡兹克 - 开源「洁癖.skill」,让你的Agent越用越聪明。
13.
智谱 - ScalingPain:超大规模CodingAgent推理实践
14.
GLM大模型 - AIInfra新探索:克服CodingAgent推理的ScalingPain
15.
InfoQ - 智谱首秀工程实战经验!CodingAgent日均数亿次调用,GLM-5把长上下文推理的底层问题全逼出来了
16.
智东西 - 大模型“降智”真相,找到了
17.
量子位 - 智谱公布“降智”的秘密:Scaling不可避免的痛
18.
深度学习与NLP - 智谱公布“降智”的秘密:Scaling不可避免的痛
19.
AI科技大本营 - 开源打破“AI黑箱”!集结全球大咖,GOSIMParis2026带你看懂Agent时代大变局
20.
腾讯研究院 - 腾讯研究院AI速递20260610
21.
APPSO - DeepSeeK突然发布DSpark,让AI的回答不再「挤牙膏」
22.
AI科技评论 - 单用户提速60-85%!DeepSeek联手北大开源DSpark,突破推理加速工程问题
23.
"财联社AI daily" - 大模型推理最高提速85%!DeepSeek发表重磅论文提出两项互补机制
24.
人工智能学家 - 梁文锋署名的DSpark,看懂这10个点就够了!
25.
InfoQ - 京东广告大模型实战:GRAM架构如何在50ms内完成生成式推荐?
26.
硅星人Pro - 深扒GPTImage2:疑似“吞”下了GPT-4o,OpenAI没把它当“生图”模型训练
27.
AI寒武纪 - 不改模型、不降质量,谷歌让Gemma4快了3倍:本地跑大模型彻底变天
28.
前沿在线 - SpaceX千亿造芯、OpenAI提前做AI手机、国产大模型进入资本与人才双战时代前沿快讯
29.
InfoQ - Gemma4多词元预测:生成速度最高提升约3倍
30.
机器之心 - 英伟达力荐,小团队两个月开源一款「光速级」智能体推理引擎
下滑加载更多...(已显示 30 / 64)