Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Flash Attention
Flash Attention
技术
Flash Attention,一种快速且节省内存的精确注意力机制计算技术,常用于加速和优化大模型训练与推理
26 次提及
27 个连接
首次出现: 2026-03-30
最近出现: 2026-06-25
关系图谱
关系 (28)
使用技术 (17)
北航
Qwen3
MoE
Google DeepMind
JoyAI-LLM Flash
TISA
Elephant Alpha
SSD
ViF
LongCat-2.0-Preview
SonicMoE
Claude Mythos
UCAN
DeepSeek V3
MUSA
KV Cache
Unlimited OCR
应用于 (9)
AI科研助手
可解释AI
AI芯片
Attention Mechanism
深度求索 DeepSeek
Transformer
KV Cache
AI编程助手
Test-Time Training
创建 (1)
Tri Dao
竞争 (1)
MSA
相关文章 (26)
1.
甲子光年 - HPC迎来AI大考,鲲鹏如何为开发者“减负”?|甲子光年
2.
量子位 - 让大模型看懂「高亮标注」:在注意力计算前编辑Key向量,用频谱分解让模型「听你指挥」丨ICLR'26
3.
PaperWeekly - 嫌Muon太吃算力?Mamba作者团队巧用Gram矩阵,实测提速两倍
4.
赛博禅心 - 循环即实验室:八个AI自主研究系统横评
5.
新智元 - 重磅开源!240亿参数力压NanoBanana2
6.
计算机司令部 - 【国联民生计算机】Token“通胀”呼唤超节点
7.
智东西 - 中国AI芯片论文入选计算机体系结构界Nature!芯片会自己做决策了
8.
财联社AI daily - 100B匿名模型Elephant冲上OpenRouter趋势榜第二
9.
量子位 - 大模型架构的下半场
10.
机器之心 - 刚刚,DeepSeek开始频繁更新:TileKernels、DeepEPV2
11.
机器之心 - 比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」
12.
极市平台 - 清华拆解OPD黑箱:强老师为什么救不了蒸馏?两个核心条件决定成败
13.
智东西 - DeepSeekV4登顶了!梁文锋把四大技术秘方公开
14.
量子位 - 终结多智能体视觉幻觉“滚雪球”!新国立等提出ViF:无需改造模型,即插即用
15.
机器之心 - 不只是DeepSeekV4,还有个万亿级大模型,训推全程国产芯片
16.
机器之心 - DeepSeek做大→MegaMoE,TriDao团队加快→SonicMoE
17.
逛逛GitHub - GitHub上狂揽1.1万Star,22岁开发者逆向工程了ClaudeMythos。
18.
CVer - 从CVPR2026来看,注意力机制的趋势已经很明显了
19.
计算机司令部 - 【国联民生计算机】再谈CPU产业链重大机遇
20.
机器之心 - 国产GPU首获全球顶级推理框架「原生门票」:MUSA合入SGLang主线
21.
机器之心 - 还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速
22.
InfoQ - 超越TurboQuantOSCAR:面向真实Serving的2bitKVCache量化
23.
智东西 - MiniMaxM3来了!12小时无人干预炼出4个模型,还把CUDA内核加速到9.4倍
24.
量子位 - 超越TurboQuant:TogetherAI把2-bitKVCache推向真实服务
25.
机器之心 - 入围CVPR2026最佳论文决选,ViT³用「测试时训练」突破Transformer复杂度瓶颈
26.
机器之心 - 百度开源无限OCR,跑通长程解析,核心作者YY疑是来自DeepSeek