Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
数学推理
数学推理
场景
数学推理,AI 模型解答数学问题和执行逻辑证明的能力,代表模型有 GPT-4o、Qwen2-Math
12 次提及
13 个连接
首次出现: 2026-04-16
最近出现: 2026-06-26
关系图谱
关系 (13)
应用于 (13)
Agent
RL
强化学习
Next-Token Prediction
Direct Preference Optimization
MoE
Chain-of-Thought
Qwen3-VL-8B
TFD
DeepSeek-V3
Llama-3.3-70B
Transformer
Next-ToBE
相关文章 (12)
1.
机器之心 - 脸谱心智陆弘远团队ACL2026新作:别再给模型叠加「高级词」了!模型更爱听「大白话」
2.
新智元 - AI能改10万行代码,却让你走路去洗车!Karpathy戳破「锯齿状智能」
3.
机器之心 - 价值模型不是没用,是架构不对!生成式Critic重新定义LLM强化学习信用分配
4.
新智元 - 大模型自信且短视!Next-ToBE破除NextToken预测诅咒ICLR'26
5.
PaperWeekly - 无惧Off-Policy偏移!Bengio团队解绑后训练,大模型RL提速50倍
6.
PaperAgent - WWW'26跨任务自适应的Multi-Agent协作新范式
7.
量子位 - 大模型最后一层竟是推理累赘?绕开对齐税,奥数准确率暴涨22.4%!
8.
量子位 - SFT别急着接RL!你的多模态大模型可能一直在“带伤训练”
9.
特工宇宙 - 马嘉祺和Anthropic让全网知道的那个技术问题,这家初创的CEO在洗澡时就想通了
10.
机器之心 - 「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题
11.
机器之心 - 模型也需要「睡觉」?CMU新论文让LLM在梦中「巩固记忆」
12.
PaperWeekly - ICLR2026打破Next-Token短视,唤醒大模型前瞻推理潜能