Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
DPO
DPO
技术
DPO,直接偏好优化技术,用于替代 RLHF 对大语言模型进行人类偏好对齐,常用于开源大模型的微调阶段
41 次提及
37 个连接
首次出现: 2026-03-31
最近出现: 2026-06-26
关系图谱
关系 (37)
使用技术 (24)
GR4AD
JoyAI-LLM Flash
PhysGM
YuLan-OneSim
ABot-PhysWorld
MindDR 1.5
RLAIF
Claude
Claude 3.5 Sonnet
LLaMA 3
Anthropic
SEAlign
Qwen2.5
Qwen3.5-9B
Qwen3.5-4B
LegoACE
快手
FusionRoute
SAM 3D
AI工厂
SE-Bridge-TTS
DrPO
Amazon AWS
Qwen3.5
应用于 (12)
图像生成
AI安全
具身智能
视频生成
AI对齐
SFT
LCPO
AI科研助手
Agent
强化学习
语音合成
代码生成
竞争 (1)
TGO
相关文章 (41)
1.
CVer - 12篇论文入选CVPR2026
2.
钛媒体AGI - 从“全民养虾”到企业落地:OpenClaw的三重现实拷问
3.
DeepTech深科技 - 在ICLR2026主会之前,我们和30多位入选者聊了聊最前沿的AI细节
4.
新智元 - 伦理防线不可靠!分布偏移诱导,大模型进入暗黑模式
5.
AI科技评论 - AI终于学会「自我坦白」!Anthropic最新论文震撼来袭,「内省适配器」让黑盒模型自己说出隐藏行为
6.
人工智能学家 - AI终于学会「自我坦白」!Anthropic最新论文震撼来袭,「内省适配器」让黑盒模型自己说出隐藏行为
7.
人工智能学家 - AI终于学会「自我坦白」!Anthropic最新论文震撼来袭,「内省适配器」让黑盒模型自己说出隐藏行为
8.
新智元 - NUS、牛津等联合发布音视频智能综述:系统梳理大模型时代的AVI全景图
9.
量子位 - 大模型最后一层竟是推理累赘?绕开对齐税,奥数准确率暴涨22.4%!
10.
机器之心 - 快手广告系统全面迈入生成式推荐时代!GR4AD:从Token到Revenue的全链路重构
11.
AIGC开放社区 - 美团之后,京东也开始自研大模型了
12.
机器之心 - CVPR2026|1分钟单图变4D视频!AI看图直接脑补物理规律
13.
CVer - CVPR20261分钟单图变4D视频!PhysGM:看图直接脑补物理规律
14.
ScienceAI - AutoResearch遇上社会科学:S-Researcher让智能体自主设计实验、模拟被试、撰写报告
15.
机器之心 - CVPR2026WorldArena挑战赛启动,高德开源高性能世界模型基线
16.
Z Finance - 深度|115篇接收、12篇Oral!字节跳动ICLR2026成绩单刷屏,基座+多模态火力集中
17.
PaperAgent - Anthropic最新论文:检测LLM内省意识的方法
18.
老冯云数 - 赛博儒学:探讨AIAgent的治理原则
19.
老冯云数 - 赛博拜火教:对齐没有终局,AI安全是一场永不结束的战争
20.
量子位 - 横扫全球15项SOTA!高德首个面向AGI的全栈具身技术体系大公开
21.
夕小瑶科技说 - 理想同学MindDR1.5发布:多智能体强化学习加持,深度研究更可靠
22.
新智元 - GPT之父把AI扔回1930年:没见过一行代码,却「发明」了Python!
23.
新智元 - 700多个「坏模型」喂出AI测谎仪?Anthropic审计神器让AI自曝黑料
24.
机器之心 - ICSE2026杰出论文突破代码模型真实工程落地瓶颈,北大团队提出SEAlign对齐框架:显著提升软件工程智能体决策质量
25.
量子位 - 无需构造偏好对:TGO用标量反馈对齐视觉生成模型|ICML'26
26.
PaperWeekly - ICLR2026800条数据治愈“过度思考”,大模型CoT减半还更准
27.
PaperWeekly - ACL20267000种语言怎么教?清华阿里找准语义瓶颈,通关多语言安全
28.
PaperAgent - ACL2026Spatial-Agent:地图Agent全新概念转换范式
29.
特工宇宙 - 我们开源了一个可以降低AIGC率的模型
30.
机器之心 - 重塑人机对话理解范式,Google新数据集首次大规模捕捉用户「未言明的想法」
下滑加载更多...(已显示 30 / 41)