Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
MLLM
MLLM
技术
MLLM,多模态大语言模型技术,能同时理解和处理文本、图像、音频等多种数据
7 次提及
7 个连接
最近出现: 2026-06-23
关系图谱
关系 (7)
使用技术 (2)
JoyAI-Image-Edit
X2SAM
使用 (2)
Earth2Ocean
Bernini
基于 (2)
PanoWorld
AAP
应用于 (1)
可解释AI
相关文章 (7)
1.
机器之心 - 库里被「采访」、杨紫被「演」短剧?别慌!蚂蚁AI鉴真拿下CVPR2026冠军,专治黑产
2.
新智元 - 重磅开源!240亿参数力压NanoBanana2
3.
极市平台 - CVPR2026|无需额外训练!零成本迁移实现水下世界的精准开放词汇分割(数据集开源)
4.
机器之心 - 从图像到视频的任意分割:X2SAM让MLLM真正看懂像素级时空世界
5.
极市平台 - 首个大规模全景空间理解基准与模型框架:PanoWorld让MLLM真正理解360°世界
6.
AIGC开放社区 - 字节开源王炸Bernini!轻松拿捏各类视频编辑任务
7.
CVer - 课题组2篇论文被ECCV 2026录用