Wesum AI

MiMo-V2-TTS

模型

MiMo-V2-TTS,小米的语音合成模型,基于自研 Audio Tokenizer 和多码本联合语音文本建模架构,使用超 1 亿小时语音数据预训练,支持细粒度情感控制。

1 次提及2 个连接首次出现: 2026-04-10最近出现: 2026-04-10

关系图谱

关系 (2)

发布 (1)

应用于 (1)

相关文章 (1)