MiMo-V2-TTS

模型

MiMo-V2-TTS，小米的语音合成模型，基于自研 Audio Tokenizer 和多码本联合语音文本建模架构，使用超 1 亿小时语音数据预训练，支持细粒度情感控制。

1 次提及2 个连接首次出现: 2026-04-10最近出现: 2026-04-10

关系图谱