
此外,小米宣布推出三款大模型——MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS,全面进军Agent时代的人工智能基座模型领域。目前这些模型已登陆Xiaomi miclaw、MiMo Studio、金山办公、小米浏览器等平台,并通过OpenClaw、OpenCode、KiloCode、Blackbox、Cline等框架接入,限时免费体验一周。
MiMo-V2-Pro是面向Agent时代的旗舰基座模型,总参数量超过1T(激活参数42B),采用混合注意力架构,支持1M超长上下文长度。在Artificial Analysis排行榜上位列全球第八、国内第二。该模型在OpenClaw、Claude Code等智能体框架中可无人工干预完成复杂工作流编排、长程规划与精准工具调用,整体使用体感超越Claude Sonnet 4.6,逼近Opus 4.6,但API定价仅为其五分之一。MiMo-V2-Omni是面向Agent时代的全模态基座模型,专为复杂多模态交互与执行场景设计,音频理解能力超越Gemini 3 Pro,图像理解能力超越Claude Opus 4.6,视频理解支持原生音视频联合输入。
MiMo-V2-TTS是小米自研的语音合成大模型,基于自研Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据预训练与多维度强化学习,实现高度可控的多粒度语音风格控制。该模型支持从整体风格定调到局部情绪表达的精准调节,能在同一句话内完成语气转折和情感递变,支持东北话、四川话、河南话、粤语、台湾腔等多种方言,同时具备高质量歌声合成能力。

CONTACT US
ICC APP