理想发布MindVLA-o1自动驾驶基础模型：迈向“会思考的AI司机”，瞄准物理世界通用智能-资讯-鑫椤锂电网手机版

理想发布MindVLA-o1自动驾驶基础模型：迈向“会思考的AI司机”，瞄准物理世界通用智能

日期:2026-03-18 09:38
鑫椤资讯

在GTC 2026大会上，理想汽车发布下一代自动驾驶基础模型 MindVLA-o1，该模型通过统一视觉、语言与动作（VLA）的多模态架构，让自动驾驶具备更强的空间理解、推理决策与行为执行能力，是自动驾驶技术从单一感知与规则驱动，向具备思考与预测能力的智能体演进。

MindVLA-o1围绕五大技术创新构建：3D空间理解、多模态思考、统一行为生成、闭环强化学习以及软硬件协同设计。在感知层面，通过视觉模型结合激光雷达实现高质量三维环境理解；在决策层面引入世界模型，可在隐空间中预测未来场景变化并进行推理；在执行层面则通过统一行为生成机制直接生成驾驶轨迹，实现更稳定高效的驾驶决策。

为支持模型持续进化，理想还构建了完整的AI框架，包括 MindData（数据引擎）、MindVLA-o1（基础模型）、MindSim（世界模型仿真系统）以及RL Infra（强化学习基础设施），形成从数据、训练到仿真的闭环体系，使自动驾驶能够在真实与模拟环境中不断学习与优化。理想汽车认为，汽车本质是“最大的机器人”，自动驾驶只是物理AI的起点。未来，这套VLA基础模型不仅可用于智能汽车，也有潜力扩展到机器人及其他物理系统，推动具身智能通用模型的发展。