行业分类
理想发布MindVLA-o1自动驾驶基础模型:迈向“会思考的AI司机”,瞄准物理世界通用智能
日期:2026-03-18 09:38  
鑫椤资讯
在GTC 2026大会上,理想汽车发布下一代自动驾驶基础模型 MindVLA-o1,该模型通过统一视觉、语言与动作(VLA)的多模态架构,让自动驾驶具备更强的空间理解、推理决策与行为执行能力,是自动驾驶技术从单一感知与规则驱动,向具备思考与预测能力的智能体演进。
MindVLA-o1围绕五大技术创新构建:3D空间理解、多模态思考、统一行为生成、闭环强化学习以及软硬件协同设计。在感知层面,通过视觉模型结合激光雷达实现高质量三维环境理解;在决策层面引入世界模型,可在隐空间中预测未来场景变化并进行推理;在执行层面则通过统一行为生成机制直接生成驾驶轨迹,实现更稳定高效的驾驶决策。
 
为支持模型持续进化,理想还构建了完整的AI框架,包括 MindData(数据引擎)、MindVLA-o1(基础模型)、MindSim(世界模型仿真系统)以及RL Infra(强化学习基础设施),形成从数据、训练到仿真的闭环体系,使自动驾驶能够在真实与模拟环境中不断学习与优化。理想汽车认为,汽车本质是“最大的机器人”,自动驾驶只是物理AI的起点。未来,这套VLA基础模型不仅可用于智能汽车,也有潜力扩展到机器人及其他物理系统,推动具身智能通用模型的发展。
关于网站  |  手机版  |  电脑版
(c)2020-2021 ICCSINO(鑫椤资讯)
首页 刷新 顶部