行业分类
小鹏汽车刘先明:拆掉语言模块、坚持“0规则、纯数据驱动”,给VLA2.0打6分
日期:2026-04-15 09:02  
鑫椤资讯
4月14日,据晚点AUTO报道,小鹏汽车通用智能中心负责人刘先明在接受采 访时披露了第二代VLA(视觉-语言-动作)模型的技术路线。他摒弃传统“规则+语言翻译”的智驾架构,自研基座模型,实现传感器信息直接输出驾驶动作,中间不再经过语言模块翻译。刘先明称之为“拆掉Language”,认为此举能大幅降低延迟、提升实时性,更接近人类直觉行为。
 
刘先明表示他是小鹏“花钱最多的人”,2025年其业务占45亿元AI研发预算的最大份额。何小鹏曾坦言“每月花3个亿,心里很慌”。刘先明与何小鹏立下赌约:2026年8月底若未达到特斯拉FSD V14在硅谷的水平,他将在金门大桥裸跑。测试中团队曾想用规则快速修补问题,但刘先明坚持“0规则、纯数据驱动”,认为规则会限制模型上限、掩盖真实问题,转而依靠大规模高质量数据、强化学习和世界模型(“脑内小剧场”)解决难题。目前小鹏VLA 2.0已实现从喀什到上海5000公里横穿中国,纯视觉方案单次最长0接管里程1360公里。
 
刘先明认为自动驾驶只是起点,小鹏真正押注的是物理AI(包含机器人、通用智能),VLA 2.0架构为L4而生。其核心优势不是炫酷模型结构,而是极致的工程化迭代速度,他曾将GPU利用率从8%提升至40%,效率翻5倍。他给自己的VLA 2.0打6分,称“离理想还有差距”。刘先明此前在Cruise从事L4 Robotaxi研究,受Sam Altman介绍ChatGPT的震撼后,坚信大模型+规模法则可应用于自动驾驶,2024年初加入小鹏,现为通用智能中心负责人。
关于网站  |  手机版  |  电脑版
(c)2020-2021 ICCSINO(鑫椤资讯)
首页 刷新 顶部