小鹏汽车刘先明：拆掉语言模块、坚持“0规则、纯数据驱动”，给VLA2.0打6分-资讯-鑫椤锂电网手机版

小鹏汽车刘先明：拆掉语言模块、坚持“0规则、纯数据驱动”，给VLA2.0打6分

日期:2026-04-15 09:02
鑫椤资讯

4月14日，据晚点AUTO报道，小鹏汽车通用智能中心负责人刘先明在接受采访时披露了第二代VLA（视觉-语言-动作）模型的技术路线。他摒弃传统“规则+语言翻译”的智驾架构，自研基座模型，实现传感器信息直接输出驾驶动作，中间不再经过语言模块翻译。刘先明称之为“拆掉Language”，认为此举能大幅降低延迟、提升实时性，更接近人类直觉行为。

刘先明表示他是小鹏“花钱最多的人”，2025年其业务占45亿元AI研发预算的最大份额。何小鹏曾坦言“每月花3个亿，心里很慌”。刘先明与何小鹏立下赌约：2026年8月底若未达到特斯拉FSD V14在硅谷的水平，他将在金门大桥裸跑。测试中团队曾想用规则快速修补问题，但刘先明坚持“0规则、纯数据驱动”，认为规则会限制模型上限、掩盖真实问题，转而依靠大规模高质量数据、强化学习和世界模型（“脑内小剧场”）解决难题。目前小鹏VLA 2.0已实现从喀什到上海5000公里横穿中国，纯视觉方案单次最长0接管里程1360公里。

刘先明认为自动驾驶只是起点，小鹏真正押注的是物理AI（包含机器人、通用智能），VLA 2.0架构为L4而生。其核心优势不是炫酷模型结构，而是极致的工程化迭代速度，他曾将GPU利用率从8%提升至40%，效率翻5倍。他给自己的VLA 2.0打6分，称“离理想还有差距”。刘先明此前在Cruise从事L4 Robotaxi研究，受Sam Altman介绍ChatGPT的震撼后，坚信大模型+规模法则可应用于自动驾驶，2024年初加入小鹏，现为通用智能中心负责人。