当前位置: 首页 » 资讯 » 芯智驾 » 车企 » 正文

小鹏汽车刘先明:拆掉语言模块、坚持“0规则、纯数据驱动”,给VLA2.0打6分

放大字体  缩小字体 发布日期:2026-04-15  作者:鑫椤资讯
摘要:4月14日,据晚点AUTO报道,小鹏汽车通用智能中心负责人刘先明在接受采 访时披露了第二代VLA(视觉-语言-动作)模型的技术路线。他摒弃传统“规则+语言翻译”的智驾架构,自研基座模型,实现传感器信息...
4月14日,据晚点AUTO报道,小鹏汽车通用智能中心负责人刘先明在接受采 访时披露了第二代VLA(视觉-语言-动作)模型的技术路线。他摒弃传统“规则+语言翻译”的智驾架构,自研基座模型,实现传感器信息直接输出驾驶动作,中间不再经过语言模块翻译。刘先明称之为“拆掉Language”,认为此举能大幅降低延迟、提升实时性,更接近人类直觉行为。
 
刘先明表示他是小鹏“花钱最多的人”,2025年其业务占45亿元AI研发预算的最大份额。何小鹏曾坦言“每月花3个亿,心里很慌”。刘先明与何小鹏立下赌约:2026年8月底若未达到特斯拉FSD V14在硅谷的水平,他将在金门大桥裸跑。测试中团队曾想用规则快速修补问题,但刘先明坚持“0规则、纯数据驱动”,认为规则会限制模型上限、掩盖真实问题,转而依靠大规模高质量数据、强化学习和世界模型(“脑内小剧场”)解决难题。目前小鹏VLA 2.0已实现从喀什到上海5000公里横穿中国,纯视觉方案单次最长0接管里程1360公里。
 
刘先明认为自动驾驶只是起点,小鹏真正押注的是物理AI(包含机器人、通用智能),VLA 2.0架构为L4而生。其核心优势不是炫酷模型结构,而是极致的工程化迭代速度,他曾将GPU利用率从8%提升至40%,效率翻5倍。他给自己的VLA 2.0打6分,称“离理想还有差距”。刘先明此前在Cruise从事L4 Robotaxi研究,受Sam Altman介绍ChatGPT的震撼后,坚信大模型+规模法则可应用于自动驾驶,2024年初加入小鹏,现为通用智能中心负责人。
 
关于我们:ICC鑫椤资讯成立于2010年,主要服务于炭素、锂电、电炉钢3大行业,是中国领先的专业产业研究和顾问公司。鑫椤资讯以研究为中心,提供媒体资讯、研究咨询、数据库和市场营销等解决方案。
鑫椤锂电专注于锂电池原材料、锂电池及其下游等相关产业链跟踪,对市场价格、行情动态等资讯的搜集与研究,常年跟踪行业内400多家生产企业,拥有完善的产业数据库。根据企业需求提供定制报告,为企业提供专业化服务。
鑫椤锂电以研究为中心,服务于行业企业、金融机构(一二级市场私募基金/券商/银行等)、高校/科研院所、政府等,为客户提供的独特洞见、分析和资源,帮助客户高效决策,以实现高质量的业务增长。

[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
资讯浏览
市场报价
 
| 版权隐私 | 使用协议 | 网站服务 | 联系方式 | 关于我们
电话:021-50184981   电子邮箱:service@iccsino.com   地址:上海市浦东新区商城路506号新梅联合广场B座21楼D  邮编:200122  沪ICP备2022024271号-1