Alphabet旗下自动驾驶技术公司Waymo近日推出其世界模型,这一模型基于谷歌DeepMind的通用世界模型Genie3打造,能够生成逼真且交互式的3D环境。Waymo指出,大多数自动驾驶仿真模型都是从零开始训练,缺乏应对龙卷风、大象、风滚草、恐龙头套 Cosplay 等异常罕见事件,而Genie3提供了广泛的知识基础,Waymo通过后训练将2D视频信息转化为LiDAR激光雷达信号,使模型能够生成任何场景。
Waymo世界模型通过驾驶动作控制、场景布局控制和语言控制三种机制实现强大的模拟控制能力。除了基础版本,还有支持更长时间模拟的更高效变体。