当前位置: 首页 » 资讯 » 芯智驾 » 芯片 » 正文

英伟达GTC 2026:Rubin 登场,推理成本降10倍,智能体、机器人与L4自动驾驶全面提速

放大字体  缩小字体 发布日期:2026-03-17  作者:鑫椤资讯
摘要:在2026年GTC大会上,Jensen Huang宣布推出新一代 Vera Rubin AI平台,并将其称为英伟达历史上规模最大的AI基础设施升级。新平台通过 Rubin GPU + Vera CPU 构建机架级超级计算系统,例如 NVL72 机架可连接72块GPU...
在2026年GTC大会上,Jensen Huang宣布推出新一代 Vera Rubin AI平台,并将其称为英伟达历史上规模最大的AI基础设施升级。新平台通过 Rubin GPU + Vera CPU 构建机架级超级计算系统,例如 NVL72 机架可连接72块GPU和36块CPU,形成类似“AI超级计算机”的算力单元。相比上一代架构,该系统在混合专家模型训练时只需 四分之一GPU规模即可完成任务,同时 每瓦推理吞吐量提升约10倍,单Token推理成本下降至约1/10。
 
为支撑智能体AI复杂推理需求,英伟达首发 BlueField-4 STX 模块化存储架构。该架构通过 CMX上下文内存平台将存储节点与GPU计算资源深度耦合,大幅提升大模型KV缓存处理能力。在实际性能上,系统 Token处理速度最高提升5倍,能效达到传统CPU方案的4倍。包括戴尔、HPE、IBM以及甲骨文云等厂商都已开始基于该架构开发下一代AI基础设施。在软件生态方面,英伟达推出 NemoClaw 智能体软件栈,这是针对OpenClaw平台打造的一套“一键部署”AI系统。现场演示中,用户只需一条命令即可部署 Nemotron模型与OpenShell运行环境。黄仁勋形象地表示:如果Mac和Windows是PC时代的操作系统,那么OpenClaw可能成为个人AI时代的操作系统。NemoClaw还提供沙箱环境与隐私路由机制,使智能体既能调用本地模型,也能安全接入云端大模型,从而实现全天候运行的个人AI助手。
 
同时,英伟达在大会上宣布大幅扩展其开源模型体系,以推动 Agentic AI、Physical AI 和医疗AI 三大方向的发展。例如 Nemotron 3 Ultra 吞吐效率提升5倍,专门用于复杂工作流和代码辅助;Nemotron 3 Omni 则支持音频、视觉与文本多模态理解。在机器人与自动驾驶领域,英伟达推出 Cosmos 3 世界基础模型、Isaac GR00T N1.7 机器人模型以及 Alpamayo 1.5 自动驾驶模型。医疗领域方面,BioNeMo平台新增 Proteina-Complexa蛋白质生成模型,并配合GPU加速仿真引擎 nvQSP,其计算速度相比传统CPU方案提升 77倍,可以大幅缩短新药研发周期。在自动驾驶领域,英伟达宣布与 BYD、Geely、Isuzu、Nissan 等车企合作,基于 NVIDIA DRIVE Hyperion 平台开发 L4级自动驾驶汽车。其中,五十铃与TIER IV正在利用 DRIVE AGX Thor 芯片开发自动驾驶巴士;而在Robotaxi领域,英伟达还与 Uber 扩大合作,计划到 2028年在全球28个城市部署自动驾驶车队。首批试点预计将在2027年于洛杉矶和旧金山湾区启动,并逐步扩展到更多地区。
 
关于我们:ICC鑫椤资讯成立于2010年,主要服务于炭素、锂电、电炉钢3大行业,是中国领先的专业产业研究和顾问公司。鑫椤资讯以研究为中心,提供媒体资讯、研究咨询、数据库和市场营销等解决方案。
鑫椤锂电专注于锂电池原材料、锂电池及其下游等相关产业链跟踪,对市场价格、行情动态等资讯的搜集与研究,常年跟踪行业内400多家生产企业,拥有完善的产业数据库。根据企业需求提供定制报告,为企业提供专业化服务。
鑫椤锂电以研究为中心,服务于行业企业、金融机构(一二级市场私募基金/券商/银行等)、高校/科研院所、政府等,为客户提供的独特洞见、分析和资源,帮助客户高效决策,以实现高质量的业务增长。

[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
资讯浏览
市场报价
 
| 版权隐私 | 使用协议 | 网站服务 | 联系方式 | 关于我们
电话:021-50184981   电子邮箱:service@iccsino.com   地址:上海市浦东新区商城路506号新梅联合广场B座21楼D  邮编:200122  沪ICP备2022024271号-1