PG(中国大陆)电子·控股有限公司-官网

小鹏“夺”走行业首发VLA桂冠-PG电子控股有限公司
关闭
小鹏“夺”走行业首发VLA桂冠
作者:小编 日期:2025-10-08 点击数: 

  对于刚接触PG电子的新手,有什么实用的攻略吗?对于刚接触PG电子的新手,有什么实用的攻略吗?去年,围绕端到端方案的国内首发落地,理想汽车和小鹏汽车展开了一波舆论对轰。

  今年,它们又开始争夺行业首发VLA自动驾驶大模型的荣誉了。关于VLA,真的很有必要跟大家继续深谈一番。

  2023年,世界前首富比尔·盖茨坐在微软投资的英国自动驾驶公司Wayve的测试车里,一边竖起大拇指点赞,一边没见过世面似地惊叹连连。

  Wayve当时测试的自动驾驶系统采用的就是VLA技术路线,部署的是行业首个基于VLA的自动驾驶方案LINGO-1。

小鹏“夺”走行业首发VLA桂冠(图1)

  很多人或许对Wayve这家公司不是太熟悉,这是自动驾驶行业中比元戎启行还要有“Tech Vision”的公司。

  早在2022年,Wayve就在公开道路上测试了端到端自动驾驶方案,比特斯拉早了整整一年,别再人云亦云地认为特斯拉开辟了端到端自动驾驶这条技术路线了。

小鹏“夺”走行业首发VLA桂冠(图2)

  VLA这条技术路线最初发源于机器人领域,早在2021年,谷歌的研究团队开始致力于探索如何将当时快速发展的Transformer架构、视觉语言领域的大规模预训练模型与机器人控制结合起来,提出了将视觉感知、语言理解与物理动作控制放在统一的框架内的核心思想。

  也就是说,把视野扩大到包含自动驾驶车辆、人形机器人及各种机器人在内的具身智能产业,VLA的发展历程中其实融合了机器人技术与自动驾驶技术的双重演进。

小鹏“夺”走行业首发VLA桂冠(图3)

  首个面向自动驾驶的VLA方案问世于2023年9月,以小鹏和理想汽车为代表的本土车企之所以到2025年才开始切换到这条技术路线上来,是因为VLA的前提或铺垫是基于深度学习神经网络的端到端,小鹏和理想们在2023年下半年 还处在基于规则的分模块时代,他们需要首先完成向端到端范式的转变,才能进一步切换到VLA 这条路线。

小鹏“夺”走行业首发VLA桂冠(图4)

  基于此,建议小鹏和理想在宣传自家的VLA方案时,不要使用“行业首发”这个定语,改成“本土首发”或许更加符合现实。

  前段时间,华为车BU CEO靳玉志在回答媒体问题时表示,华为不会走小鹏和理想们的VLA技术路线。

  因为,VLA方案以语言模型为核心,涉及到视觉模态到自然语言、自然语言到动作轨迹的双重转换,很难保证合理的延时。

小鹏“夺”走行业首发VLA桂冠(图5)

  就这个观点继续展开,华为的WA世界行为模型、Momenta的基于强化学习的一段式端到端方案都是直接在视频输入V和轨迹输出A之间做映射,VLA 方案却需要先做视频输入V到语言空间L的转换,再做语言L到动作A的转换。

  这其实也就意味着,如果要保证跟VA方案同样的实时性,VLA方案就必须使用算力更大的计算芯片。

小鹏“夺”走行业首发VLA桂冠(图6)

  不过,成本并不仅仅体现在计算芯片上。VLA引入了一个超大参数的多模态大语言模型。

  这就意味着,比起其它方案,VLA方案还需要使用带宽更高的内存芯片、容量更大的存储芯片。

  计算芯片、内存芯片、存储芯片的背后都是实打实的钱,而且基本来自大洋彼岸,买方没有议价权,不愿意当活雷锋的车企只能让消费者来买单。

小鹏“夺”走行业首发VLA桂冠(图7)

  之所以和基于强化学习的一段式端到端以及世界行为模型相比,VLA方案需要更高算力的计算芯片、更快更大容量的内存芯片、更大空间的存储芯片,核心关键在于语言模型提供了太多与驾驶任务无关的冗余能力。

  在日常生活中,我们对老司机的要求是好好开车,而非一言不合就开车,不需要他吟诗作赋、舌灿莲花,学贯中西、通晓古今。

小鹏“夺”走行业首发VLA桂冠(图8)

  顾名思义,大语言模型最大的能力体现在与驾驶任务无关的语言理解和表达能力上,这些语言能力的背后意味着算力、运力、存力,如此浪费,当然会推高对芯片的要求了。

  由于范式的切换提供了占领用户心智的绝佳机会,最近这段时间,有关哪条技术路线才是最佳的端到端自动驾驶2.0方案,各大车企和智驾方案供应商都展开了有利于自己的宣传,其架势丝毫不输去年的端到端。

小鹏“夺”走行业首发VLA桂冠(图9)

  大路朝天,各走一边,地平线、卓驭科技、Momenta这些头部智驾方案供应商们选择基于强化学习的一段式端到端方案,其主要原因在于它是由基于模仿学习的一段式端到端方案演化而来,改动小,见效快。

小鹏“夺”走行业首发VLA桂冠(图10)

  立足现在,AI巨头们目前开源的VL模型展现出了极强的复杂路况理解、通用语义理解以及自然交互的能力,这种通识和推理能力正是被泛化性搞得焦头烂额的自动驾驶厂商梦寐以求的。

  放眼未来,独行者快,众行者远,更加火热的具身智能赛道里存在各路玩家在同步推动VLA模型的发展,选择了VLA路线。

  不仅可以借助AI巨头的通用VL基座模型快速提升自动驾驶系统的性能表现,还能在众多投身更复杂场景的具身智能玩家的推动下得到借鉴,快速定向提升VLA模型的表现。

小鹏“夺”走行业首发VLA桂冠(图11)

  至于成本上的压力,小鹏有自家的芯片,理想、小米面向中高端市场,有足够的空间消化芯片的成本。

  考虑到VLA可以借势,拥有站在巨头肩膀上的巨大优势,以及其性能上限优于基于强化学习的一段式端到端方案,也不排除很快就会有传统车企下场,在其面向中高端市场的子品牌中试水VLA方案。

  而且,VLA可以借助大语言模型的威力,也要承担其过于消耗计算资源的缺陷。

  展望智驾平权的未来,VLA可能只是迈向算力高效的世界模型的中间过渡方案。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  国庆假期连赶9场婚礼!浙江婚庆男主持忙到喉咙沙哑,被赞“控场超棒”:我太牛了

  59岁歌手关淑怡病危紧急送入ICU,曾与王菲并称为“歌坛双后”,退圈后被曝经济拮据“街头翻垃圾桶”

  荷兰爆发大规模示威活动:数十万人涌上街头要求政府对以色列采取更强硬立场

  拉基蒂奇、布斯克茨、阿尔巴退役,巴萨上次欧冠夺冠首发仅剩特狮+MSN现役

  伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

顶部