元戎启行,一家专注于智能驾驶解决方案的科技公司,近期因其在德国国际汽车及智慧出行博览会(IAA MOBILITY 2025)上展示的引起广泛关注。该模型的核心在于融合视觉、语言和行动三大能力,旨在实现更接近人类驾驶员的智能决策。此次发布,不仅展示了元戎启行的技术实力,也预示着
元戎启行创始人兼CEO周光认为,早期的AI决策模型更擅长处理“条件反射式”的驾驶行为,而决定智能驾驶安全性和体验感上限的,恰恰是那些需要推理和预判的长尾场景,也就是圈内常说的Corner Case。为了解决这些问题,VLA模型引入了“思维链”推理机制,这使得系统能够像人类一样进行信息串联、分析和因果推理,从而在面对复杂多变的真实路况时,做出更安全、更舒适、更拟人化的决策。这种“像人一样决策”的能力,是实现L5级完全自动驾驶的关键。VLA模型的核心优势在于实现了高度的可解释性,决策路径可追溯、可求导,有效摆脱了传统模型的“黑盒”难题。
为汽车装上VLA这个强大的“物理AI大脑”,难度巨大。它颠覆了传统的研发模式,带来三个“指数级”增长的挑战,让智驾公司必须重塑自己。首先是数据处理的“量级之变”,VLA模型需要处理海量的图像、视频、传感器信号。其次是模型训练的“范式之变”,训练VLA模型需要采用“知识蒸馏”技术,对算力集群的规模、稳定性和调度能力要求极高。最后是研发效率的“成本之变”,VLA时代研发成本结构从过去“人力占97%,算力占3%”的劳动密集型,转向“人力与算力一半一半”的资本密集型。为了应对这些挑战,元戎启行选择了与阿里云深度合作。阿里云提供的“超级AI云”,是一套从IaaS(基础设施)、PaaS(平台工具)到MaaS(模型服务)的全栈式解决方案,精准解决其在VLA路上可能遇到的痛点,从而带来极致的效率优化。阿里云PAI-灵骏智算服务提升了大规模集群的AI算力利用率,阿里云的分布式文件系统CPFS为万卡集群提供了数据的“饱和投喂”,阿里云的云企业网CEN构建了一张覆盖全国的“算力一张网”,阿里云专为智驾领域定制“加速包”PAI-TurboX,这些都为元戎启行的VLA模型训练提供了强大的支持。同时,阿里云的开源开放战略,也为元戎启行提供了助力,通义千问(Qwen)系列模型为行业提供了坚实基座。
元戎启行在商业策略上,专注于“大单品”策略——集中资源与车企深度合作,打造爆款车型。这种“少而精”的策略背后,是对自身技术研发效率的绝对自信。目前,元戎启行已经实现了接近10万台的交付量,在高阶辅助驾驶领域已是名列前三的成绩。这证明了其技术已经走出了实验室,经历了中国极其复杂的道路环境和气候条件的长期考验。随着高阶辅助驾驶市场的加速打开,像元戎启行这样具备核心技术能力的公司将迎来更大的市场空间。你认为在自动驾驶技术快速发展的今天,如何平衡技术创新与商业化落地?