与其称其为“下一代”,不如称之为“领先一代”。据报道,具备2500TOPS算力的芯片已成功流片,预计最快将于明年应用于车辆。
车端算力水平业内主流还是254TOPS,500-700TOPS只有头部玩家才有实力部署,极个别玩家算力堆到了1000TOPS以上。
最新曝料,特斯拉下一代自动驾驶车端芯片,已经流片成功,进入批量生产的准备阶段。
消息是韩国最先曝出的,这是韩国影响力最大的经济报刊,1966年军政府时期成立(也是韩国各大财阀起家创业时期),政治立场保守偏右,而它背后的财阀支持,也有三星的影子。
2014年5月5月,一辆开启“Autopilot”的特斯拉与一辆大型拖车相撞,导致驾驶员死亡,这是自动驾驶历史上首例公开的死亡事故。随后,特斯拉迅速将核心算力从Mobileye更换为Nvidia的“Drive PX2”,算力24TOPS。
同时,公司还招募了硅谷半导体领域的权威吉姆·凯勒(Jim Keller)以及曾在英特尔和苹果任职的皮特·班农(Pete Bannon),着手自主研发自动驾驶芯片。
2019年,特斯拉发布了HW 3.0,其底层硬件全面升级为自研产品,采用14nm工艺,单片算力达到72TOPS,板卡算力则为144TOPS。该硬件搭载于特斯拉销量主力车型Model 3Model Y上。
2023年,特斯拉发布了采用5nm工艺的HW4,其单片算力预计在200-300TOPS之间,车载平台的总算力超过500TOPS。从这一代硬件开始,特斯拉在北美彻底放弃了毫米波雷达和超声波雷达,转向更为纯粹的视觉路线。
仅一年后,新芯片的算力已超过2000TOPS,相较于10年前的EyeQ3,性能提升了10000倍。
马斯克在不久前的财报会议上表示,AI5整个套件的算力将是HW4.0的十倍。据此推断,当AI5真正应用于车辆时,应该仍会采用双芯片冗余设计,单颗芯片的算力至少达到2000TOPS以上,整车算力则超过4000TOPS。
国内企业如大疆和比亚迪已经验证,构建和运行一个端到端模型实际上并不需要极高的算力;特斯拉也在其144TOPS的HW3.0方案上,通过OTA推送了最新的FSD版本。
只求实现高速NOA和泊车功推荐几款PG电子游戏,哪些游戏比较热门?能的,采用德州仪器数十TOPS芯片,或100TOPS左右的高通8650、8620足矣,通常见于缓慢转型的合资车,或强调性价比的国产A级小车。
这种算力条件下,其实也能强上“车位到车位”功能,只不过体验要做好难度极大。
用户心理层面可用敢用的城市NOA能力,通常至少需要一块英伟达Orin,256TOPS算力。这也是目前绝大多数“智能普及”车型采用的方案,可以说是当下成本性能最平衡的。
再进一步要把“车位到车位”体验做的足够好,接管率足够低,就需要两块Orin的算力支持。
但多块芯片之间的通信、任务分配,并行计算等等难度很大,要想把VLA这样的数十亿、百亿及参数模型跑在车端,就必须要更大算力芯片——700TOPS+的英伟达Thor在中国市场率先落地量产,正是自动驾驶技术体系的体现。
小千TOPS算力下,VLA到底该怎么部署、算力到底是不够还是有余、是不是能完全利用……各家都在探索,还没有人能给出准确答案。
英伟达Thor 2022年首次亮相时,老黄给的算力数据就是2000TOPS,震撼了整个车圈。
2025年量产上车的版本,包括理想、极氪,实际却是750TOPS算力的版本。
有传言说是吴新宙从小鹏到了英伟达后,劝老黄其实车端没必要这么大算力,成本也受不了。
所以海外媒体、用户对标特斯拉AI5的英伟达产品,不是Thor,反而是最新的5080、5090。
但这样的类比其实并不合理,因为特斯拉自从HW3.0开始,算力描述指的就是完完全全服务AI模型的有效算力。
也就是支持大规模乘加运算,并针对Transformer架构、算子做了特殊优化的NPU算力。
资深从业者曾向智能车参考透露,包括Orin和Thor,整个芯片设计思路还是从传统显卡出发,尤其是Thor又要兼顾一部分座舱功能,包括了很多不同用途的模块,自动驾驶模型真正调用的有效算力,是达不到宣传数字的。
这也是为何特斯拉、小鹏、蔚来,以及Momenta等等自动驾驶玩家都要自研芯片的原因。
特斯拉目前云端超算建成约30EFLOPS算力,在训练的云端基座模型据说参数已经超过500B,也就是5000亿参数,和领先的大模型玩家已经没有任何区别。
而从目前大模型技术出发推断,能用在驾驶任务的多模态大模型,也只有VLA。
流行的端到端实际参数量大约都是几十亿,同时还是“黑盒”,难以证明模型是真的理解路况,还是条件反射式的模仿。所以理论上限高,但很实际效果难控制,只能通过调整训练数据的分布来“间接”影响模型能力,下限依然需要规则兜底。
马斯克赌的,其实就是超大模型的“智能涌现”,让AI司机真正产生对环境场景的的认知理解能力,由此解决corner case。
云端多模态大模型具备基础能力后,在通过强化学习手段规范安全可靠性,然后通过知识蒸馏方法得到可在车端部署的较小模型。
当然,车端的“小”模型是相对而言的,其整体规模仍然超过传统端到端模型,因此需要使用超大算力芯片。
从安全角度考虑,依赖云端能力和即时通信的系统存在较大的安全隐患,因此在车端部署完整的模型是必要的。
推荐几款PG电子游戏,哪些游戏比较热门?同样的路径,特斯拉与国内的小鹏、蔚来、理想、华为等企业都在共同推进自动驾驶领域的新革命:“算力即能力”。
从今年开始,传统量产辅助驾驶将迅速分化为两个阵营:一是追求入门性价比的车型,二是具备超大算力的高阶车型。前者多见于合资品牌或自主品牌的入门级车型,其主要特点是“有即可用,基本满足需求”,OTA升级潜力有限。
后者则有望突破L2的限制,在安全性、易用性和接管率方面实现质的飞跃,即各家公司所称的“L3”。
对于L4级别的自动驾驶阵营,新的技术思路和话语体系正在涌现,上路测试也指日可待。如果AI司机的智能涌现得到验证,沉寂多年的“升维降维”之争或将再次引发热烈讨论。
特斯拉的AI5、小鹏的图灵、蔚来的神玑等仅仅是开端:10年前,没有人能预见车端算力会提升万倍;而在未来数年内,谁又能断言具备数万TOPS算力的“超级AI汽车”不会成为现实呢?