2500TOPS,全部有效AI算力,来自始终笃信“第一性原理”的马斯克,和他的特斯拉,最新车载芯片曝光。
与其说“下一代”,不如说“领先一代”,因为2500TOPS的芯片被曝已成功流片,最快明年上车。
车端算力水平业内主流还是254TOPS,500-700TOPS只有头部玩家才有实力部署,极个别玩家算力堆到了1000TOPS以上。
最新曝料,特斯拉下一代自动驾驶车端芯片,已经流片成功,进入批量生产的准备阶段。
消息是韩国每日经济新闻最先曝出的,这是韩国影响力最大的经济报刊,1966年军政府时期成立(也是韩国各大财阀起家创业时期),政治立场保守偏右,而它背后的财阀支持,也有三星的影子。
2014年5月5月,一辆开启“Autopilot”的特斯拉与一辆大型拖车相撞,导致驾驶员死亡,这是自动驾驶历史上首例公开的死亡事故。随后,特斯拉迅速将核心算力从Mobileye更换为Nvidia的“Drive PX2”,算力24TOPS。
并且同步招募了硅谷半导体大师吉姆凯勒(Jim Keller)以及曾在英特尔和苹果工作过的皮特班农(Pete Bannon),开始自研自动驾驶芯片。
2019年HW 3.0发布,底层全部换装特斯拉自研产品,14nm工推荐几款PG电子游戏,哪些游戏比较热门?艺,单片算力72TOPS,板卡算力144TOPS。搭载在特斯拉绝对销量担当的Model 3 和ModelY上。
2023年特斯拉发布了HW4,5nm工艺,单片算力推测在200-300TOPS,车载平台算力超过了500TOPS。
也是从这一代硬件开始,特斯拉在北美完全抛弃了毫米波雷达及超声波雷达,走向更纯粹的视觉路线。
仅仅一年过后,新芯片算力已超2000TOPS,相比10年前的EyeQ3,已是10000倍的差距。
而马斯克不久前在财报会议上说,AI5整个套件算力会是HW4.0的十倍,由此推断线应该还是双芯片冗余,单颗算力至少2000TOPS+,整车算力4000TOPS以上。
国内玩家,比如大疆、比亚迪都已经验证,跑通一个端到端模型,其实并不需要泼天算力;甚至特斯拉自己,也在144TOPS的HW3.0方案上,OTA了最新的FSD版本。
只求实现高速NOA和泊车功能的,采用德州仪器数十TOPS芯片,或100TOPS左右的高通8650、8620足矣,通常见于缓慢转型的合资车,或强调性价比的国产A级小车。
这种算力条件下,其实也能强上“车位到车位”功能,只不过体验要做好难度极大。
用户心理层面可用敢用的城市NOA能力,通常至少需要一块英伟达Orin,256TOPS算力。这也是目前绝大多数“智能普及”车型采用的方案,可以说是当下成本性能最平衡的。
再进一步要把“车位到车位”体验做的足够好,接管率足够低,就需要两块Orin的算力支持。
但多块芯片之间的通信、任务分配,并行计算等等难度很大,要想把VLA这样的数十亿、百亿及参数模型跑在车端,就必须要更大算力芯片700TOPS+的英伟达Thor在中国市场率先落地量产,正是自动驾驶技术体系的体现。
小千TOPS算力下,VLA到底该怎么部署、算力到底是不够还是有余、是不是能完全利用各家都在探索,还没有人能给出准确答案。
英伟达Thor 2022年首次亮相时,老黄给的算力数据就是2000TOPS,震撼了整个车圈。
2025年量产上车的版本,包括理想、极氪,实际却是750TOPS算力的版本。
有传言说是吴新宙从小鹏到了英伟达后,劝老黄其实车端没必要这么大算力,成本也受不了。
所以海外媒体、用户对标特斯拉AI5的英伟达产品,不是Thor,反而是最新的5080、5090。
但这样的类比其实并不合理,因为特斯拉自从HW3.0开始,算力描述指的就是完完全全服务AI模型的有效算力。
也就是支持大规模乘加运算,并针对Transformer架构、算子做了特殊优化的NPU算力。
资深从业者曾向智能车参考透露,包括Orin和Thor,整个芯片设计思路还是从传统显卡出发,尤其是Thor又要兼顾一部分座舱功能,包括了很多不同用途的模块,自动驾驶模型真正调用的有效算力,是达不到宣传数字的。
这也是为何特斯拉、小鹏、蔚来,以及Momenta等等自动驾驶玩家都要自研芯片的原因。
特斯拉目前云端超算建成约30EFLOPS算力,在训练的云端基座模型据说参数已经超过500B,也就是5000亿参数,和领先的大模型玩家已经没有任何区别。
而从目前大模型技术出发推断,能用在驾驶任务的多模态大模型,也只有VLA。
流行的端到端实际参数量大约都是几十亿,同时还是“黑盒”,难以证明模型是真的理解路况,还是条件反射式的模仿。所以理论上限高,但很实际效果难控制,只能通过调整训练数据的分布来“间接”影响模型能力,下限依然需要规则兜底。
马斯克赌的,其实就是超大模型的“智能涌现”,让AI司机真正产生对环境场景的的认知理解能力,由此解决corner case。
云端多模态大模型具备基础能力后,在通过强化学习手段规范安全可靠性,然后通过知识蒸馏方法得到可在车端部署的较小模型。
当然车端的“小”模型是相对而言,整体规模仍然高出传统端到端,所以需要超大算力芯片。
另外从安全出发,依赖云端能力和即时通信的系统,安全隐患很大,车端部署完整模型也是必须。
同样的路线,特斯拉在走,国内的小鹏蔚来理想华为等等都在走,它们在一同推动自动驾驶领域的一场新革命:“算力即能力”。
对传统量产辅助驾驶,从今年开始会迅速分化成入门性价比的阵营,和超大算力高阶阵营。前者可能更多见于合资车或自主性价比入门车型,主打“有就可以,基本能用”,OTA潜力有限。
后者则有希望突破L2限制,在安全性、易用性、接管率上实现质变,即各家都在说的“L3”。
而对L4阵营,自动驾驶新的技术思路和话语体系出现,并且上路近在眼前,如果AI司机智能涌现真的被验证,沉寂多年的“升维降维”之争,又要被热烈讨论了。
甚至特斯拉的AI5、小鹏的图灵、蔚来的神玑等等仅仅是推荐几款PG电子游戏,哪些游戏比较热门?个开始:10年前没人能想到车端算力有万倍提升,未来数年,谁又能断言数万TOPS的“超级AI汽车”不会成为现实呢?