令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺

10年10000倍!车端自动驾驶芯片的算力纪录,正在被这样的速度刷新。2500TOPS,全部有效AI算力,来自始终笃信“第一性原理”的马斯克,和他的特斯拉,最新车载芯片曝光。与其说“下一代”,不如说“...

10年10000倍!车端自动驾驶芯片的算力纪录,正在被这样的速度刷新。

2500TOPS,全部有效AI算力,来自始终笃信“第一性原理”的马斯克,和他的特斯拉,最新车载芯片曝光。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图1

与其说“下一代”,不如说“领先一代”,因为2500TOPS的芯片被曝已成功流片,最快明年上车。

车端算力水平业内主流还是254TOPS,500-700TOPS只有头部玩家才有实力部署,极个别玩家算力堆到了1000TOPS以上。

特斯拉硬件性能的算力增长速率,远超当下行业共识和普遍节奏规律。

甚至10年前的马斯克自己,也很难料到。

算力10年涨10000倍,特斯拉最新车载芯片曝光

最新曝料,特斯拉下一代自动驾驶车端芯片,已经流片成功,进入批量生产的准备阶段。

3nm工艺,主要还是台积电代工,韩国的三星作为产能后备。

最重要的是算力——2000-2500TOPS之间。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图2

消息是韩国每日经济新闻最先曝出的,这是韩国影响力最大的经济报刊,1966年军政府时期成立(也是韩国各大财阀起家创业时期),政治立场保守偏右,而它背后的财阀支持,也有三星的影子。

所以可以认为这则曝料准确度很高,北美的媒体也广泛引用了这一消息。

2014年特斯拉首款车Model S,搭载了HW1.0硬件,底层采用了Mobileye的EyeQ3芯片,算力0.256TOPS。

2014年5月5月,一辆开启“Autopilot”的特斯拉与一辆大型拖车相撞,导致驾驶员死亡,这是自动驾驶历史上首例公开的死亡事故。随后,特斯拉迅速将核心算力从Mobileye更换为Nvidia的“Drive PX2”,算力24TOPS。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图3

并且同步招募了硅谷半导体大师吉姆·凯勒(Jim Keller)以及曾在英特尔和苹果工作过的皮特·班农(Pete Bannon),开始自研自动驾驶芯片。

2019年HW 3.0发布,底层全部换装特斯拉自研产品,14nm工艺,单片算力72TOPS,板卡算力144TOPS。搭载在特斯拉绝对销量担当的Model 3 和ModelY上。

2023年特斯拉发布了HW4,5nm工艺,单片算力推测在200-300TOPS,车载平台算力超过了500TOPS。

也是从这一代硬件开始,特斯拉在北美完全抛弃了毫米波雷达及超声波雷达,走向更纯粹的视觉路线。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图4

仅仅一年过后,新芯片算力已超2000TOPS,相比10年前的EyeQ3,已是10000倍的差距。

而马斯克不久前在财报会议上说,AI5整个套件算力会是HW4.0的十倍,由此推断真正上车时,AI5应该还是双芯片冗余,单颗算力至少2000TOPS+,整车算力4000TOPS以上。

这个水平远远超过目前L2+的主流算力配置。

国内玩家,比如大疆、比亚迪都已经验证,跑通一个端到端模型,其实并不需要泼天算力;甚至特斯拉自己,也在144TOPS的HW3.0方案上,OTA了最新的FSD版本。

技术客观,塑造了当下智能化竞赛各个玩家的“装备配置”的基本思路。

只求实现高速NOA和泊车功能的,采用德州仪器数十TOPS芯片,或100TOPS左右的高通8650、8620足矣,通常见于缓慢转型的合资车,或强调性价比的国产A级小车。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图5

这种算力条件下,其实也能强上“车位到车位”功能,只不过体验要做好难度极大。

用户心理层面可用敢用的城市NOA能力,通常至少需要一块英伟达Orin,256TOPS算力。这也是目前绝大多数“智能普及”车型采用的方案,可以说是当下成本性能最平衡的。

再进一步要把“车位到车位”体验做的足够好,接管率足够低,就需要两块Orin的算力支持。

但多块芯片之间的通信、任务分配,并行计算等等难度很大,要想把VLA这样的数十亿、百亿及参数模型跑在车端,就必须要更大算力芯片——700TOPS+的英伟达Thor在中国市场率先落地量产,正是自动驾驶技术体系的体现。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图6

但这也就是现在量产辅助智驾的最高“装备等级”了。

小千TOPS算力下,VLA到底该怎么部署、算力到底是不够还是有余、是不是能完全利用……各家都在探索,还没有人能给出准确答案。

特斯拉把算力军备竞赛一下拔高到数千TOPS,真的有必要吗?

数千T,特斯拉怎么用?

英伟达Thor 2022年首次亮相时,老黄给的算力数据就是2000TOPS,震撼了整个车圈。

2025年量产上车的版本,包括理想、极氪,实际却是750TOPS算力的版本。

有传言说是吴新宙从小鹏到了英伟达后,劝老黄其实车端没必要这么大算力,成本也受不了。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图7

所以海外媒体、用户对标特斯拉AI5的英伟达产品,不是Thor,反而是最新的5080、5090。

比如5080大约等效1800TOPS,5090则是 3,400 TOPS。

但这样的类比其实并不合理,因为特斯拉自从HW3.0开始,算力描述指的就是完完全全服务AI模型的有效算力。

也就是支持大规模乘加运算,并针对Transformer架构、算子做了特殊优化的NPU算力。

这也是通用GPU源流的英伟达芯片和车企自研自动驾驶芯片的根本不同。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图8

资深从业者曾向智能车参考透露,包括Orin和Thor,整个芯片设计思路还是从传统显卡出发,尤其是Thor又要兼顾一部分座舱功能,包括了很多不同用途的模块,自动驾驶模型真正调用的有效算力,是达不到宣传数字的。

这也是为何特斯拉、小鹏、蔚来,以及Momenta等等自动驾驶玩家都要自研芯片的原因。

AI5的2000TOPS+算力,代表着超大参数模型可以上车。

特斯拉目前云端超算建成约30EFLOPS算力,在训练的云端基座模型据说参数已经超过500B,也就是5000亿参数,和领先的大模型玩家已经没有任何区别。

而从目前大模型技术出发推断,能用在驾驶任务的多模态大模型,也只有VLA。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图9

流行的端到端实际参数量大约都是几十亿,同时还是“黑盒”,难以证明模型是真的理解路况,还是条件反射式的模仿。所以理论上限高,但很实际效果难控制,只能通过调整训练数据的分布来“间接”影响模型能力,下限依然需要规则兜底。

马斯克赌的,其实就是超大模型的“智能涌现”,让AI司机真正产生对环境场景的的认知理解能力,由此解决corner case。

云端多模态大模型具备基础能力后,在通过强化学习手段规范安全可靠性,然后通过知识蒸馏方法得到可在车端部署的较小模型。

当然车端的“小”模型是相对而言,整体规模仍然高出传统端到端,所以需要超大算力芯片。

另外从安全出发,依赖云端能力和即时通信的系统,安全隐患很大,车端部署完整模型也是必须。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图10

同样的路线,特斯拉在走,国内的小鹏蔚来理想华为等等都在走,它们在一同推动自动驾驶领域的一场新革命:“算力即能力”。

对传统量产辅助驾驶,从今年开始会迅速分化成入门性价比的阵营,和超大算力高阶阵营。前者可能更多见于合资车或自主性价比入门车型,主打“有就可以,基本能用”,OTA潜力有限。

后者则有希望突破L2限制,在安全性、易用性、接管率上实现质变,即各家都在说的“L3”。

令人绝望的算力!特斯拉2500TOPS自动驾驶芯片曝光:台积电3nm工艺-图11

而对L4阵营,自动驾驶新的技术思路和话语体系出现,并且上路近在眼前,如果AI司机智能涌现真的被验证,沉寂多年的“升维降维”之争,又要被热烈讨论了。

甚至特斯拉的AI5、小鹏的图灵、蔚来的神玑等等仅仅是个开始:10年前没人能想到车端算力有万倍提升,未来数年,谁又能断言数万TOPS的“超级AI汽车”不会成为现实呢?

毕竟,大模型的上限还远未达到。

本文转载于快科技,文中观点仅代表作者个人看法,本站只做信息存储

阅读前请先查看【免责声明】本文来自网络或用户投稿,本站仅供信息存储,若本文侵犯了原著者的合法权益,可联系我们进行处理。 转载请注明出处:https://m.bjjwt.cn/news/5650.html

上一篇 2025年06月20日 23:30
下一篇 2025年06月20日 23:31

相关推荐

联系我们

在线咨询: QQ交谈

邮箱:1217266901@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信