0
2025年6月,特斯拉下一代FSD計(jì)算平臺——代號AI5(原稱HW5.0)——正式進(jìn)入量產(chǎn)階段。這塊芯片的核心參數(shù)足以讓整個(gè)行業(yè)倒吸一口冷氣:算力2000-2500 TOPS,采用臺積電3納米N3P工藝制造。
要理解這個(gè)數(shù)字意味著什么,需要把時(shí)間軸拉長來看。
2014年,第一代Autopilot硬件(HW1.0)搭載的是Mobileye EyeQ3芯片,算力僅0.256 TOPS——連今天的智能手環(huán)都比它強(qiáng)。2016年的HW2.0換上了英偉達(dá)Drive PX2,算力躍升到21 TOPS,勉強(qiáng)能支撐高速巡航的基礎(chǔ)功能。真正的轉(zhuǎn)折點(diǎn)出現(xiàn)在2019年:HW3.0首次搭載特斯拉自研的FSD Chip,雙芯片總算力144 TOPS,三星14nm工藝。馬斯克當(dāng)時(shí)豪言所有HW2車主可以免費(fèi)升級,因?yàn)?quot;自研芯片的成本比外購還低"。
2023年到2024年間推出的HW4.0把算力推到了300-720 TOPS(不同統(tǒng)計(jì)口徑有差異),制程升級到7nm,CPU核心數(shù)從12核擴(kuò)展到20核,NPU從2個(gè)增加到3個(gè)。
然后是現(xiàn)在的AI5——2000-2500 TOPS,3nm制程。
十年時(shí)間,從0.256到2500,算力增長了接近一萬倍。這個(gè)增長曲線不是線性的,而是指數(shù)級的——HW4比HW3快了3-5倍,而AI5比HW4又翻了3-5倍甚至更多。在模型推理性能上,AI5據(jù)稱能達(dá)到HW4的10倍。
這不是常規(guī)的技術(shù)迭代,這是代際跨越。
一個(gè)容易被忽略但意味深長的細(xì)節(jié):特斯拉沒有沿用"HW5.0"這個(gè)命名,而是改叫"AI5"。
從"Hardware Version 5"到"AI 5",一字之差背后是對產(chǎn)品定位的根本性重構(gòu)。過去的命名邏輯是硬件版本號——HW1、HW2、HW3、HW4,每一代都是上一代的漸進(jìn)式升級,核心任務(wù)是把自動駕駛能力從L2推向更高等級。而"AI5"這個(gè)名字暗示了一個(gè)完全不同的敘事:這不再是一個(gè)"輔助駕駛硬件的第5次迭代",而是一個(gè)AI原生計(jì)算平臺的第5代進(jìn)化。
區(qū)別在哪里?HW系列的設(shè)計(jì)目標(biāo)主要是運(yùn)行傳統(tǒng)規(guī)則算法+早期神經(jīng)網(wǎng)絡(luò)混合架構(gòu),而AI5從底層架構(gòu)開始就是為端到端大模型優(yōu)化的。FSD V12已經(jīng)把超過40萬行C++規(guī)則代碼全部移除,換成純神經(jīng)網(wǎng)絡(luò)驅(qū)動。AI5就是為這種新范式準(zhǔn)備的——它的算力分配、內(nèi)存帶寬、指令集全部針對大模型推理場景做了定制化設(shè)計(jì)。
在供應(yīng)鏈策略上,AI5同樣體現(xiàn)了特斯拉的務(wù)實(shí)與精明。臺積電負(fù)責(zé)主力量產(chǎn)(3nm N3P工藝),三星作為備用代工廠。馬斯克親自確認(rèn)了這個(gè)雙廠策略,并坦言兩家在工藝實(shí)現(xiàn)上略有差異,但特斯拉的目標(biāo)是讓AI軟件在不同版本的芯片上實(shí)現(xiàn)完全一致的運(yùn)行效果。
為什么需要兩家?臺積電3nm產(chǎn)能全球緊張,蘋果和英偉達(dá)是最大的客戶。如果只綁一家,一旦產(chǎn)能吃緊或地緣政治波動,整個(gè)新車交付計(jì)劃都會被卡脖子。三星作為備胎,預(yù)計(jì)在2026年大規(guī)模量產(chǎn)搭載AI5的車型時(shí)正式啟用。這種"A主B備"的模式在汽車芯片行業(yè)并不常見——大多數(shù)車企還在為搶到一顆Orin X焦頭爛額,特斯拉已經(jīng)在布局雙供應(yīng)鏈了。
光有強(qiáng)芯不夠。自動駕駛是一個(gè)"眼睛+大腦"的系統(tǒng)工程,傳感器決定了信息采集的上限,算力決定了處理能力的邊界。兩者必須匹配,任何一方成為短板都是浪費(fèi)。
HW3.0時(shí)代的攝像頭配置在今天看來相當(dāng)"樸素"。8顆外部攝像頭加上1顆艙內(nèi)攝像頭,前視方案采用的是三目設(shè)計(jì)(三個(gè)不同焦距的鏡頭覆蓋遠(yuǎn)近),每顆攝像頭的像素僅為1280×960,約120萬像素,圖像傳感器來自安森美的AR0136AT。幀率36 FPS,最遠(yuǎn)探測距離約250米。
到了HW4.0,這套系統(tǒng)發(fā)生了質(zhì)的變化。前視從三目改為雙目超遠(yuǎn)距方案,像素分辨率躍升至2896×1876,約500萬像素——清晰度提升了將近4倍。圖像傳感器換成了索尼的IMX490,這是消費(fèi)電子級別的旗艦傳感器下放到車載領(lǐng)域。接口數(shù)量從8個(gè)增加到最多12個(gè),給未來留足了擴(kuò)展空間。CPU從12核升級到20核,視頻處理能力大幅增強(qiáng)。
但HW4.0還有一個(gè)引發(fā)廣泛討論的決定:取消了超聲波雷達(dá)。HW3標(biāo)配12個(gè)超聲波傳感器,用于低速泊車和近距離障礙物檢測。HW4直接砍掉了,用純視覺方案完成泊車功能。這個(gè)決策在當(dāng)時(shí)爭議不小——很多車主反映泊車體驗(yàn)一度下降。但特斯拉的態(tài)度很堅(jiān)決:既然選擇了純視覺路線,就不能在某個(gè)場景下"偷偷"加回其他傳感器,否則整個(gè)技術(shù)哲學(xué)就不成立了。
AI5時(shí)代,傳感器系統(tǒng)的升級方向更加明確:更高分辨率的攝像頭(具體參數(shù)尚未完全公開)、鏡片加熱元件(防止雨霧天氣結(jié)冰遮擋)、更強(qiáng)的防風(fēng)雨涂層(提升惡劣天氣下的成像質(zhì)量),以及更完善的硬件冗余設(shè)計(jì)。
這些細(xì)節(jié)透露出一種信號:特斯拉正在補(bǔ)齊純視覺方案最薄弱的一環(huán)——環(huán)境適應(yīng)性。
這是整個(gè)汽車行業(yè)分歧最大的技術(shù)路線問題之一。
特斯拉選擇純視覺方案的理由,可以從三個(gè)層面來理解。
第一個(gè)層面是數(shù)據(jù)一致性原則。自動駕駛的核心訓(xùn)練數(shù)據(jù)來自于攝像頭的圖像采集,如果訓(xùn)練時(shí)用的是攝像頭圖像、推理時(shí)卻引入激光雷達(dá)的點(diǎn)云數(shù)據(jù),兩種傳感器的數(shù)據(jù)格式和表征方式存在天然的模態(tài)差異(modality gap)。模型需要在訓(xùn)練階段學(xué)會融合這兩種異構(gòu)數(shù)據(jù),增加了復(fù)雜度和潛在誤差源。而如果從頭到尾只用一種傳感器,輸入輸出的一致性天然得到保證。
第二個(gè)層面是成本與規(guī)模化。一顆高性能機(jī)械式激光雷達(dá)的價(jià)格曾經(jīng)高達(dá)數(shù)萬元,即使現(xiàn)在固態(tài)/半固態(tài)激光雷達(dá)降到了數(shù)千元量級,對于一款定位大眾市場的車型來說仍然是不可忽視的BOM成本。Model Y能賣到26萬以下且保持健康的毛利率,省掉激光雷達(dá)是重要因素之一。
第三個(gè)層面是系統(tǒng)簡化帶來的可靠性提升。每增加一種傳感器類型,就需要一套對應(yīng)的感知融合算法、標(biāo)定流程、故障檢測機(jī)制。傳感器種類越多,系統(tǒng)復(fù)雜度指數(shù)級上升,潛在的故障點(diǎn)也越多。純視覺方案把所有雞蛋放進(jìn)一個(gè)籃子——然后把這個(gè)籃子做得足夠結(jié)實(shí)。
但信仰是有代價(jià)的。
惡劣天氣是純視覺最明顯的軟肋。大雨、濃霧、強(qiáng)逆光條件下,攝像頭的成像質(zhì)量會顯著下降,而激光雷達(dá)通過主動發(fā)射激光束進(jìn)行測距,受環(huán)境光照影響小得多。特斯拉在AI5上加入鏡片加熱元件和防風(fēng)雨涂層,正是為了緩解這個(gè)問題——但這屬于"修補(bǔ)"而非根本解決。
深度估計(jì)精度是另一個(gè)挑戰(zhàn)。攝像頭通過計(jì)算機(jī)視覺算法推斷物體距離,本質(zhì)上是"猜"出來的;激光雷達(dá)則是直接測量,精度高幾個(gè)數(shù)量級。在高速行駛場景下,幾米的距離誤差可能就是安全與事故的區(qū)別。
長尾場景的識別難題也不容忽視。異形車輛(如翻倒的卡車、載超寬貨物的三輪車)、非常規(guī)交通參與者(穿奇裝異服的人、突然沖出的動物)——這些場景在訓(xùn)練數(shù)據(jù)中出現(xiàn)頻率極低,但對安全性要求極高。多傳感器融合方案可以通過交叉驗(yàn)證來降低漏檢率,純視覺則完全依賴模型的泛化能力。
FSD V12的端到端革命在某種程度上強(qiáng)化了純視覺路線的邏輯。當(dāng)決策過程完全由神經(jīng)網(wǎng)絡(luò)完成而不是人工編寫的規(guī)則代碼時(shí),模型從海量真實(shí)駕駛數(shù)據(jù)中學(xué)習(xí)到的"直覺",理論上可以超越人類工程師預(yù)設(shè)的場景應(yīng)對能力。截至2025年底,F(xiàn)SD累計(jì)行駛里程已超過100億英里,這個(gè)數(shù)據(jù)規(guī)模本身就是一道越來越高的壁壘。
但問題依然存在:100億英里的數(shù)據(jù)是否覆蓋了足夠的極端場景?端到端模型的可解釋性缺陷如何在安全認(rèn)證中過關(guān)? 這些都不是靠堆算力就能回答的。
特斯拉AI5的2500 TOPS確實(shí)驚人,但如果把它放在整個(gè)行業(yè)坐標(biāo)系中審視,畫面會變得更加有趣。
當(dāng)前中國市場上主流的智駕芯片方案呈現(xiàn)明顯的梯隊(duì)分布:
深層的分野在于技術(shù)路線的選擇。以華為乾崑ADS為代表的中國主流方案堅(jiān)定走多傳感器融合路線——激光雷達(dá)(通常1-3顆)+毫米波雷達(dá)+高清攝像頭,三重感知互為備份。這種方案的邏輯是:能用錢解決的問題就不要留給概率。多花幾千塊錢加幾顆激光雷達(dá),換來的是在各種極端場景下的兜底安全感。
特斯拉的回應(yīng)是:我不信概率,我信數(shù)據(jù)和算力。
兩條路沒有絕對的對錯(cuò),至少目前如此。多傳感器融合方案在中國復(fù)雜的城市道路環(huán)境中表現(xiàn)確實(shí)出色——華為ADS的城市NOA開通速度、小鵬XNGP的城市覆蓋廣度都處于行業(yè)領(lǐng)先位置。純視覺方案則在北美的高速公路和結(jié)構(gòu)化較好的城區(qū)展現(xiàn)了驚人的效率——FSD V13/V14版本的擬人化駕駛表現(xiàn)已經(jīng)讓不少美國用戶感到"后座上的乘客經(jīng)常忘了這不是人在開"。
但這兩個(gè)市場不能簡單類比。中國的道路參與者密度是美國的好幾倍,電動車、自行車、行人、外賣騎手混雜的交通場景復(fù)雜度全球罕見。純視覺方案能否在這種環(huán)境下達(dá)到同樣的水準(zhǔn),是AI5入華后必須面對的第一個(gè)大考。
回看標(biāo)題提出的問題——純視覺方案還能領(lǐng)先多久?也許更準(zhǔn)確的問法是:領(lǐng)先的定義本身正在發(fā)生變化。從算力數(shù)字的單維競爭,走向算力、算法、數(shù)據(jù)、生態(tài)、合規(guī)的多維博弈。在這個(gè)新棋局里,AI5是一張極其強(qiáng)勁的牌,但遠(yuǎn)遠(yuǎn)不是最后的王牌。
(雷峰網(wǎng)(公眾號:雷峰網(wǎng))新智駕北京車展2026專題)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。