0
2026年3月30日,國(guó)際計(jì)算機(jī)體系結(jié)構(gòu)頂會(huì)ISCA 2026公布了論文錄用名單。在Industrial Track(工業(yè)分區(qū))中,出現(xiàn)了一個(gè)陌生的名字——Li Auto。
ISCA是計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域的頂級(jí)會(huì)議,與ISCA并列的ASPLOS、HPCA、MICRO、DAC共同構(gòu)成芯片設(shè)計(jì)領(lǐng)域的"五大學(xué)術(shù)圣殿"。此前從未有汽車(chē)企業(yè)入選過(guò)這個(gè)會(huì)議的任何分區(qū)。英偉達(dá)、AMD、英特爾這些芯片巨頭常年霸榜,但它們的身份是"芯片公司"。理想是第一個(gè)以"車(chē)企"身份站上這個(gè)舞臺(tái)的公司。
這篇論文的內(nèi)容是理想自研智駕芯片"馬赫100"的架構(gòu)設(shè)計(jì)。論文中披露了幾個(gè)關(guān)鍵參數(shù):5nm車(chē)規(guī)制程、數(shù)據(jù)流架構(gòu)、Chiplet芯粒設(shè)計(jì)、單顆峰值算力1280 TOPS。L9 Livis搭載雙顆,總計(jì)2560 TOPS——理想官方稱(chēng)在自研算法上的有效算力為英偉達(dá)Thor-U的5到6倍。
但真正讓行業(yè)側(cè)目的不是參數(shù),是時(shí)間線(xiàn)。
2022年11月項(xiàng)目正式啟動(dòng),2025年5月完成首次流片,2026年Q2隨L9 Livis量產(chǎn)交付。從立項(xiàng)到量產(chǎn)不到四年,從流片到量產(chǎn)只有14個(gè)月。芯片行業(yè)的通行標(biāo)準(zhǔn)是:一個(gè)新芯片項(xiàng)目從立項(xiàng)到量產(chǎn)通常需要七年,從流片到量產(chǎn)需要24到36個(gè)月。
理想把兩個(gè)時(shí)間都?jí)嚎s到了行業(yè)常態(tài)的一半以下。
這件事只有兩種可能的解讀:要么理想的工程團(tuán)隊(duì)是真的強(qiáng),做出了行業(yè)級(jí)的突破;要么是某個(gè)環(huán)節(jié)被壓縮了,而這個(gè)被壓縮的環(huán)節(jié)會(huì)在交付后以某種形式暴露問(wèn)題。答案要到L9 Livis真正上路跑起來(lái)之后才能知道,但在此之前,馬赫100的供應(yīng)鏈故事本身就已經(jīng)足夠有嚼頭。
5nm意味著什么?
在消費(fèi)電子領(lǐng)域,5nm并不稀奇——蘋(píng)果A14芯片在2020年就用了臺(tái)積電的5nm工藝,現(xiàn)在最新一代已經(jīng)推進(jìn)到3nm甚至2nm。但消費(fèi)芯片和車(chē)規(guī)芯片是兩個(gè)完全不同的物種。
AEC-Q100車(chē)規(guī)認(rèn)證的溫度范圍是零下40度到150度,壽命要求15年以上。這意味著一顆裝在車(chē)上的芯片,要在盛夏暴曬的引擎艙里、在東北零下30度的冬夜中、在15年的振動(dòng)和濕熱循環(huán)中,始終保持穩(wěn)定工作。消費(fèi)芯片不需要面對(duì)這些——手機(jī)用了三五年就換了,誰(shuí)在乎它在第五年會(huì)不會(huì)藍(lán)屏。
先進(jìn)制程做車(chē)規(guī),難度呈指數(shù)級(jí)增長(zhǎng)。制程越先進(jìn),晶體管間距越小,對(duì)溫度波動(dòng)越敏感。7nm時(shí)代的車(chē)規(guī)方案已經(jīng)有成熟案例(高通8155、英偉達(dá)Orin),但5nm車(chē)規(guī)量產(chǎn)在全球范圍內(nèi)幾乎沒(méi)有先例。臺(tái)積電的5nm車(chē)規(guī)產(chǎn)線(xiàn)雖然已經(jīng)啟動(dòng),但良率和產(chǎn)能都還在爬坡階段。一位芯片行業(yè)工程師這樣形容:"5nm車(chē)規(guī)就像在刀尖上跳舞——容錯(cuò)空間幾乎為零,每一次工藝微調(diào)都可能影響整批芯片的可靠性。"
良率是第一道鬼門(mén)關(guān)。臺(tái)積電5nm消費(fèi)級(jí)芯片的量產(chǎn)初期良率在70-80%之間,但車(chē)規(guī)要求接近100%。一顆5nm晶圓的價(jià)格在1.5到2萬(wàn)美元之間,如果良率只有80%,意味著每10顆芯片就有2顆報(bào)廢,每顆芯片的廢品成本直接增加幾百美元。流片本身更貴——5nm單次流片成本在2000到3000萬(wàn)美元,理想做了不止一次流片,累計(jì)成本可能達(dá)到5000到8000萬(wàn)美元。
車(chē)規(guī)芯片和消費(fèi)芯片的本質(zhì)區(qū)別,可以用一個(gè)數(shù)字來(lái)概括:15年。一顆裝在車(chē)上的芯片需要在15年的生命周期內(nèi)不發(fā)生關(guān)鍵故障。這15年里,它要經(jīng)歷數(shù)萬(wàn)次高溫低溫循環(huán)、上百萬(wàn)次振動(dòng)沖擊、以及各種意想不到的極端工況——比如車(chē)輛長(zhǎng)時(shí)間停放在50度以上的戶(hù)外停車(chē)場(chǎng),芯片殼體溫度可能飆到120度甚至更高。消費(fèi)芯片在這種工況下大概撐不過(guò)半年。
為了達(dá)到這個(gè)可靠性要求,芯片設(shè)計(jì)階段就需要做大量的冗余和加固:增加防護(hù)二極管來(lái)抵抗靜電沖擊,采用更保守的時(shí)序約束來(lái)應(yīng)對(duì)溫度波動(dòng),在關(guān)鍵電路中加入錯(cuò)誤檢測(cè)和糾正(ECC)機(jī)制。這些加固措施會(huì)直接蠶食芯片面積——同樣是5nm工藝,車(chē)規(guī)芯片的實(shí)際可用面積比消費(fèi)芯片少10%到15%,相當(dāng)于同樣大小的芯片上能塞進(jìn)去的計(jì)算單元更少。
產(chǎn)能是第二道鬼門(mén)關(guān)。臺(tái)積電5nm產(chǎn)能的優(yōu)先級(jí)排序是:蘋(píng)果第一梯隊(duì)、AMD和高通第二梯隊(duì)、其他客戶(hù)排后面。車(chē)企作為芯片行業(yè)的新玩家,在這個(gè)排隊(duì)體系中不占優(yōu)勢(shì)。理想的應(yīng)對(duì)策略是提前鎖定產(chǎn)能——代價(jià)是更長(zhǎng)的交付周期和更高的預(yù)付成本,而這筆預(yù)付款在2025年理想利潤(rùn)已經(jīng)下滑99%的背景下,財(cái)務(wù)壓力不小。
據(jù)行業(yè)估算,臺(tái)積電2025年5nm及以下先進(jìn)制程的總產(chǎn)能約為每月15萬(wàn)片晶圓,其中蘋(píng)果占據(jù)了超過(guò)60%的份額。留給所有其他客戶(hù)——包括AMD、高通、聯(lián)發(fā)科、英偉達(dá),以及理想這樣的新玩家——的產(chǎn)能不到6萬(wàn)片。在僧多粥少的局面下,理想的籌碼不多:它的芯片出貨量目前還遠(yuǎn)不能與蘋(píng)果和高通相比,議價(jià)能力有限。但在地緣政治的壓力下,臺(tái)積電也有動(dòng)力拓展中國(guó)大陸以外的客戶(hù)基礎(chǔ),這為理想這樣的新玩家提供了一個(gè)微妙的窗口期。
認(rèn)證是第三道鬼門(mén)關(guān)。AEC-Q100認(rèn)證通常需要12到18個(gè)月,功能安全認(rèn)證ISO 26262 ASIL-D的周期更長(zhǎng)。理想從流片到量產(chǎn)只留了14個(gè)月,這意味著認(rèn)證流程必須被高度壓縮并行——設(shè)計(jì)階段就開(kāi)始預(yù)認(rèn)證準(zhǔn)備,流片回來(lái)同步啟動(dòng)多項(xiàng)測(cè)試。這在工程上不是不可能,但對(duì)項(xiàng)目管理能力提出了極高要求。
馬赫100最激進(jìn)的決策不是5nm制程,而是架構(gòu)路線(xiàn)。
當(dāng)前智駕芯片的主流架構(gòu)是英偉達(dá)定義的GPGPU路線(xiàn)——通用圖形處理器,通過(guò)大規(guī)模并行計(jì)算單元和多層緩存來(lái)處理AI任務(wù)。這條路線(xiàn)的核心優(yōu)勢(shì)是生態(tài)成熟:CUDA平臺(tái)擁有超過(guò)400萬(wàn)開(kāi)發(fā)者,PyTorch、TensorFlow等主流框架全部原生支持,車(chē)企拿到芯片就能直接跑模型,不需要從零開(kāi)始適配。
理想選了另一條路:數(shù)據(jù)流(Dataflow)架構(gòu)。
數(shù)據(jù)流架構(gòu)的原理很簡(jiǎn)單——讓數(shù)據(jù)在計(jì)算單元之間直接流動(dòng),繞過(guò)傳統(tǒng)架構(gòu)中的緩存瓶頸。打個(gè)比方:GPGPU就像一個(gè)大型倉(cāng)庫(kù),所有貨物必須先入庫(kù)、再出庫(kù),倉(cāng)庫(kù)越大吞吐量越高但也越慢;數(shù)據(jù)流架構(gòu)像一個(gè)傳送帶網(wǎng)絡(luò),貨物從入口直接送到出口,中間不停頓。
理想官方給出的數(shù)據(jù)是:相比通用芯片,馬赫100在理想自研算法上性能提升200%,功耗降低40%。200%的性能提升和40%的功耗降低,在芯片行業(yè)算得上是代際級(jí)的差距。但這個(gè)數(shù)據(jù)有一個(gè)前提條件——"在理想自研算法上"。也就是說(shuō),馬赫100的性能優(yōu)勢(shì)不是通用的,而是建立在與理想自家算法深度協(xié)同的基礎(chǔ)之上。
這個(gè)選擇帶來(lái)的供應(yīng)鏈影響是深遠(yuǎn)的。GPGPU架構(gòu)可以復(fù)用英偉達(dá)成熟的工具鏈和開(kāi)發(fā)者生態(tài),而數(shù)據(jù)流架構(gòu)需要理想自己構(gòu)建從底層硬件到上層算法的全棧能力。編譯器、驅(qū)動(dòng)程序、調(diào)試工具、模型轉(zhuǎn)換器——這些在CUDA生態(tài)中現(xiàn)成可用的工具,理想都需要自己開(kāi)發(fā)。
理想CTO謝炎曾透露,芯片團(tuán)隊(duì)需要同時(shí)覆蓋從硬件設(shè)計(jì)到軟件棧的全鏈條。這意味著500人的團(tuán)隊(duì)里,不只有芯片設(shè)計(jì)工程師,還有編譯器專(zhuān)家、算法工程師、系統(tǒng)軟件工程師。這種全棧自研的投入強(qiáng)度,在國(guó)內(nèi)車(chē)企中幾乎找不到第二個(gè)案例。
選擇數(shù)據(jù)流架構(gòu)的賭注在于:如果理想的智駕算法持續(xù)領(lǐng)先,專(zhuān)用芯片的優(yōu)勢(shì)將被最大化;但如果未來(lái)算法路線(xiàn)發(fā)生重大變化——比如端到端大模型對(duì)架構(gòu)提出了新的要求——專(zhuān)用芯片可能需要重新設(shè)計(jì),靈活性遠(yuǎn)不如通用方案。這是一場(chǎng)效率與靈活性的經(jīng)典博弈。
芯片行業(yè)有一句老話(huà):"第一次流片不叫流片,叫交學(xué)費(fèi)。"
從立項(xiàng)到量產(chǎn),理想馬赫100的投入遠(yuǎn)不止流片費(fèi)。研發(fā)人力是最重的一塊——芯片團(tuán)隊(duì)從2022年的幾十人膨脹到2025年的500多人,按照芯片行業(yè)資深工程師年薪100到150萬(wàn)元估算,四年人力成本累計(jì)超過(guò)30億元。EDA工具授權(quán)是另一筆持續(xù)支出——Synopsys、Cadence、Siemens EDA的專(zhuān)業(yè)工具年費(fèi)從數(shù)百萬(wàn)到數(shù)千萬(wàn)美元不等,5nm制程的標(biāo)準(zhǔn)單元庫(kù)和內(nèi)存IP授權(quán)費(fèi)用還要按出貨量階梯計(jì)費(fèi)。
把這些加在一起——人力、EDA、IP、多次流片、晶圓采購(gòu)——從立項(xiàng)到量產(chǎn)交付的累計(jì)投入大致在50到80億元之間。
80億對(duì)2025年的理想意味著什么?理想2025年財(cái)報(bào)顯示凈利潤(rùn)同比下滑99%,全年盈利僅剩不到1億元。研發(fā)投入?yún)s從2024年的109億元增長(zhǎng)到超過(guò)200億元。利潤(rùn)在塌方,研發(fā)在膨脹,芯片項(xiàng)目貢獻(xiàn)了相當(dāng)大一部分的膨脹。
但這是一筆不得不花的錢(qián)。理想L系列目前搭載的是英偉達(dá)Orin X芯片,單顆采購(gòu)成本在數(shù)百美元,年出貨量按30萬(wàn)輛計(jì)算,僅芯片采購(gòu)費(fèi)就超過(guò)10億元。如果馬赫100能夠逐步下放到L6、L7等走量車(chē)型,替代掉外部采購(gòu)的Orin芯片,每年可以節(jié)省數(shù)十億的供應(yīng)商成本。
更重要的是戰(zhàn)略自主權(quán)。過(guò)去兩年里,英偉達(dá)芯片供應(yīng)緊張導(dǎo)致多家車(chē)企被迫調(diào)整產(chǎn)品節(jié)奏——特斯拉就曾因?yàn)镠W4.0芯片交付延遲而推遲了部分車(chē)型的交付。自研芯片意味著理想不再受制于外部供應(yīng)商的產(chǎn)能和排期,產(chǎn)品節(jié)奏完全自主可控。
另一個(gè)容易被忽視的價(jià)值是數(shù)據(jù)安全。智駕芯片處理的不僅是算法推理,還包括大量的道路感知數(shù)據(jù)、用戶(hù)行為數(shù)據(jù)和環(huán)境信息。當(dāng)這些數(shù)據(jù)在一顆由英偉達(dá)設(shè)計(jì)和制造的芯片上處理時(shí),數(shù)據(jù)流向和存儲(chǔ)方式在某種程度上取決于芯片廠(chǎng)商的技術(shù)架構(gòu)。自研芯片讓理想對(duì)數(shù)據(jù)全鏈路有了更強(qiáng)的掌控力——這在數(shù)據(jù)主權(quán)意識(shí)日益增強(qiáng)的當(dāng)下,是一個(gè)越來(lái)越重要的戰(zhàn)略考量。
從更長(zhǎng)遠(yuǎn)的角度看,自研芯片還為理想打開(kāi)了"技術(shù)輸出"的可能性。如果馬赫100的性能表現(xiàn)能夠經(jīng)受市場(chǎng)驗(yàn)證,理想未來(lái)不排除將芯片方案授權(quán)給其他車(chē)企——類(lèi)似于華為向其他品牌提供智駕方案的模式。一旦芯片成為可對(duì)外輸出的產(chǎn)品,80億的投入就有望從"純成本"轉(zhuǎn)化為"平臺(tái)投資",商業(yè)模型將發(fā)生質(zhì)的變化。當(dāng)然,這個(gè)遠(yuǎn)景距離現(xiàn)在還太遠(yuǎn),但方向是明確的。
馬赫100在紙面上夠強(qiáng)。但截至2026年4月北京車(chē)展,有三個(gè)問(wèn)題還沒(méi)有答案。
第一個(gè)問(wèn)題是代工廠(chǎng)。理想從未公開(kāi)確認(rèn)代工廠(chǎng)商,行業(yè)普遍推測(cè)是臺(tái)積電。如果是臺(tái)積電,在地緣政治不確定性持續(xù)升溫的背景下,5nm先進(jìn)制程的供應(yīng)穩(wěn)定性能否保證?如果未來(lái)臺(tái)積電的先進(jìn)制程產(chǎn)能受到政策限制,理想是否有備選方案?這個(gè)問(wèn)題理想不可能在公開(kāi)場(chǎng)合回答,但它確實(shí)存在。
第二個(gè)問(wèn)題是認(rèn)證進(jìn)度。14個(gè)月完成從流片到量產(chǎn)的全部認(rèn)證,這個(gè)時(shí)間表在芯片行業(yè)幾乎沒(méi)有先例。如果某個(gè)認(rèn)證環(huán)節(jié)出現(xiàn)意外延遲——比如溫度循環(huán)測(cè)試中發(fā)現(xiàn)可靠性問(wèn)題,或者功能安全評(píng)估中需要補(bǔ)充設(shè)計(jì)修改——L9 Livis的交付節(jié)奏可能受到影響。理想計(jì)劃在2026年Q2發(fā)布L9 Livis,時(shí)間窗口已經(jīng)非常緊湊。
第三個(gè)問(wèn)題是有效算力的真實(shí)性。理想宣稱(chēng)雙馬赫100的有效算力是英偉達(dá)Thor-U的5到6倍,這個(gè)數(shù)字來(lái)自理想自己的測(cè)試環(huán)境。實(shí)驗(yàn)室數(shù)據(jù)和真實(shí)道路數(shù)據(jù)之間往往存在顯著差距——面對(duì)暴雨、逆光、突發(fā)施工等極端場(chǎng)景,馬赫100的表現(xiàn)是否還能保持同樣的優(yōu)勢(shì)?這個(gè)問(wèn)題只有等到大規(guī)模路測(cè)數(shù)據(jù)出來(lái)之后才能回答。
三個(gè)問(wèn)題的答案,都不會(huì)在車(chē)展上揭曉。馬赫100既是一張被理想高調(diào)亮出的技術(shù)王牌,也是一場(chǎng)供應(yīng)鏈和工程能力的極限測(cè)試——贏(yíng)了,理想將擁有行業(yè)內(nèi)最強(qiáng)的智駕算力底座;輸了,80億的投入和14個(gè)月的壓縮工期,都會(huì)成為質(zhì)疑的焦點(diǎn)。
這場(chǎng)測(cè)試的結(jié)果,大概要等到2026年秋天才能看清。
把理想馬赫100放在更大的坐標(biāo)系里看,會(huì)發(fā)現(xiàn)一個(gè)有意思的現(xiàn)象:中國(guó)車(chē)企自研芯片正在形成一股清晰的趨勢(shì)浪潮。
特斯拉是最早動(dòng)手的。2020年,特斯拉在Model 3/Y上搭載自研的FSD芯片(HW3.0),單顆算力72 TOPS,替代了此前使用的英偉達(dá)Drive PX2。當(dāng)時(shí)的算力并不驚人,但意義在于證明了"車(chē)企造芯片"這件事在商業(yè)上是可行的——自研芯片讓特斯拉不再受制于英偉達(dá)的產(chǎn)品節(jié)奏和定價(jià)策略。
小鵬緊隨其后。2025年第二季度,小鵬圖靈芯片實(shí)現(xiàn)量產(chǎn)上車(chē),搭載于P7+等新車(chē)型。圖靈芯片采用5nm制程,單顆算力750 TOPS,雖然沒(méi)有馬赫100那么激進(jìn),但小鵬勝在節(jié)奏——它是國(guó)內(nèi)第一個(gè)把自研智駕芯片真正送上路的車(chē)企。
蔚來(lái)神璣NX9031也在2026年進(jìn)入量產(chǎn)階段。5nm制程,集成超過(guò)500億個(gè)晶體管,同樣走自研路線(xiàn)。蔚來(lái)的打法與理想不同——它沒(méi)有選擇數(shù)據(jù)流這種激進(jìn)架構(gòu),而是更偏向通用計(jì)算路線(xiàn),降低了對(duì)特定算法的依賴(lài)。
三家車(chē)企的芯片路線(xiàn)雖然各有側(cè)重,但共同點(diǎn)很明確:不再把智駕算力的命門(mén)交到英偉達(dá)手上。 這個(gè)共識(shí)的形成不是一天兩天的事。2023年英偉達(dá)Orin芯片曾出現(xiàn)過(guò)長(zhǎng)達(dá)數(shù)月的交付延遲,多家新勢(shì)力的智駕功能升級(jí)被迫推遲,讓整個(gè)行業(yè)意識(shí)到了"核心算力不能受制于人"的戰(zhàn)略風(fēng)險(xiǎn)。
從趨勢(shì)上看,車(chē)企自研芯片正在從"敢不敢"的問(wèn)題轉(zhuǎn)向"做得好不好"的問(wèn)題。理想馬赫100用ISCA論文和5nm數(shù)據(jù)流架構(gòu)回答了前半句,后半句要交給市場(chǎng)和時(shí)間。
(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))新智駕北京車(chē)展2026專(zhuān)題)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章