日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給高允毅
發(fā)送

0

正面剛老黃!谷歌TPU 8i的「偷家」戰(zhàn)術(shù):不打最貴的仗,只割最肥的肉

本文作者: 高允毅   2026-04-30 11:52
導(dǎo)語:“不煉大模型了,搞Agent代理才是大生意。 ”

在拉斯維加斯Google Cloud Next大會(huì),谷歌高級副總裁Amin Vahdat掏出的不是一枚芯片,而是兩枚:TPU 8t與TPU 8i。 這是谷歌TPU家族史上第一次明確“分家”:一枚專攻訓(xùn)練,一枚專注推理。

“隨著AI智能體的興起,我們認(rèn)為社區(qū)將受益于分別針對訓(xùn)練和服務(wù)需求進(jìn)行優(yōu)化的芯片。”Amin Vahdat在官方博客中寫道。

正面剛老黃!谷歌TPU 8i的「偷家」戰(zhàn)術(shù):不打最貴的仗,只割最肥的肉

谷歌率先釋放了一個(gè)明確信號,過去那個(gè)只要抱緊英偉達(dá)大腿、靠“萬能芯片”的草莽時(shí)代翻篇,正式進(jìn)入了像流水線車間一樣“精細(xì)化分工”的時(shí)代。

而這場“分家”的核心焦點(diǎn),正是那枚為“奔跑”而生的TPU 8i,以及它背后那個(gè)即將噴涌的“Agentic AI”時(shí)代。


TPU為什么要分家

為什么谷歌非要把芯片一分為二?答案很簡單:效率。

訓(xùn)練和推理看似都是AI算力的活兒,本質(zhì)上完全不同。訓(xùn)練像學(xué)霸埋頭啃完整個(gè)人類圖書館,追求的是“大力出奇跡”,核心是把模型能力“錘煉”出來;推理則像學(xué)霸畢業(yè)后去大廠當(dāng)客服,重點(diǎn)不再是誰懂得最多,而是誰回得夠快、成本夠低、性價(jià)比夠高。

過去,業(yè)界默認(rèn)一顆芯片兼顧訓(xùn)練和推理,是因?yàn)槟菚r(shí)AI還處在算力早期:模型沒那么大,場景沒那么多,統(tǒng)一架構(gòu)至少可以攤薄研發(fā)成本。但到了Agentic AI時(shí)代,這套邏輯開始失效。訓(xùn)練和推理的訴求,已經(jīng)變得幾乎不可調(diào)和的地步。

過去兩年,硅谷的風(fēng)向已經(jīng)從“大模型狂熱”轉(zhuǎn)向“智能體熱”。AI不再只是一個(gè)陪你聊天的對話框,而是一個(gè)會(huì)接任務(wù)、會(huì)調(diào)工具、會(huì)連續(xù)干活的“數(shù)字員工”。而Agent帶來的推理事務(wù)量,往往是普通聊天機(jī)器人的20到50倍,遠(yuǎn)超行業(yè)現(xiàn)狀。

企業(yè)的成本焦慮,迅速從“訓(xùn)練太貴”,轉(zhuǎn)向“推理更貴”。

算筆經(jīng)濟(jì)賬。訓(xùn)練芯片為了追求“大力出奇跡”,必須配備極其昂貴的HBM。HBM的成本約占整塊芯片成本的40%-50%,且十分稀缺。 拿這種高成本的訓(xùn)練芯片,去跑Agent每天幾十萬次的高頻推理請求,相當(dāng)于用洲際導(dǎo)彈送外賣。企業(yè)的運(yùn)營成本會(huì)迅速攀升,商業(yè)化落地也就無從談起。

“關(guān)鍵在于如何以最低的每筆交易成本實(shí)現(xiàn)最低的響應(yīng)延遲。交易量正在大幅攀升,而每筆交易的成本必須大幅下降,才能實(shí)現(xiàn)規(guī)模化。”谷歌云人工智能與計(jì)算基礎(chǔ)架構(gòu)副總裁Mark Lohmeyer如此說道。

所以,谷歌這次徹底把業(yè)務(wù)剝離了。

正面剛老黃!谷歌TPU 8i的「偷家」戰(zhàn)術(shù):不打最貴的仗,只割最肥的肉

先看算力怪獸TPU 8t。

單個(gè)超級模塊可以集成9600顆芯片,提供121 exaflops算力和2PB共享內(nèi)存,計(jì)算性能較前代提升近3倍;新的Virgo橫向擴(kuò)展架構(gòu),則讓單個(gè)集群可以調(diào)度超過100萬顆TPU芯片,能把前沿大模型的訓(xùn)練周期,從“數(shù)月”壓縮到“數(shù)周”。

正面剛老黃!谷歌TPU 8i的「偷家」戰(zhàn)術(shù):不打最貴的仗,只割最肥的肉

在電力成為數(shù)據(jù)中心核心瓶頸的今天,它能在同等價(jià)格下性能提升2.8倍,每瓦性能提升124%,本身就是大模型訓(xùn)練的硬通貨。

再看省錢專家TPU8i。

首先,谷歌給芯片換了個(gè)完全不同的“大腦”結(jié)構(gòu),精準(zhǔn)解決了 Agent 時(shí)代高頻交互的痛點(diǎn)。

它先給芯片的“短期記憶”來了個(gè)史詩級加強(qiáng),讓片上 SRAM 直接擴(kuò)容 3 倍。這讓芯片隨手就能抓到關(guān)鍵數(shù)據(jù),不用每走一步都去“翻內(nèi)存字典”,極大減少了數(shù)據(jù)在搬運(yùn)途中的損耗。 這 3 倍的 SRAM 空間,配合上 288GB 的“怪獸級”HBM 內(nèi)存,從根源上解決了 AI 思考時(shí)的“腦卡頓”,讓 TPU 8i 成了專為復(fù)雜任務(wù)而生的“推理暴君”。

更硬核的是省電。在算力中心,電力的盡頭就是物理極限。TPU 8i 的能效比直接較上一代提升117%。這意味著谷歌云可以用同樣的一張電費(fèi)賬單,支撐起近乎兩倍的推理服務(wù)。

可以說,TPU8i為谷歌拿下 Agent 時(shí)代的 “商業(yè)化入場券”。

據(jù)Gartner預(yù)測,到2026年底,40%的企業(yè)應(yīng)用將嵌入特定任務(wù)的AI Agent 。而在麥肯錫的算盤里,到2030年,由Agentic AI帶來的商業(yè)機(jī)會(huì)高達(dá)3萬億至5萬億美元。

技術(shù)再牛,模型再聰明,如果跑一次推理的成本高到客戶掏不起錢,那就是一場空中樓閣。谷歌把芯片一分為二,就是在向整個(gè)行業(yè)宣告:AI的下半場,誰能把“勞務(wù)費(fèi)”打下來,誰才能笑到最后。


Meta、Anthropic站臺(tái),新的算力聯(lián)盟浮現(xiàn)?

谷歌關(guān)于“算力分工”的預(yù)判,正在被市場用真金白銀證實(shí)。Meta和Anthropic這兩家AI巨頭率先“入伙”,成了TPU v8的首批“吃螃蟹者”。

正面剛老黃!谷歌TPU 8i的「偷家」戰(zhàn)術(shù):不打最貴的仗,只割最肥的肉

先看Anthropic,這家當(dāng)下最炙手可熱的AI獨(dú)角獸。掌門人Dario Amodei雖然沒到現(xiàn)場,但特意錄了視頻站臺(tái),確認(rèn)其下一代模型的早期開發(fā),已經(jīng)在谷歌TPU 8t集群上跑了數(shù)月。而且Anthropic更是與谷歌強(qiáng)綁定,計(jì)劃在2027年前繼續(xù)向AWS和谷歌云簽下的是數(shù)吉瓦級TPU算力協(xié)議,提前鎖定支撐客戶需求爆發(fā)所必需的算力資源。

在Agentic AI時(shí)代,芯片與軟件的邊界正在消融。谷歌與Anthropic的關(guān)系,早已超越了單純的貨架買賣,進(jìn)化為一種深度共生的“軟件—硅反饋循環(huán)”。雙方的共同研發(fā),讓TPU的光學(xué)互聯(lián)元件與MoE架構(gòu)實(shí)現(xiàn)了底層原生的基因咬合。這種深度的“軟硬一體”調(diào)優(yōu),直接擊穿了單次推理的Token成本。對Anthropic而言,這轉(zhuǎn)化成了Claude在商業(yè)戰(zhàn)場上的成本定價(jià)權(quán);對谷歌而言,Anthropic則是最頂級的“實(shí)戰(zhàn)壓力測試場”,支撐它在不交“英偉達(dá)稅”的道路上,擁有了一個(gè)全球領(lǐng)先的盟友和陪練。

幾乎同時(shí),Meta也被曝已與谷歌簽署價(jià)值數(shù)十億美元、為期多年的TPU使用協(xié)議。這筆交易直接導(dǎo)致消息披露當(dāng)天,英偉達(dá)股價(jià)應(yīng)聲下跌4%。

這是否意味著一個(gè)“反英偉達(dá)”的新聯(lián)盟已經(jīng)形成?

這其實(shí)更像是一次“務(wù)實(shí)的結(jié)盟”,而非“桃園結(jié)義”。對于Anthropic和Meta這樣的算力“吞金獸”而言,當(dāng)前最害怕的兩件事是:拿不到足夠的算力,或者算力成本壓垮商業(yè)模式。

英偉達(dá)GPU雖是行業(yè)黃金標(biāo)準(zhǔn),但其價(jià)格、供貨周期和潛在的供應(yīng)鏈風(fēng)險(xiǎn),迫使頂級客戶必須尋找“第二選擇”以分散風(fēng)險(xiǎn)、增強(qiáng)議價(jià)能力。 谷歌TPU,就是這個(gè)“Plan B”。

Anthropic就明確表示,其采用多平臺(tái)策略,同時(shí)在AWS Trainium、Google TPU和NVIDIA GPU上運(yùn)行Claude。

對谷歌而言,這絕非簡單的“賣芯片”生意。TPU不單獨(dú)出售,只通過Google Cloud提供服務(wù)??蛻羰褂肨PU,往往會(huì)自然而然地進(jìn)入谷歌的全棧AI云生態(tài):從數(shù)據(jù)處理、模型訓(xùn)練到推理部署,乃至與Workspace等應(yīng)用集成。 谷歌爭奪的,是AI時(shí)代的云入口和定價(jià)權(quán)。當(dāng)一家大模型公司將其核心訓(xùn)練和推理負(fù)載遷至谷歌云,它購買的不僅是算力時(shí)間,更是將未來業(yè)務(wù)的一部分根基,埋在了谷歌的土壤里。

摩根士丹利分析師 Brian Nowak 指出,谷歌TPU的年產(chǎn)量預(yù)計(jì)在 2027 年達(dá)到 500 萬顆,到 2028 年將進(jìn)一步增長至 700 萬顆。估算每對外銷售 50 萬顆 TPU,就可能為谷歌帶來約 130 億美元的新增收入。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))分析,這是屬于谷歌的機(jī)會(huì)。


老黃危機(jī)?英偉達(dá)“泥潭式”護(hù)城河

那么最尖銳的問題來了:谷歌兩枚芯片齊發(fā),黃仁勛是不是該慌了?

至少現(xiàn)在,還遠(yuǎn)沒到可以做空英偉達(dá)的時(shí)候。

知名分析師Patrick Moorhead在X上調(diào)侃過一段辛酸往事,2016年谷歌發(fā)布第一代TPU時(shí),他就曾大放厥詞說英偉達(dá)要完蛋。結(jié)果呢?今天英偉達(dá)市值接近5萬億美元。

谷歌和英偉達(dá)的關(guān)系,不是一刀切的“敵我陣營”。

就在推出 TPU 8i 的同時(shí),谷歌云也明確表示,這款芯片對英偉達(dá)是“補(bǔ)充”,不是“替代”。谷歌一邊發(fā)布自研 TPU,一邊繼續(xù)引入英偉達(dá)最新的 Vera Rubin 實(shí)例,并推進(jìn)網(wǎng)絡(luò)軟件層面的合作。合作姿態(tài)十足。

為什么谷歌干不掉老黃?因?yàn)橛ミ_(dá)的壁壘,早就不只是芯片本身了。

首先是英偉達(dá)護(hù)城河CUDA。

全世界成千上萬的AI開發(fā)者,從上學(xué)第一天起敲的就是CUDA代碼。英偉達(dá)不是只賣芯片,它賣的是一個(gè)完整的系統(tǒng)。這種“認(rèn)知慣性”形成的遷移成本高到令人吐血,企業(yè)寧愿支付“英偉達(dá)稅”。

其次是英偉達(dá)近乎不給對手喘息空間的迭代速度。

英偉達(dá)的恐怖之處在于其超越摩爾定律的迭代速度,也就是黃仁勛推崇的 “One-Year Rhythm”(一年一迭代) 節(jié)奏。

正如英偉達(dá)首席科學(xué)家 Bill Dally 所言,英偉達(dá)通過垂直整合,在過去 10 年實(shí)現(xiàn)了系統(tǒng)性能 1000 倍的飛躍。當(dāng)谷歌的 TPU 8i 試圖通過優(yōu)化 SRAM 解決推理瓶頸時(shí),英偉達(dá)的 Rubin GPU 已經(jīng)帶上了 HBM4 和高達(dá) 50 PFlops 的推理算力。

而且,英偉達(dá)賣的從來不是芯片,而是在賣整套 AI 基礎(chǔ)設(shè)施。

英偉達(dá)通過收購 Mellanox 并深度集成 BlueField DPU,構(gòu)建了一個(gè)封閉且高效的數(shù)據(jù)傳輸生態(tài)。如果你不用英偉達(dá)的 GPU,你就很難發(fā)揮其網(wǎng)絡(luò)的極致性能;如果你用了它的網(wǎng)絡(luò),你就必須忍受它的溢價(jià)。

谷歌很聰明,它知道用TPU全面取代GPU是癡人說夢。所以TPU 8i打的是“差異化偷家”。

只要你是個(gè)精打細(xì)算的企業(yè),只要你的AI Agent一秒鐘要打一萬個(gè)API調(diào)用,當(dāng)你看完CUDA開發(fā)版上的天文賬單后,你一定會(huì)默默點(diǎn)開Google Cloud的報(bào)價(jià)單,嘗試把推理業(yè)務(wù)切給這枚又省電、又便宜的TPU 8i。

在“煉大模型”的正面戰(zhàn)場,老黃依然是唯一的王;但在“跑 Agent”的精細(xì)化戰(zhàn)場,谷歌要靠 TPU 8i 割走英偉達(dá)的一塊肉。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

正面剛老黃!谷歌TPU 8i的「偷家」戰(zhàn)術(shù):不打最貴的仗,只割最肥的肉

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說