日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給楊依婷
發(fā)送

0

KV Cache需求暴漲32倍,AI如何重寫存儲產業(yè)鏈的「舊分工」?| MemoryS 2026觀察

本文作者: 楊依婷   2026-04-10 15:55
導語:“誰能解決AI時代數據搬運的功耗和延遲,誰就能定義下一個10年?!?

作者 | 楊依婷

編輯 | 包永剛

去年的CFMS|MemoryS峰會上,存儲廠商們討論的是:價格何時企穩(wěn)、QLC何時上量、AI PC何時落地。彼時,“AI會讓存儲變得更基礎、更關鍵”,還更像是一種行業(yè)判斷,一種面向未來的趨勢預演。

一年之后,站在MemoryS 2026的會場里,問題已經徹底變了。

人們談論的不再只是位元成本、顆粒供給和容量節(jié)奏,而是GPU利用率、token成本、系統(tǒng)調度效率,甚至物理AI場景中的實時決策能力。那些原本屬于AI基礎設施和系統(tǒng)架構層面的議題,正在越來越頻繁地出現在存儲產業(yè)的討論中心。

在傳統(tǒng)計算架構里,存儲的職責更多是“存”。數據被寫入、留存,在需要時調取,不需要時則靜靜停留在系統(tǒng)邊緣。它長期是BOM成本中的一項,是容量規(guī)劃的問題,而很少直接參與算力效率的定義。

但在大模型訓練與推理時代,這一角色被徹底改寫。

KV Cache的訪問延遲,開始直接影響token生成速率;Checkpoint的寫入效率,決定著GPU在訓練過程中的等待時間;SSD的IOPS密度,則進一步影響大模型推理場景下的并發(fā)能力和系統(tǒng)吞吐。

存儲開始進入計算主路徑,它決定數據流動的速度,也在某種程度上決定GPU算力能否被充分兌現。而這,正在反向重塑整個存儲產業(yè)鏈的分工邏輯。

存儲進入計算路徑,舊分工開始失效

AI推理有一個被反復討論的瓶頸:KV Cache。

大模型在處理長上下文時,需要把每一層、每一個token生成過程中的Key和Value結果臨時保存下來,以避免重復計算。上下文越長,并發(fā)越高,這部分緩存的體量就越驚人。

當高帶寬顯存無法繼續(xù)承接,KV Cache只能向下一層存儲介質下沉,NVMe SSD由此正式進入大模型推理的實時數據路徑。

如果說過去SSD的使命是“提升加載速度”,那么在AI時代,它開始直接約束或決定推理吞吐的上限。

慧榮科技總經理茍嘉章的總結更為直接:“新一代存儲,正在從數據存儲進入計算存儲?!?/p>

這句話幾乎點破了整個行業(yè)變化的本質。一旦存儲進入計算路徑,它就不再只是靜態(tài)保存數據,而是開始影響token生成效率:訪問時延影響輸出速度,IOPS密度決定并發(fā)能力,寫入效率左右Checkpoint節(jié)奏,最終共同作用于單位token成本。

也正因如此,AI場景對存儲提出的要求,已經明顯超出了“標準顆粒 + 通用主控 + 標準模組產線”這套舊模式的能力邊界。

2026年,全球也許沒有任何一款主流AI存儲產品能夠實現供需平衡。

表面看,這是先進產能持續(xù)向高毛利AI產品傾斜,消費級市場被進一步擠壓;但更深層的問題在于,即便產能跟上,舊有分工模式也難以高效承接AI場景對定制化、快速迭代的需求。

存儲廠商集體越界

當存儲真正進入計算路徑,產業(yè)鏈上原本清晰的角色邊界開始松動:主控廠介入系統(tǒng)定義,模組廠延伸至固件與方案優(yōu)化,各自補全過去并不屬于自己的能力版圖。

以慧榮為例,傳統(tǒng)主控的核心任務,是管理閃存介質、優(yōu)化讀寫效率,并在穩(wěn)定性、兼容性和壽命之間尋找平衡。但在AI時代,這套能力模型已經不夠。

如今,慧榮開始反復強調一種新的能力——性能動態(tài)調節(jié)。

慧榮科技總經理茍嘉章在與雷峰網(公眾號:雷峰網)交流時多次強調,主控需要“根據工作負載、功耗和需求量,在動態(tài)中快速調整”。這已經不再是傳統(tǒng)意義上的硬件參數調優(yōu),而是直接響應英偉達新架構中“上下文內存存儲(Context Memory Storage)”對實時調度的需求。

KV Cache需求暴漲32倍,AI如何重寫存儲產業(yè)鏈的「舊分工」?| MemoryS 2026觀察

換句話說,主控正在從“閃存控制器”,演變?yōu)锳I存儲系統(tǒng)里的調度層,它不只是負責把數據寫進去、讀出來,更開始參與數據在GPU、顯存和SSD之間的流動節(jié)奏定義。

這種變化,也在推動主控廠進一步向下游延伸。

慧榮正在積極與長江存儲聯合推進車規(guī)級方案,目標是在第三季度末至第四季度實現規(guī)模上量,直接供貨國內車廠。過去賣芯片的公司,如今越來越多地以“聯合方案提供方”的身份出現。

這意味著主控廠的商業(yè)角色也在變化:一方面向上理解AI工作負載,把主控納入系統(tǒng)調度;另一方面向下輸出完整方案,從賣芯片走向賣系統(tǒng)能力。

未來存儲產業(yè)的競爭,不再只發(fā)生在顆粒、主控或模組層,而是進一步延伸到封裝架構、異構互連和系統(tǒng)級協同,是生態(tài)、技術、產能、客戶、資本的綜合戰(zhàn)爭。

端側AI反向定義存儲

AI對存儲的重構,顯然不只發(fā)生在數據中心。

另一條同樣重要的戰(zhàn)場正在端側迅速展開——AI PC、機器人、游戲掌機、智能眼鏡,乃至更多尚未被完全定義的新型終端,都在把存儲推向更核心的位置。

正如眾多廠商在峰會上提到的,物理AI/端側AI將迎來更廣泛的發(fā)展,并帶來更智能化的體驗。而這些更新更好的體驗將帶來更多的產品溢價,足以抵抗存儲價格上漲的壓力。 “

這句話背后,點出了端側AI最現實的商業(yè)邏輯:只要體驗提升足夠明顯,存儲成本就不再只是成本,而會轉化為產品價值的一部分。

但與數據中心不同,端側AI面臨的不是單一性能問題,而是高度碎片化的場景挑戰(zhàn)。

一臺AI PC,需要在本地運行大模型,對存儲的核心訴求是大容量 + 高速讀??;一臺機器人,需要在高震動、高移動性的復雜環(huán)境中持續(xù)穩(wěn)定運行,同時還要支持后期擴容;一副智能眼鏡,則把需求進一步推向極致的小尺寸、低功耗和高集成度。

可插拔、可擴容、高抗震、小尺寸、高容量——這些要求往往彼此拉扯,很難通過同一款標準化模組同時滿足。

這也是為什么,端側AI正在比數據中心更早倒逼存儲方案走向場景化重構。

佰維給出的解法非常具有代表性。

針對機器人場景,其推出了一套 “BGA SSD + Mini SSD” 的組合方案:BGA SSD直接焊接在主板上,以更強抗震性承擔系統(tǒng)盤角色,保障操作系統(tǒng)和本地AI模型穩(wěn)定運行;Mini SSD則采用類SIM卡槽設計,支持用戶無工具插拔,作為數據盤解決嵌入式設備后期無法擴容的長期痛點。

這套方案的關鍵,并不只是形態(tài)創(chuàng)新,而是它背后的產品邏輯:把“穩(wěn)定”和“靈活”拆分為兩個獨立部件,并分別做到最優(yōu)。這本質上已經不是傳統(tǒng)意義上的“賣一塊SSD”,而是在重新定義機器人存儲架構。

更值得關注的是,佰維的動作并未停留在單一產品層面。

它正在推動Mini SSD從企業(yè)級方案,進一步走向行業(yè)標準。通過聯合產業(yè)鏈上下游成立IP公司,并同步制定激勵機制和權益金分配規(guī)則,佰維試圖把“可插拔存儲”推進為下一代AI終端的標準能力。

其目標場景并不局限于機器人,而是進一步覆蓋AI PC、游戲掌機等多類設備——這些終端當前仍采用不同形態(tài)的本地存儲方案,而Mini SSD的野心,是用統(tǒng)一接口去重新組織它們。

換句話說,它爭奪的不只是產品份額,而是下一代端側AI設備的標準定義權。

而在這個過程中,過去那套面向PC和手機時代的標準化存儲模組,已經越來越難承接碎片化、多形態(tài)、高迭代的終端需求。

更深層的變化在于,設備與存儲之間的關系,正在發(fā)生方向性的逆轉——過去,是設備定義存儲:設備要做什么,存儲就被動適配什么。

而現在,隨著本地AI能力越來越依賴容量、帶寬、功耗和形態(tài)協同,存儲開始反過來影響設備形態(tài)、產品定義,乃至最終用戶體驗。

下一戰(zhàn):功耗、延遲、智能

AI最大的痛點并非算力不足,而是數據在存儲與計算單元間的頻繁搬運,降低系統(tǒng)效率。如何減少數據在存儲與計算單元之間的頻繁搬運,已成為行業(yè)共同攻關的核心命題。

這句話放在一年前,可能還有點抽象。但經過過去一年產業(yè)鏈上下游一連串幾乎同步發(fā)生的變化之后,它開始落到一個個極其具體的技術指標上:KV Cache的訪問時延、Checkpoint的寫入效率、單位token成本等等。

過去十年,產業(yè)比拼的是單位容量的成本;下一個十年,勝負手將取決于數據在計算與存儲之間流動的效率、功耗與智能。

至于那些仍固守在舊分工里、只盯著顆粒價格波動的玩家,留給他們的時間,或許真的不多了。

雷峰網

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說