日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給趙之齊
發(fā)送

0

煒燁智算VP孟健雄:推理算力需求12個(gè)月內(nèi)或反超訓(xùn)練,只等爆款應(yīng)用落地 | 智算想象力十人談

本文作者: 趙之齊   2025-09-17 14:40
導(dǎo)語:以全球最高價(jià)買入GPU、再以全球最低價(jià)出租的國內(nèi)算力市場,背后癥結(jié)是什么?

作者 | 趙之齊

編輯 | 胡敏

煒燁智算VP孟健雄:推理算力需求12個(gè)月內(nèi)或反超訓(xùn)練,只等爆款應(yīng)用落地 | 智算想象力十人談


“5-10年內(nèi),算力行業(yè)可能從當(dāng)前的動(dòng)態(tài)平衡,逐步轉(zhuǎn)向長期的賣方市場?!?/p>

當(dāng)基模創(chuàng)業(yè)公司放緩訓(xùn)練腳步、數(shù)據(jù)中心退租現(xiàn)象頻發(fā),外界紛紛唱衰智算市場,商湯旗下負(fù)責(zé)智算業(yè)務(wù)的子公司煒燁智算的商務(wù)副總裁孟健雄,卻有此信心。

這份信心,源于他在智算領(lǐng)域的經(jīng)驗(yàn)與積累。2022年,孟健雄就加入算力領(lǐng)域知名公司、彼時(shí)算力板塊的“領(lǐng)頭羊”英博數(shù)科團(tuán)隊(duì),與團(tuán)隊(duì)共同打造了當(dāng)時(shí)中國最大的單體成建制高性能GPU集群。當(dāng)時(shí),他們把英偉達(dá)DGX A100 SuperPOD集群引入中國落地,后來也成為英偉達(dá)在中國唯一的AI創(chuàng)新賦能中心。“可以說,我們是智算行業(yè)的拓荒者”,他如此定位這段經(jīng)歷。

而后,孟健雄和核心團(tuán)隊(duì)離開英博數(shù)科,創(chuàng)立煒燁智算。公司聚焦智算中心全生命周期管理,業(yè)務(wù)覆蓋從前期規(guī)劃、基礎(chǔ)設(shè)施建設(shè)、供應(yīng)鏈整合,到后期運(yùn)維運(yùn)營及資本退出的完整鏈路,定位為新質(zhì)生產(chǎn)力資產(chǎn)管理平臺。

與此同時(shí),商湯科技在AI全鏈路技術(shù)領(lǐng)域的深厚積累,尤其是其大裝置平臺軟件的核心能力,吸引了團(tuán)隊(duì)的關(guān)注。雙方達(dá)成合作,煒燁智算引入商湯科技的天使輪投資,此后正式成為商湯科技智算業(yè)務(wù)板塊的核心載體,對接頭部KA客戶,成為商湯智算業(yè)務(wù)布局中的 “特種部隊(duì)”。

也因此,在大家普遍感受到智算市場的消納降溫、利潤下滑時(shí),處于大廠陣營內(nèi)的煒燁智算,仍能保持相對可觀的毛利率水平。

不過,孟健雄也看到了行業(yè)的消納痛點(diǎn)。在他看來,此前算力需求很多源于基礎(chǔ)大模型的訓(xùn)練,但當(dāng)前的核心瓶頸是LLM(大語言模型)撞到了數(shù)據(jù)的天花板,基模訓(xùn)練短期內(nèi)難以提供算力增量;可是,新的潛在消納動(dòng)能也已在醞釀:后續(xù)多模態(tài)對顯存和算力的需求很大,一旦能突破訓(xùn)練數(shù)據(jù)匱乏的困境,將引發(fā)遠(yuǎn)超 “2022-2023年全球算力荒” 的需求爆發(fā)。

在尚未走出消納困局的此刻,行業(yè)內(nèi)卷仍在加劇。孟健雄直接地點(diǎn)出國內(nèi)GPU市場的成本困境:“國內(nèi)市場是用全球最高的價(jià)格買GPU,再用全球最低的價(jià)格把它們租出去。”

他觀察到,比起物理屬性,GPU此刻更像是一種金融資產(chǎn),其價(jià)格是被Scaling Law這個(gè)宏大敘事?lián)纹饋淼模?strong>當(dāng)下GPU的價(jià)格其實(shí)是人們對AI未來發(fā)展的凈現(xiàn)值的預(yù)測。盡管一系列政策以及GPU服務(wù)器二手市場也已逐漸興起,為改善這種“高買低賣”的情況提供了可能,但具體效果還需要時(shí)間進(jìn)行檢驗(yàn)。

然而,在智算行業(yè)面對消納滯漲的同時(shí),算力相關(guān)廠商卻在二級市場迎來暖春——近來,協(xié)創(chuàng)數(shù)據(jù)、云天勵(lì)飛、銳捷網(wǎng)絡(luò)等多支算力概念股迎來大漲。孟健雄也指出,英偉達(dá)過去十幾年最大的技術(shù)突破發(fā)生在2012-2022年里,市值上升10倍卻發(fā)生在最近30個(gè)月里。對金融屬性非常敏感的他,認(rèn)為未來第三方AIDC廠商,除了和大客戶捆綁、定制化成長外,也要借助金融工具謀求出路,才能在大廠、運(yùn)營商稱霸的算力市場里有一席之地。

在“AI一天、人間一年”的當(dāng)下,孟健雄對算力行業(yè)的未來有何預(yù)判?推理算力需求什么時(shí)候會(huì)迎來爆發(fā)?未來端側(cè)與數(shù)據(jù)中心之間會(huì)呈現(xiàn)出什么形態(tài)?第三方AIDC廠商的出路又在哪里?以下是雷峰網(wǎng)與孟健雄的對話。為了方便理解,對話內(nèi)容經(jīng)編輯。


Agent算力需求何時(shí)爆發(fā)?樂觀估計(jì)6-12個(gè)月內(nèi)

雷峰網(wǎng):在DeepSeek出圈后,許多基模創(chuàng)業(yè)公司似乎也放慢了訓(xùn)練的腳步,數(shù)據(jù)中心退租現(xiàn)象明顯,這是否意味著未來數(shù)據(jù)中心市場需求會(huì)下降?在你看來,訓(xùn)練帶來的算力需求未來增長潛力預(yù)計(jì)如何?

孟健雄:我認(rèn)為,未來人們對算力的需求會(huì)有機(jī)會(huì)變成“無底洞”。

為什么這么說?一方面,現(xiàn)在LLM撞到數(shù)據(jù)的天花板了,基模的訓(xùn)練在短期內(nèi)提供不了什么算力需求增量;但在改善推理性能方面,后訓(xùn)練部分還會(huì)帶來一段時(shí)間的算力需求

但另一方面,多模態(tài)對顯存和算力的需求比LLM更大,只是多模態(tài)領(lǐng)域還沒有遇到一個(gè)Transformer之于LLM那樣的加速器,尤其是具身智能方向,現(xiàn)在可以說是有算法、有算力但沒數(shù)據(jù),一旦解決訓(xùn)練數(shù)據(jù)的匱乏,對算力的需求會(huì)比2022年底到2023年那段時(shí)間的“全球算力荒”更甚。

雷峰網(wǎng):除了訓(xùn)練這一核心需求外,當(dāng)下AI推理的需求也持續(xù)攀升,目前已經(jīng)帶來哪些具體的改變?

孟健雄:推理算力占比的暴漲,一是讓大模型本身by token API的生產(chǎn)力已經(jīng)廣泛商業(yè)化了,并且,Agent、DeepResearch這種極度吃推理算力的模型產(chǎn)品形態(tài),也找到了PMF,有用戶喜歡、也能收費(fèi),后面用量的繼續(xù)加速爬坡是個(gè)確定的事情。

雷峰網(wǎng):推理端用量加速爬坡,預(yù)計(jì)什么時(shí)候占比會(huì)比訓(xùn)練端更大?

孟健雄:這主要取決于爆款應(yīng)用什么時(shí)候出來。目前看起來,Agent是最有希望的方向,最接近消費(fèi)、對算力消耗也很大,行業(yè)里比較樂觀的估計(jì)是6-12個(gè)月內(nèi)。大廠們前段時(shí)間以來已經(jīng)開始增加推理算力配置,其實(shí)也是對這種預(yù)估的一種驗(yàn)證。

回顧起來距離我們最近的一場推理算力需求的爆發(fā)是挖礦,挖礦的盡頭是專用集成電路ASIC,現(xiàn)在AI應(yīng)用還沒有在這一方向上大量占領(lǐng)市場,只是因?yàn)橥评硇枨蟮奶卣鬟€沒收斂。

雷峰網(wǎng):有說法說,未來邊緣端數(shù)據(jù)會(huì)占整個(gè)社會(huì)總量數(shù)據(jù)的80%,在你看來,邊緣計(jì)算的崛起是否會(huì)影響智算中心發(fā)展的可持續(xù)性?

孟健雄:很好的問題。中長期來看,邊緣數(shù)據(jù)的采集效率及采集量、和邊緣推理計(jì)算的算力總量,注定會(huì)有一個(gè)爆發(fā)期,但這對中心化的數(shù)據(jù)中心來說,其實(shí)是synergy(協(xié)同發(fā)展)關(guān)系,而不是零和關(guān)系。

雷峰網(wǎng):怎么理解兩者間的協(xié)同?

孟健雄:拿具身智能舉例,每臺機(jī)器人、每輛電動(dòng)車、每架無人機(jī),都在不停采集多模態(tài)數(shù)據(jù)、在端側(cè)進(jìn)行實(shí)時(shí)計(jì)算,但如果工作在端側(cè)就結(jié)束了,那端側(cè)就依舊是孤島。

這些端側(cè)個(gè)體采集到的數(shù)據(jù)和反饋,海量、多樣、且結(jié)構(gòu)化,只有集中到中心化的數(shù)據(jù)中心或智算中心分析和訓(xùn)練計(jì)算,才能發(fā)揮價(jià)值。并且,也只有這些中心化的場所,能更低成本高效率地完成這種量級工作。

所以,一句話總結(jié),端側(cè)的發(fā)展實(shí)際上會(huì)為數(shù)據(jù)中心帶來需求的增量,而不是反過來影響其發(fā)展。

雷峰網(wǎng)(公眾號:雷峰網(wǎng)):最終兩者間會(huì)呈現(xiàn)出什么樣的狀態(tài),行業(yè)又應(yīng)該對此做些什么準(zhǔn)備?

孟健雄:大家常聽到的觀點(diǎn)是:日后邊緣計(jì)算與中心化計(jì)算的協(xié)同模式,是“邊緣計(jì)算+分布式數(shù)據(jù)中心”,但我們認(rèn)為,最終整個(gè)計(jì)算業(yè)態(tài),還是會(huì)收斂到“少數(shù)超大型中心化數(shù)據(jù)中心+與之高速互聯(lián)的邊緣節(jié)點(diǎn)”模式。

數(shù)據(jù)上說,小型邊緣節(jié)點(diǎn)PUE(能源使用效率)是2.0左右,遠(yuǎn)高于集約化數(shù)據(jù)中心的PUE 1.2-1.5,所以只有“超大型中心化+互聯(lián)邊緣”這種架構(gòu),才能使得整個(gè)體系的成本最低、效率最高。在這種趨勢下,能源與通信成本就是底層競爭力,從這個(gè)角度講,我非??春弥袊?。

雷峰網(wǎng):那整體來說,除了推理算力占比的提升,未來AIDC行業(yè)還會(huì)面臨什么新的挑戰(zhàn),AIDC廠商需要如何應(yīng)對?

孟健雄:可以從幾類不同的主體來看。對于大廠來說,平臺化的商務(wù)模式韌性很高,主要還是滿足整體市場內(nèi)的共性需求,捆綁自身能力銷售。運(yùn)營商這類主體,相對以追求資產(chǎn)價(jià)值為主,商務(wù)能力較強(qiáng)但創(chuàng)新能力存在一定提升空間。

而對于第三方AIDC廠商,盡頭是跟大客戶捆綁、定制化成長,也能因此最終走上自己獨(dú)特的技術(shù)路線,這個(gè)類別也會(huì)是金融工具使用最為頻繁的——因?yàn)榇髲S、運(yùn)營商自身的資金成本低,或者本身自有資金就很豐富,所以其它AIDC廠商可能就要借助資金杠桿上突破創(chuàng)新,才能與前兩者對齊。

但總的來說,接下來的算力市場,最底層共性還是要提升經(jīng)營效率、算力效率和能源效率,等達(dá)到效率優(yōu)化的邊際以后,資本熱點(diǎn)其實(shí)也就向生態(tài)上層轉(zhuǎn)移了。到時(shí)候,焦點(diǎn)會(huì)更多集中在數(shù)據(jù)、算法上的突破,和這些突破帶來的應(yīng)用層的價(jià)值,這一層最有想象空間。

雷峰網(wǎng):在未來資本市場焦點(diǎn)發(fā)生轉(zhuǎn)移前,當(dāng)下資本市場的關(guān)注焦點(diǎn),主要還放在什么層面?

孟健雄:先從最簡單的說,根據(jù)我們觀察,如果是純算力建設(shè)的項(xiàng)目,性質(zhì)更傾向于類債項(xiàng)目,就是風(fēng)險(xiǎn)和收益上與傳統(tǒng)債券有相似性的投資項(xiàng)目或資產(chǎn)。這部分投資者主要是看硬件軟件的先進(jìn)性和財(cái)務(wù)表現(xiàn),包括最重要的項(xiàng)目財(cái)務(wù)健康度和投資回報(bào)周期等。2023年、2024年一部分以市值管理為目的的投資者,也是用這個(gè)邏輯。

基于長期主義的投資者,考量角度就比較復(fù)雜了。算力是AI應(yīng)用的基礎(chǔ),中長期主義投資者會(huì)更關(guān)注未來上層的價(jià)值產(chǎn)出,智算項(xiàng)目的規(guī)模、算力效率、技術(shù)架構(gòu)乃至整個(gè)智算平臺生態(tài)的價(jià)值都是考量因素,屬于更偏向成長型權(quán)益類投資。

雷峰網(wǎng):那現(xiàn)在的算力市場,大家對智算項(xiàng)目的期待和考量,整體會(huì)比以前更理性了嗎?

孟健雄:是的,踩過很多市場亂象的坑后,現(xiàn)在大家會(huì)更關(guān)注項(xiàng)目穿透到最后是誰。不過市場上仍有時(shí)間差的,部分投資者還是2023年、2024年的思想狀態(tài),這跟大家入場時(shí)間點(diǎn)不同有很大關(guān)系。


“5-10年內(nèi),算力行業(yè)可能轉(zhuǎn)向賣方市場”

雷峰網(wǎng):你在2022年左右就加入英博數(shù)科團(tuán)隊(duì),可以說是很早一批踩過算力市場坑的人,在你看來,現(xiàn)在這些亂象問題背后的癥結(jié)是什么?

孟健雄:現(xiàn)在的市場亂象,比如包銷、消納協(xié)議違約等,是因?yàn)榇蠹摇安贿@么做就算不過來賬”,但說到底就是成本太高、售價(jià)太低

先說成本問題。其實(shí)GPU的價(jià)格是被Scaling Law這個(gè)宏大敘事?lián)纹饋淼?/strong>,英偉達(dá)這家公司在過去十幾年最大的技術(shù)突破發(fā)生在2012-2022年里,但市值上升10倍卻發(fā)生在最近30個(gè)月里,所以當(dāng)下GPU的價(jià)格,其實(shí)是人們對AI未來發(fā)展的凈現(xiàn)值的預(yù)測,這種定價(jià)思維偏離了成本考量的定價(jià)邏輯,把GPU物理產(chǎn)品變成了一種金融屬性的資產(chǎn)。

接下來是算力售價(jià)問題。國內(nèi)市場是用全球最高的價(jià)格買GPU、再用全球最低的價(jià)格把它們租出去。中國的算力供需市場除了電力成本比美國低,其它都比美國高,所以你看,美國人在喊智算的盡頭是能源,我們在發(fā)展國產(chǎn)可控自主。

雷峰網(wǎng):怎么理解GPU變成一種金融屬性的資產(chǎn)呢?

孟健雄:舉個(gè)例子,你買一臺用來做土建工程挖溝的挖掘機(jī),你就會(huì)關(guān)注這機(jī)器貴不貴、扛不扛風(fēng)吹日曬;但如果你買的是可以挖金礦的挖掘機(jī),是不是就不會(huì)對它的價(jià)格太敏感了?而且大家都想挖金礦,就算你不買,也有別人買,價(jià)格自然就高上去了。

雷峰網(wǎng):所以說,因?yàn)镚PU是AI這類“高收益項(xiàng)目” 的基礎(chǔ),它的價(jià)格就不再只是由硬件成本決定,而是像金融資產(chǎn)一樣,價(jià)格會(huì)隨收益預(yù)期和稀缺性而波動(dòng)。

孟健雄:是的。正好借此說回剛才提到的兩個(gè)問題癥結(jié),成本高這塊我們解決不了,產(chǎn)業(yè)鏈不在我們手里,所以能讓大家發(fā)揮點(diǎn)主觀能動(dòng)性的,就是售價(jià)這一塊——這也是更根本的地方。

投資方怕售價(jià)低、本兒收不回來,就會(huì)要求建設(shè)方運(yùn)營方包銷兜底。而在售價(jià)低的情況下,運(yùn)營方或消納方要想兌現(xiàn)協(xié)議,只能從各個(gè)方面努力爭取降低消納壓力,最直觀的就是能源補(bǔ)貼和算力券等方法。如果這些方法也爭取不到,違約退租就是消納方最后的止損方法。

雷峰網(wǎng):智算中心售價(jià)低,卻反而可能導(dǎo)致違約退租的情況出現(xiàn),如何理解這種看似矛盾的市場狀態(tài)呢?

孟健雄:現(xiàn)在的GPU租賃市場上,我們常聽到兩種相互矛盾的聲音:一種是“算力設(shè)備閑置、價(jià)格內(nèi)卷”,一種是“客戶在市場上找不到合適的算力、大廠們都忙著在全國收算力”,這兩種情況都真實(shí)存在。

但“設(shè)備閑置、價(jià)格內(nèi)卷”更具體點(diǎn)講,是“零散、異構(gòu)的算力匹配不到合適的客戶,而被迫閑置”。這有兩種可能,一是集群性能達(dá)不到專業(yè)客戶的要求;二是好不容易找到了要求一般的客戶、但用不了幾個(gè)月他們訓(xùn)練工作就結(jié)束了,與此同時(shí),新的用戶還沒找到,這些智算中心因?yàn)樵诳諜n期就被迫降價(jià)傾銷。

而與之對應(yīng)的“算力稀缺”情況,則是客戶們需要穩(wěn)定存儲、網(wǎng)絡(luò)和平臺軟件配套齊全的成建制集群。能達(dá)到這種水平的目前基本只有大廠,但大廠們自己也要用,高質(zhì)量資源售罄的情況下,想找到合格可用的算力也很難。

雷峰網(wǎng):性能和技術(shù)門檻,確實(shí)也是行業(yè)內(nèi)反復(fù)提到的導(dǎo)致現(xiàn)在算力“結(jié)構(gòu)性過?!钡囊粋€(gè)關(guān)鍵核心。但在你看來大家成建制集群跟不上大廠的原因是什么,真的是自身研發(fā)能力不夠嗎?

孟健雄:導(dǎo)致各地智算中心追不上大廠水平的原因,本質(zhì)還是在于這些項(xiàng)目是資本驅(qū)動(dòng)的。

資本更看中他們懂的那部分:不動(dòng)產(chǎn)、大機(jī)電、GPU等這些資產(chǎn)管理的東西,但智算中心能收多少租金,最終靠的是交付質(zhì)量。從資產(chǎn)到算力交付,中間隔著巨大的技術(shù)水平鴻溝。但現(xiàn)在市場上沒有那么多大廠供資本選擇,所以很多資本退而求其次,以最低配置跑步入場。

并且,一個(gè)智算項(xiàng)目同時(shí)還可能需要滿足太多其它目標(biāo),最終就形成了設(shè)備閑置、價(jià)格內(nèi)卷的現(xiàn)象。

雷峰網(wǎng):現(xiàn)在也已經(jīng)有一系列政策對這種現(xiàn)象進(jìn)行干預(yù),在你看來,這種情況有在好轉(zhuǎn)嗎?

孟健雄:長期看好,但可能短期內(nèi)不會(huì)改善。雖然國家出臺了相應(yīng)窗口文件,但其影響還需要一段時(shí)間來沉淀出結(jié)果。民間也有逐漸興起GPU服務(wù)器二手市場,也能對這種情況有改善,但具體改善多少,有待時(shí)間驗(yàn)證。

雷峰網(wǎng):結(jié)構(gòu)性過剩畢竟也是一種“過?!?,這意味著現(xiàn)在智算市場可能對大多數(shù)廠商來說,已經(jīng)飽和了嗎?

孟健雄:市場是有周期性的。具身智能(包括自動(dòng)駕駛)的iPhone時(shí)刻已經(jīng)到來,關(guān)鍵在于核心技術(shù)突破在什么時(shí)候發(fā)生,比如AI生成多模態(tài)訓(xùn)練數(shù)據(jù)的能力、電機(jī)和電池的革新。小周期應(yīng)該是從當(dāng)前供大于求,向供需平衡、直至供小于求發(fā)展。

雷峰網(wǎng):這個(gè)周期預(yù)計(jì)會(huì)多久?

孟健雄:我認(rèn)為未來5-10年內(nèi),算力市場會(huì)呈現(xiàn)出一個(gè)向長期賣方市場變化的趨勢。



煒燁與商湯“聯(lián)姻”背后:獲取技術(shù)與KA客戶資源的雙贏

雷峰網(wǎng):目前算力市場很多廠商是在貼著成本價(jià)去做,那么成立至今只有一年多的煒燁智算,利潤如何?

孟健雄:煒燁智算作為商湯科技智算業(yè)務(wù)板塊的載體,處于智算大廠陣營,天然有些技術(shù)優(yōu)勢和規(guī)模成本優(yōu)勢,這部分溢價(jià)讓煒燁智算的毛利率水平能保持在行業(yè)高位。

歷史上,百團(tuán)大戰(zhàn)最后就剩下美團(tuán)和餓了么,百模大戰(zhàn)迅速就只剩下頭部幾個(gè)基模,未來智算行業(yè)大概率也只會(huì)聚焦于經(jīng)營效率最優(yōu)化的頭部玩家,發(fā)展慢就會(huì)被動(dòng)下牌桌,這是客觀發(fā)展規(guī)律。

雷峰網(wǎng):但現(xiàn)在智算領(lǐng)域仍有許多創(chuàng)業(yè)公司存在。

孟健雄:創(chuàng)業(yè)公司要發(fā)展獨(dú)特性,或說細(xì)分市場,如果沒有差異化,就會(huì)敗給效率更高的平臺。大廠為了追求平臺效率最高,會(huì)優(yōu)先滿足客戶的共性需求,犧牲定制化。跟大廠競爭的事情交給運(yùn)營商去做。

雷峰網(wǎng):你們強(qiáng)調(diào)自己在做的是“智算中心的全生命周期管理”,這是否是你們的差異化?要做到這一點(diǎn),主要困難會(huì)在哪里?

孟健雄:現(xiàn)在市面上許多玩家都只負(fù)責(zé)數(shù)據(jù)中心建設(shè)其中某個(gè)環(huán)節(jié),但我們是從規(guī)劃、建設(shè)、供應(yīng)鏈、運(yùn)維運(yùn)營到資本退出,整個(gè)穿透。

我們團(tuán)隊(duì)從2022年底開始沉淀供應(yīng)鏈、技術(shù)、項(xiàng)目建設(shè)與運(yùn)營相關(guān)的資源,做這件事的主要難點(diǎn)就在于每個(gè)層級就都要有積累,不能為了一個(gè)項(xiàng)目臨時(shí)攢局。

雷峰網(wǎng):你們吸引到投資者,主要就是你們選擇的這條路線嗎?

孟健雄:還有我們的背景。煒燁智算創(chuàng)始團(tuán)隊(duì)在2022年,將英偉達(dá)DGX A100 SuperPOD集群引入中國落地的團(tuán)隊(duì),做成了當(dāng)時(shí)中國最大的單體成建制高性能GPU集群,是第一個(gè)做成這件事的人。后來我們成為英偉達(dá)在中國唯一的AI創(chuàng)新賦能中心,最早開始經(jīng)營英偉達(dá)生態(tài)建設(shè),我們認(rèn)為自己是智算行業(yè)早期的拓荒者。

商湯科技也是看中了我們的背景,在煒燁智算團(tuán)隊(duì)獨(dú)立創(chuàng)業(yè)后投資了我們,并把智算業(yè)務(wù)交給煒燁來做。

雷峰網(wǎng):團(tuán)隊(duì)出來創(chuàng)業(yè)時(shí),市場上投煒燁智算的人多嗎?為什么選擇了商湯呢?

孟健雄:當(dāng)時(shí)我們還挺搶手的,也和其他資方包括大廠談過,但最后選擇了商湯,是因?yàn)樯虦欠浅<夹g(shù)驅(qū)動(dòng)的公司,他們的技術(shù)加上煒燁智算自己的經(jīng)驗(yàn)和商業(yè)化能力,是一個(gè)很好的合作契機(jī),能讓商湯的技術(shù)能力在市場中得到最大化的回報(bào)。

雷峰網(wǎng):具體來說,商湯什么方面的技術(shù)對你們非常重要?

孟健雄:商湯在AI上的全鏈路技術(shù)全棧都有,但最貼近煒燁業(yè)務(wù)的是商湯大裝置的平臺軟件能力。

目前市面上經(jīng)歷過長期生產(chǎn)環(huán)境檢驗(yàn)、支持異構(gòu)混訓(xùn)的這種真正能打的GPU云服務(wù)平臺不多,商湯可以說是國內(nèi)最早一批做異構(gòu)的企業(yè),從成立的第一天就開始。

異構(gòu)混推本來就很難,混訓(xùn)對技術(shù)要求更高,因?yàn)榛煊?xùn)后如果效率拉低就沒有生產(chǎn)意義了。早先商湯沒有那么多卡的時(shí)候,就只能“被迫”混訓(xùn)。在人工智能還沒現(xiàn)在這么火的時(shí)候,他們已經(jīng)開始做積累。

雷峰網(wǎng):那商湯投資了煒燁智算后,是否會(huì)給煒燁提供客戶入口,相當(dāng)于會(huì)幫助解決消納?

孟健雄:商湯自身的算力剛需很大,確實(shí)在必要時(shí)可以提供消納方面的支持。不過更準(zhǔn)確說,是煒燁為商湯提供更多樣化的客戶入口,尤其是頂級AI客戶和頭部行業(yè)客戶。

雷峰網(wǎng):不過你們和商湯自身大裝置團(tuán)隊(duì)之間的客源如何區(qū)分呢?

孟健雄:商湯的大裝置平臺商務(wù)團(tuán)隊(duì)人多,集團(tuán)化作戰(zhàn)效率很高,煒燁相比起來團(tuán)隊(duì)規(guī)模小,但打的都是top級KA客戶,單個(gè)客戶ARPU值(每用戶平均收入)極高,形象一點(diǎn)說是“特種部隊(duì)”。

雷峰網(wǎng):那么現(xiàn)在煒燁智算在算力上的布局情況和主要業(yè)務(wù)方向如何?整體出租率如何?

孟健雄:目前實(shí)控算力2.3萬P,年底可達(dá)近 2.6萬P,主要集中在商湯自營臨港機(jī)房及各地納管智算中心?,F(xiàn)在主要是圍繞國央企需求,選擇與合適的地方政府合作整體智算項(xiàng)目。

我們的算力部署,主要在經(jīng)濟(jì)相對發(fā)達(dá)、基礎(chǔ)設(shè)施完善的區(qū)域,出租率穩(wěn)定在接近滿租的狀態(tài)。

雷峰網(wǎng):那接下來發(fā)展策略是什么樣的?

孟健雄:我們在為踩下一個(gè)引爆點(diǎn)做準(zhǔn)備。目前來說,煒燁的策略已經(jīng)從硬件層向軟件和商務(wù)模式方向進(jìn)化,例如利用商湯大裝置平臺軟件的技術(shù)優(yōu)勢,實(shí)現(xiàn)訓(xùn)練by token計(jì)費(fèi)的方法,在算力銷售環(huán)節(jié)探索引入合規(guī)金融衍生品,相關(guān)嘗試正在合規(guī)推進(jìn)中。


專題介紹

2023 年來,智算產(chǎn)業(yè)迎來爆發(fā)式增長。但兩年過去,國內(nèi)智算企業(yè)的生存狀態(tài)如何?在技術(shù)突破與場景落地中做了哪些新探索、又面臨什么新挑戰(zhàn)?智算行業(yè)的未來還有什么想象空間?本專題與一眾智算領(lǐng)域的先鋒從業(yè)者對話,回顧近年智算行業(yè)在技術(shù)與商業(yè)上的拓展實(shí)踐歷程,并展望未來發(fā)展方向。即便身處行業(yè)氣候更迭之際,從業(yè)者們憑借智慧與韌性、懷揣對智算未來的堅(jiān)信,開辟多樣化發(fā)展路徑。對此專題感興趣的從業(yè)者,歡迎添加微信 Ericazhao23 共同參與討論。



雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

作者

關(guān)注算力、AI及相關(guān)IR話題等。微信:Ericazhao23。
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄