日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

亞馬遜推出第二代Arm服務(wù)器芯片Graviton2,能否快速替代x86?

本文作者: 包永剛 2019-12-07 15:50
導(dǎo)語(yǔ):雷鋒網(wǎng)按:數(shù)據(jù)正在成為越來越重要的資源,但挖掘數(shù)據(jù)的價(jià)值面臨挑戰(zhàn)。這其中,處理器的效率以及成本都非常關(guān)鍵,因此看到在大數(shù)據(jù)和AI時(shí)代,越來越多擁有大量數(shù)據(jù)或提供

雷鋒網(wǎng)按:數(shù)據(jù)正在成為越來越重要的資源,但挖掘數(shù)據(jù)的價(jià)值面臨挑戰(zhàn)。這其中,處理器的效率以及成本都非常關(guān)鍵,因此看到在大數(shù)據(jù)和AI時(shí)代,越來越多擁有大量數(shù)據(jù)或提供云服務(wù)的公司都相繼推出自研的處理器。亞馬遜就是其中的代表,他們?cè)诮盏膔e:Invent上推出了Arm架構(gòu)的服務(wù)器處理器Graviton2。這是否意味著x86架構(gòu)處理器將會(huì)被替代?

關(guān)于re:Invent的更多報(bào)道,請(qǐng)查看雷鋒網(wǎng)發(fā)自現(xiàn)場(chǎng)的《芯片問世、Outposts上市、SageMaker大更新,AWS如何成為“規(guī)則改變者”?》報(bào)道。

亞馬遜推出第二代Arm服務(wù)器芯片Graviton2,能否快速替代x86?

最終,設(shè)計(jì)良好的Arm服務(wù)器芯片在數(shù)據(jù)中心中的表現(xiàn)如何將被證明。我們不必等待任何傳統(tǒng)的和新貴服務(wù)器芯片制造商說服服務(wù)器合作伙伴來構(gòu)建和支持,軟件合作伙伴也可以加入并證明其堆棧和應(yīng)用程序可以在芯片上運(yùn)行。

亞馬遜網(wǎng)絡(luò)服務(wù)本身就是一個(gè)生態(tài)系統(tǒng),它擁有很多自己的堆棧,因此它可以像在拉斯維加斯舉辦的re:Invent上將Graviton2處理器發(fā)布后,Marvell,Ampere和其人就可以嘗試跟上。

AWS首席執(zhí)行官安迪·賈西(Andy Jassy)宣布其與安納布爾納實(shí)驗(yàn)室(Annapurna Labs)共同設(shè)計(jì)的第二代服務(wù)器級(jí)Arm處理器,這意味著其向英特爾和AMD清楚地表明了,不需要x86處理器來運(yùn)行大量工作負(fù)載。

使用x86芯片運(yùn)行工作負(fù)載要付出高昂的代價(jià),無論是租用還是購(gòu)買,這就是AWS要自己設(shè)計(jì)芯片的重要原因。顯然,這還處于早期,但是,如果有一半的大型或超大規(guī)模云服務(wù)提供商也效仿并構(gòu)建Arm Neoverse架構(gòu)的定制(或勉強(qiáng)定制)版本,并且相當(dāng)積極,那么X86服務(wù)器芯片年發(fā)貨量可能會(huì)在很短的時(shí)間內(nèi)從X86遷移到Arm(兩到三年)。

微軟毫不掩飾地表示其希望50%的服務(wù)器使用Arm處理器,最近已開始在其“ Olympus”機(jī)架式服務(wù)器內(nèi)部署Marvell的“ Vulcan” ThunderX2處理器。微軟并沒有透露其部署的規(guī)模,但是我們猜測(cè)它的數(shù)量為數(shù)萬個(gè),與其服務(wù)器機(jī)群中的數(shù)百萬臺(tái)機(jī)器無關(guān)。谷歌已經(jīng)涉足相對(duì)大型的Power處理器,并且已經(jīng)進(jìn)行了一些部署,但同樣不知道其規(guī)模。

有傳言稱谷歌是高通 “ Amberwing” Centriq 2400處理器最大的支持者,并且有傳言稱它可能會(huì)基于Arm架構(gòu)自主設(shè)計(jì)SmartNIC處理器和服務(wù)器,但是鑒于專利授權(quán)問題,Google有可能直接使用開源RISC-V指令集。

阿里巴巴在過去三年一直涉足Arm服務(wù)器,并于7月宣布了基于RISC-V的玄鐵910芯片。華為海思推出了64核鯤鵬 920,我們認(rèn)為這是Arm推出的“ Ares” Neoverse N1設(shè)計(jì)的一種變體,目標(biāo)客戶可能是中國(guó)的超大規(guī)模客戶,云服務(wù)提供商,電信公司和其他服務(wù)提供商。

實(shí)際上,我們認(rèn)為亞馬遜的Graviton2與鯤鵬920類似,它們可能從Arm Ares借用了大量設(shè)計(jì)。與所有Arm設(shè)計(jì)一樣,它們不包括內(nèi)存控制器或PCI-Express控制器,必須從第三方獲得許可。

去年的這個(gè)時(shí)候,AWS推出了第一代Graviton Arm服務(wù)器芯片,具有16個(gè)運(yùn)行在2.3 GHz的vCPU,采用臺(tái)積電的16納米工藝。AWS從未確認(rèn)Graviton處理器是否具有16個(gè)不帶SMT的內(nèi)核或8個(gè)帶雙向SMT的內(nèi)核,但我們認(rèn)為它不具有SMT,而僅僅是一個(gè)的“ Cosmos”內(nèi)核,是經(jīng)過調(diào)整的Cortex-A72或Cortex-A75內(nèi)核。

AWS的EC2計(jì)算設(shè)備上的A1可支持多達(dá)32 GB的主內(nèi)存,并通過其服務(wù)器適配器提供高達(dá)10 Gb /秒的網(wǎng)絡(luò)帶寬,以及高達(dá)3.5 Gb /秒的彈性塊存儲(chǔ)(EBS)帶寬。我們認(rèn)為該芯片只有一個(gè)帶有兩個(gè)通道的內(nèi)存控制器,類似于針對(duì)超大規(guī)模處理器的Intel XeonD。這并不是一個(gè)令人印象深刻的Arm服務(wù)器芯片,更像是一個(gè)強(qiáng)大的智能網(wǎng)卡芯片。

“在AWS的歷史上,一個(gè)重大的轉(zhuǎn)折點(diǎn)是我們收購(gòu)了Annapurna Labs,這是由一群以色列非常有才華和專業(yè)的芯片設(shè)計(jì)和制造人才組成的團(tuán)隊(duì),我們決定設(shè)計(jì)和制造芯片更強(qiáng)性能的芯片。” Jassy在re:Invent的開幕主題演講中解釋道。

“盡管包括我們?cè)趦?nèi)的許多公司已經(jīng)使用x86處理器很長(zhǎng)時(shí)間了,英特爾是非常緊密的合作伙伴,并且我們也越來越多地開始使用AMD,如果我們想提高性價(jià)比,就意味著我們必須做一些創(chuàng)新。我們與安納布爾納峰團(tuán)隊(duì)合作,我們認(rèn)為它們可以在性能和真正重要的方面提供有意義的差異,我們認(rèn)為人們確實(shí)在廣泛地做到這一點(diǎn)。他們開始使用的第一個(gè)芯片是基于Arm的芯片,我們稱為Graviton芯片,該芯片是我們?nèi)ツ暝贏1實(shí)例中發(fā)布的,這是云中第一個(gè)基于Arm的實(shí)例,這些實(shí)例旨在用于擴(kuò)展工作流,因此是容器化的微服務(wù)和Web層應(yīng)用程序之類的東西?!?/p>

A1實(shí)例有成千上萬的客戶,但是正如我們過去和現(xiàn)在所指出的那樣,就吞吐量而言,它并不是一個(gè)出色的服務(wù)器芯片,至少與同類產(chǎn)品相比沒有。AWS知道這一點(diǎn),其他人也知道。這是一種嘗試。

“當(dāng)我們啟動(dòng)A1實(shí)例時(shí),我們想知道三個(gè)問題,” Jassy繼續(xù)說道。“首先是:有人會(huì)使用它們嗎?第二個(gè)問題是:合作伙伴生態(tài)系統(tǒng)是否會(huì)加強(qiáng)支持人們使用基于Arm的應(yīng)用所需的工具鏈?第三個(gè)是:我們能否在Graviton芯片的第一個(gè)版本上進(jìn)行足夠的創(chuàng)新,以使您可以使用基于Arm的芯片來處理更廣泛的工作負(fù)載?在前兩個(gè)問題上,我們感到非常驚喜??梢栽诨脽羝峡吹竭@一點(diǎn),徽標(biāo)的數(shù)量,客戶的負(fù)載以我們未曾想到的方式使用A1實(shí)例,并且合作伙伴生態(tài)系統(tǒng)確實(shí)以非常重要的方式加強(qiáng)并支持了我們的基本實(shí)例?!?/p>

”第三個(gè)問題,我們是否真的可以在該芯片上進(jìn)行足夠的創(chuàng)新,我們不太確定,這是我們幾年前開始在第二版Graviton原因的一部分,即使我們正在構(gòu)建第一個(gè)版本,我們不知道是否能夠做到這一點(diǎn),這可能需要一些時(shí)間。”

亞馬遜推出第二代Arm服務(wù)器芯片Graviton2,能否快速替代x86?

據(jù)我們所知,Graviton2更像是一個(gè)吞吐量引擎,并且看起來也可以在核心級(jí)別與現(xiàn)代x86芯片保持一致,而單線程性能是衡量標(biāo)準(zhǔn)。

擁有超過300億個(gè)晶體管和多達(dá)64個(gè)vCPU的Graviton2芯片,同樣,我們認(rèn)為這些是真正的內(nèi)核,而不是線程數(shù)量的一半。我們知道Graviton2是7納米Neoverse N1的變體,這意味著它是Arm為幫助客戶加快速度而開發(fā)的“ Ares”芯片的衍生產(chǎn)品。根據(jù)Arm的說法,Ares Neoverse N1的最高速度為3.5 GHz,內(nèi)核沒有內(nèi)置多線程同步功能,介于2.6 GHz和3.1 GHz之間。

Ares內(nèi)核具有64 KB的L1指令高速緩存和64 KB的數(shù)據(jù)高速緩存,并且跨內(nèi)核的指令高速緩存在芯片上是一致的。Ares設(shè)計(jì)為每個(gè)核心提供512 KB或1 MB的專用L2高速緩存,并且核心復(fù)合體具有特殊的高帶寬,低延遲通道,稱為Direct Connect,將內(nèi)核連接到網(wǎng)狀互連,該互連將片上系統(tǒng)的所有元素連接在一起。按照Arm結(jié)合Ares的方式,它可以在單個(gè)芯片或整個(gè)小芯片中擴(kuò)展最多128個(gè)內(nèi)核。64核變體具有八個(gè)內(nèi)存控制器和八個(gè)I / O控制器,以及32個(gè)核心對(duì)及其共享的L2緩存。

我們認(rèn)為Graviton2看起來很像64核Ares參考設(shè)計(jì),在其中添加了一些功能。其中一項(xiàng)功能是內(nèi)存加密,通過啟動(dòng)時(shí)在服務(wù)器上生成的256位密鑰完成,并且永遠(yuǎn)不會(huì)離開服務(wù)器。(尚不清楚使用哪種加密技術(shù),可能是AES-256。)

亞馬遜表示,Graviton2芯片的性能是首款Graviton芯片的7倍,浮點(diǎn)性能是2倍。第一統(tǒng)計(jì)數(shù)據(jù)在芯片級(jí)別有意義,而第二統(tǒng)計(jì)數(shù)據(jù)必須在核心級(jí)別,否則毫無意義。(AWS含糊不清。)從16核升級(jí)到64核可為提供4倍的整數(shù)性能,而從2.3 GHz升級(jí)到3.2 GHz則可提供39%的性能提升,而一直上升到3.5 GHz則可提供另外的50%的性能。最重要的是,整體收益是原來的6倍。

剩下的就是緩存體系結(jié)構(gòu),每時(shí)鐘指令(IPC)和整個(gè)層次結(jié)構(gòu)的內(nèi)存帶寬方面的改進(jìn)。將浮點(diǎn)向量的寬度加倍很容易且足夠正常。AWS表示,Graviton2芯片的單核高速緩存是其兩倍大,并具有額外的存儲(chǔ)通道(根據(jù)定義,它幾乎必須如此),并且這些功能一起使Graviton2的存儲(chǔ)速度比初代Graviton快5倍。坦率地說,令人感到驚訝的是它的速度并沒有超過10倍,特別是如果Graviton2具有8個(gè)以3.2 GHz運(yùn)行的DDR4內(nèi)存通道時(shí)。

有趣的是,AWS將當(dāng)前M5已經(jīng)運(yùn)行的vCPU與即將推出的基于Graviton2芯片的M6g運(yùn)行的vCPU進(jìn)行了比較。AWS并未具體說明在哪種實(shí)例配置上使用了哪種測(cè)試,因此以下數(shù)據(jù)可能是蘋果、蘋果醬和保齡球的混合體。M5實(shí)例基于Intel的24核“ Skylake” Xeon SP-8175 Platinum(主頻為2.5 GHz);該芯片是為AWS定制的,與庫(kù)存的Xeon SP-8176 Platinum部件相比,內(nèi)核少了四個(gè),時(shí)鐘速度(400 MHz)略高。

以下是在每個(gè)vCPU的基礎(chǔ)上,Graviton2 M6g與各種工作負(fù)載相對(duì)于Skylake Xeon SP實(shí)例的堆疊方式:

  • SPECjvm 2008:+ 43%(估計(jì))

  • SPEC CPU 2017整數(shù):+ 44%(估計(jì))

  • SPEC CPU 2017浮點(diǎn)數(shù):+ 24%(估計(jì))

  • Nginx的HTTPS負(fù)載平衡:+ 24%

  • 內(nèi)存緩存:性能提高了43%,延遲更短

  • X.264視頻編碼:+ 26%

  • 使用Cadence Xcellium進(jìn)行的EDA模擬:+ 54%

需要指出,這些比較使Arm芯片上的內(nèi)核與超線程相對(duì)應(yīng)(因此,單線程性能下降,從而提高了芯片吞吐量)。這些都是顯著的性能提升,但是在比較中,AWS不一定會(huì)把其最好的Xeon SP放在首位。EC2 C5實(shí)例基于“ Cascade Lake” Xeon SP處理器,所有核心睿頻頻率為3.6 GHz,看起來它們有激活了超線程功能的一對(duì)24核芯片,可以在單個(gè)映像中提供96個(gè)vCPU。

R5實(shí)例基于Skylake Xeon SP-8000系列芯片(精確到未知),內(nèi)核運(yùn)行于3.1 GHz??雌饋磉@些實(shí)例還具有一對(duì)啟用了HyperThreading的24核芯片。在每個(gè)vCPU的基礎(chǔ)上,它們都比M5實(shí)例快得多,并且在整個(gè)vCPU的吞吐量方面也更具可擴(kuò)展性。這些C5和R5上的額外時(shí)鐘速度很可能會(huì)彌補(bǔ)每個(gè)vCPU的性能差距。(但也很難確定。)

這里的主要觀點(diǎn)是,我們懷疑這樣是否可以使AWS相比從Intel購(gòu)買處理器更便宜,如果成本減少20%就足以做到這一點(diǎn),但是Jassy說,價(jià)格/性能優(yōu)勢(shì)約為40%。(大概是在將設(shè)計(jì)和生產(chǎn)Graviton2的實(shí)際成本與我們認(rèn)為是M5實(shí)例中定制Skylake Xeon SP進(jìn)行比較)。因此,AWS推出了Graviton2處理器以支持Elastic MapReduce( Hadoop),彈性負(fù)載平衡,ElastiCache以及其云上的其他平臺(tái)級(jí)服務(wù)。

對(duì)于其他人,Graviton2芯片將提供三種不同的配置作為EC2計(jì)算基礎(chǔ)架構(gòu)服務(wù)上的實(shí)例:

  • 通用(M6g和M6gd):1至64個(gè)vCPU和最多256 GB的內(nèi)存

  • 優(yōu)化計(jì)算(C6g和C6gd):1至64個(gè)vCPU和最多128 GB的內(nèi)存

  • 內(nèi)存優(yōu)化(R6g和R6gd):1至64個(gè)vCPU和最大512 GB內(nèi)存

“ g”表示Graviton2芯片,“ d”表示其具有用于實(shí)例上本地存儲(chǔ)的NVM-Express閃存。所有實(shí)例將具有25 Gb /秒的網(wǎng)絡(luò)帶寬和18 Gb /秒的彈性塊存儲(chǔ)服務(wù)帶寬。也將有裸機(jī)版本,看看AWS是否實(shí)施CCIX互連以創(chuàng)建兩路甚至四路NUMA服務(wù)器還是堅(jiān)持單路設(shè)計(jì),這將非常有趣。

M6g和M6gd實(shí)例現(xiàn)在可用,計(jì)算和內(nèi)存優(yōu)化版本將在2020年可用。芯片,平臺(tái)和軟件堆棧現(xiàn)在都可以從同一家供應(yīng)商處獲得。關(guān)于服務(wù)器平臺(tái),我們什么時(shí)候可以這么說?

雷鋒網(wǎng)編譯,via The Next Platform


相關(guān)文章:

芯片問世、Outposts上市、SageMaker大更新,AWS如何成為“規(guī)則改變者”?

傳亞馬遜已研發(fā)出第二代 AI 芯片,比第一代至少快 20%

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說