0
| 本文作者: 張路 | 2019-12-12 18:31 |
雷鋒網(wǎng)AI開發(fā)者按,1999年,NVIDIA 公司發(fā)明了GPU(Graphics Processing Unit,圖形處理器),優(yōu)異的圖形處理表現(xiàn)讓它艷驚四座。
近年來,GPU在大規(guī)模并行運(yùn)算上的巨大優(yōu)勢,讓其成為大數(shù)據(jù)、AI以及圖形圖像處理等場景下不可或缺的計算引擎。
然而,一直以來,囿于GPU切分難度較高,用戶不論是購買GPU硬件,還是購買GPU云服務(wù),都只能整塊購買。這樣有兩個結(jié)果:
1. 使用門檻較高。GPU相對CPU價格較貴,一塊超級計算類GPU價格更是高達(dá)好幾萬,個人開發(fā)者使用門檻較高。
2. 資源浪費(fèi)。在算力需求較小的時候,一整塊GPU卡無法滿負(fù)荷運(yùn)行,造成算力浪費(fèi)。
今天,這種局面看起來被打破了,騰訊云正式對外發(fā)布基于 NVIDIA T4 的虛擬GPU(vGPU)計算產(chǎn)品GN7實(shí)例,可以為任意AI工作負(fù)載提供支持。
因此,用戶可以在云上買到規(guī)格更小的GPU計算產(chǎn)品,可以降低用戶使用GPU的成本并增加靈活度,對一些小規(guī)模算力場景的人工智能研發(fā)有非常大的幫助。
廣泛適用不同AI場景
憑借強(qiáng)大的計算能力和彈性能力,GN7實(shí)例在海量數(shù)據(jù)處理和人工智能領(lǐng)域都具有廣闊的應(yīng)用價值。它既可以滿足諸如搜索、大數(shù)據(jù)分析等需要對海量數(shù)據(jù)進(jìn)行處理的業(yè)務(wù)場景,也可以作為深度學(xué)習(xí)訓(xùn)練和推理的系統(tǒng)平臺。
GN7實(shí)例的虛擬化特性,也十分適合互聯(lián)網(wǎng)業(yè)務(wù)中人工智能業(yè)務(wù)的批量部署以及云游戲,AR/VR在云端的應(yīng)用。
目前,GN7實(shí)例已經(jīng)在騰訊云自有的智能鈦彈性模型服務(wù)(TI-EMS)上實(shí)現(xiàn)了應(yīng)用。該平臺通過使用vGPU做小模型推理,幫助用戶解決復(fù)雜模型部署和GPU利用成本效益等問題。
基于多精度支持,NVIDIA T4擁有可加速深度學(xué)習(xí)訓(xùn)練和推理、機(jī)器學(xué)習(xí)以及數(shù)據(jù)科學(xué)工作負(fù)載的 Tensor Core,以及豐富的平臺堆棧,包括用于深度學(xué)習(xí)的cuDNN、用于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的NVIDIA RAPIDS、用于云工作站圖形的NVIDIA Quadro虛擬工作站和用于云游戲的NVIDIA游戲軟件。結(jié)合用于GPU虛擬化的 vComputeServer軟件,騰訊云客戶可以靈活選擇在虛擬環(huán)境中運(yùn)行GPU加速的工作負(fù)載,從而在提高安全性和利用率的同時降低成本。
進(jìn)一步降低成本
GN7實(shí)例降低了GPU加速的初始投資成本,NVIDIA vComputeServer軟件通過對NVIDIA T4進(jìn)行虛擬化,使多臺虛擬機(jī)(VM)可以同時訪問GPU或者使一臺虛擬機(jī)可以訪問多顆 GPU,從而實(shí)現(xiàn)性能的最大化。因此,騰訊云用戶可以根據(jù)工作負(fù)載的需求靈活選擇對應(yīng)的GPU加速量。
比如在進(jìn)行簡單模型推理這一類低算力需求的應(yīng)用時,用戶無須再像以往必須使用單顆物理GPU,而是可以根據(jù)自身業(yè)務(wù)具體類型對GPU算力的需求,靈活選擇匹配的vGPU資源,提升了計算資源的利用率,從而有效降低用戶的使用成本,避免因配置不足或配置過度而產(chǎn)生成本。比如,通過使用1/2 vGPU實(shí)例規(guī)格,成本相對單卡實(shí)例降低了50%。
相比過往進(jìn)程級別的虛擬化GPU,GN7的升級點(diǎn)在于其提供的設(shè)備級虛擬化vGPU是完全模擬出來一個GPU設(shè)備,在支持GPU硬件的絕大多數(shù)特性的同時,還能夠做到操作系統(tǒng)級別的隔離,而且不同的用戶使用也不用擔(dān)心資源爭搶的問題。
不過,關(guān)于虛擬化GPU的技術(shù),AI開發(fā)者也采訪了一位業(yè)內(nèi)資深技術(shù)人士,該人士表示,這個vGPU技術(shù)其實(shí)并不難,華為、阿里也都有類似的。當(dāng)然,騰訊云和NVIDIA的深度合作還是有一定賣點(diǎn)。
AI開發(fā)者獲悉,下周在蘇州舉辦的GTC大會上,騰訊云將會演示NVIDIA GPU加速的云服務(wù),并介紹如何從云端部署AI工作負(fù)載。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。