0
| 本文作者: 王德清 | 2020-11-06 21:12 |
作者:王德清
出品:雷鋒網(wǎng)產(chǎn)業(yè)組
前言:數(shù)據(jù)“橫行”的今天,用來(lái)存儲(chǔ)數(shù)據(jù)的系統(tǒng)至關(guān)重要。而一個(gè)大型存儲(chǔ)系統(tǒng),從醞釀到誕生再到成熟,并不是一件簡(jiǎn)單的事情。
騰訊作為國(guó)內(nèi)領(lǐng)先的社交巨頭公司,不僅在2006年自研了TFS等存儲(chǔ)系統(tǒng)支撐了其內(nèi)部90%+的數(shù)據(jù)存儲(chǔ)業(yè)務(wù),在面向To B業(yè)務(wù),騰訊在2018年又自主研發(fā)了面向云場(chǎng)景的「YottaStore」存儲(chǔ)系統(tǒng),存儲(chǔ)系統(tǒng)要換代,數(shù)據(jù)遷移是不可避免的,對(duì)騰訊這般體量的公司來(lái)說,需要莫大的勇氣。
契機(jī)之下,雷鋒網(wǎng)與騰訊存儲(chǔ)團(tuán)隊(duì)6位老兵展開了一次深度對(duì)話,還原騰訊存儲(chǔ)系統(tǒng)變革背后的那些故事。
這一切要從2006年開始說起。
彼時(shí),互聯(lián)網(wǎng)行業(yè)正處在社交化浪潮中,騰訊還并非是現(xiàn)如今這般規(guī)模的社交巨頭,雖然手握QQ這樣的爆款產(chǎn)品,但在SNS剛剛興起的時(shí)代,誰(shuí)都無(wú)法保證可以笑到最后。
也就是這一年,QQ空間作為一款定位于“展示自我和與他人互動(dòng)的平臺(tái)”,被騰訊推了出來(lái),一開始數(shù)據(jù)表現(xiàn)出乎意料的好,用戶快速增長(zhǎng),活躍度很高,甚至收入也超出預(yù)期,但競(jìng)爭(zhēng)也隨之開始了。
就在QQ空間發(fā)布沒過多久,靠炒房賺得第一桶金的龐東升決定回到互聯(lián)網(wǎng)繼續(xù)冒險(xiǎn),他以100萬(wàn)元人民幣收購(gòu)了張劍福創(chuàng)辦的個(gè)人數(shù)據(jù)庫(kù)公司10770。在稍稍弄明白SNS是怎么一回事后,龐升東決定將10770改造成互動(dòng)社交型的51.com。
在龐升東的心中,51的假想敵只有一個(gè),就是騰訊的QQ空間。
只要騰訊出什么新花樣,51在一個(gè)月內(nèi)一定跟上。更可怕的是,在2006年的大多數(shù)月份,51的用戶增長(zhǎng)數(shù)一直在QQ空間之上,這讓騰訊非常緊張。
“QQ空間”保衛(wèi)戰(zhàn)勢(shì)不容緩,而這場(chǎng)保衛(wèi)戰(zhàn)第一戰(zhàn),拼的是“技術(shù)”。
2006年,剛接手QQ空間的負(fù)責(zé)人聽到的都是投訴的聲音:「QQ空間無(wú)法打開」;「照片下載速度很慢」……而經(jīng)過測(cè)試,打開一個(gè)空間,需要5秒鐘。
而要解決這些問題,首先要解決的就是存儲(chǔ)這個(gè)底層技術(shù)。
“2006年,我博士畢業(yè)來(lái)到騰訊的時(shí)候,騰訊還沒有統(tǒng)一的存儲(chǔ)產(chǎn)品或者技術(shù)平臺(tái),基本上都是各個(gè)業(yè)務(wù)自己去做一個(gè)存儲(chǔ)的系統(tǒng)。”騰訊云副總裁、云架構(gòu)平臺(tái)部總經(jīng)理謝明對(duì)雷鋒網(wǎng)說到。

QQ空間登錄頁(yè)
據(jù)騰訊2006年披露的數(shù)據(jù)顯示,QQ空間上線3個(gè)季度,注冊(cè)用戶數(shù)就突破了5000萬(wàn),月活躍用戶數(shù)約2300萬(wàn),日訪問人數(shù)也已經(jīng)超過1300萬(wàn)。
那時(shí)候,QQ空間的存儲(chǔ)系統(tǒng)僅能支撐所有用戶每天共上傳1000萬(wàn)張圖片,顯然,面對(duì)用戶持續(xù)不斷的增長(zhǎng),依靠此前不斷購(gòu)買存儲(chǔ)服務(wù)器的方式來(lái)進(jìn)行擴(kuò)容,其速度是無(wú)法跟上用戶內(nèi)容的增長(zhǎng)速度。
這些持續(xù)增長(zhǎng)的UGC數(shù)據(jù)無(wú)疑將會(huì)給騰訊存儲(chǔ)帶來(lái)巨大挑戰(zhàn),而如果無(wú)法突破這個(gè)挑戰(zhàn),QQ空間第一戰(zhàn)的結(jié)果也就難說了。
而這個(gè)挑戰(zhàn)被一支剛剛成立的團(tuán)隊(duì)接下了。
一支被騰訊主要?jiǎng)?chuàng)辦人之一、前CTO張志東稱之為“黃埔軍?!钡膱F(tuán)隊(duì)。這支團(tuán)隊(duì)成立的第一個(gè)任務(wù)就是解決QQ空間發(fā)展所帶來(lái)的存儲(chǔ)問題,其第一任主帥就是現(xiàn)任騰訊公司高級(jí)執(zhí)行副總裁盧山。
而擺在這個(gè)剛剛成立團(tuán)隊(duì)面前的難題,并不亞于愚公家門前王屋、太行兩座大山。
技術(shù)人員都是有夢(mèng)想的,他們希望用技術(shù)來(lái)解決一切,亦或是他們可以參考的只有2003-2004年Google發(fā)布的關(guān)于三大件(BigTable、GFS、MapReduce)幾篇比較知名的論文。
“GFS算是最早期的企業(yè)級(jí)存儲(chǔ)轉(zhuǎn)向互聯(lián)網(wǎng)大規(guī)模廉價(jià)分布式存儲(chǔ)比較早期實(shí)踐。那時(shí)候我們決定去做一個(gè)存儲(chǔ)系統(tǒng),我們當(dāng)時(shí)取名叫TFS?!敝x明回憶道。
借鑒Google的幾篇論文,在團(tuán)隊(duì)成立的第二年,TFS存儲(chǔ)系統(tǒng)就上線應(yīng)用,并全面接管QQ空間的相冊(cè)業(yè)務(wù)。
再回到產(chǎn)品冊(cè)遇到用戶投訴,空間團(tuán)隊(duì)要求技術(shù)人員制作一張全國(guó)地圖,凡是打開速度高于5秒的被繪成紅色,3秒到5秒之間為黃色,低于3秒的被繪成綠色,地圖制作出來(lái)后,掛在墻上,大家看到的是“祖國(guó)江山一片紅”,其中,尤以西北、西南和東北地區(qū)的顏色最深。
只有一個(gè)基礎(chǔ)的TFS存儲(chǔ)系統(tǒng)顯然是不夠的。
“從技術(shù)角度來(lái)說,圖片都是百K左右的小數(shù)據(jù),相比大尺寸的數(shù)據(jù)來(lái)說,這種存儲(chǔ)因?yàn)樗饕芗雀撸瑤?lái)的技術(shù)挑戰(zhàn)要大很多,一是要解決索引和數(shù)據(jù)尺寸協(xié)調(diào)的空間問題,二是要解決大規(guī)模下的成本問題。”
于是存儲(chǔ)部門根據(jù)業(yè)務(wù)場(chǎng)景的演變,先后推出了適合各種不同圖片存儲(chǔ)場(chǎng)景的存儲(chǔ)系統(tǒng),如支持實(shí)時(shí)回收的CTFS系統(tǒng)、支持高頻快速訪問的HTFS系統(tǒng)、支持EC編碼的BTFS系統(tǒng)、基于HDD的鍵值對(duì)TDB存儲(chǔ)平臺(tái)等。
就這樣,技術(shù)團(tuán)隊(duì)一塊一塊地啃,在地圖上,綠色和黃色一點(diǎn)一點(diǎn)地增加。花了差不多一年的時(shí)間,到2007年年底,一張綠色的中國(guó)地圖終于出現(xiàn)在大家的面前。此次速度優(yōu)化上的闖關(guān),為QQ空間日后流量的倍級(jí)增長(zhǎng)提供了至關(guān)重要的保證。
但在2009年,另一座大山擋住了“去路”,帶寬不夠了。
“那時(shí)所有的數(shù)據(jù)中心都是在深圳。當(dāng)時(shí)的骨干網(wǎng)帶寬跟現(xiàn)在實(shí)際上不能同日而語(yǔ),是很小的,QQ相冊(cè)高峰時(shí)占用40-50G,而1G的流量對(duì)公司的網(wǎng)絡(luò)就已經(jīng)是很大的負(fù)擔(dān)了。QQ空間用戶增長(zhǎng)帶來(lái)大量的數(shù)據(jù)讓我們基本上把整個(gè)華南地區(qū)的骨干網(wǎng)消化完了?!?/p>
擺在謝明他們面前的也就只有一條路了:?jiǎn)?dòng)相冊(cè)一通點(diǎn)等項(xiàng)目,將海量業(yè)務(wù)數(shù)據(jù)從深圳向西安、杭州、廣州、上海等地分布,訪問帶寬同時(shí)調(diào)度到天津、南京、東莞等成本更低的一通機(jī)房。
“我記得搬第一個(gè)設(shè)備是100T,現(xiàn)在看來(lái)100T不大,但那是騰訊歷史上最大的一次數(shù)據(jù)搬遷了?!?/p>
那時(shí),沒有數(shù)據(jù)中心專線網(wǎng)絡(luò)可供騰訊使用,因此,謝明與團(tuán)隊(duì)其他成員在半夜通過用公網(wǎng)出口把數(shù)據(jù)一點(diǎn)一點(diǎn)地“搬到”了西安等地。
而在做數(shù)據(jù)分布搬遷的過程中,自身也在同步迭代演進(jìn)。TFS從3份存儲(chǔ)演進(jìn)為同時(shí)支持1/2/3份數(shù)據(jù)的多副本存儲(chǔ);CTFS從2份存儲(chǔ)演進(jìn)為同時(shí)支持2/3份數(shù)據(jù)存儲(chǔ)。TSSD平臺(tái)也從僅支持單機(jī)獨(dú)享的Uin-Value定制存儲(chǔ)演進(jìn)為支持多租戶的通用Key-Value存儲(chǔ)。
就這樣QQ空間在TFS存儲(chǔ)系統(tǒng)的支撐下,笑到了最后。(51.com被QQ空間擊敗,轉(zhuǎn)型做了游戲代理,之后逐漸沒落。)

2009年騰訊存儲(chǔ)團(tuán)隊(duì)合影照片
也就從2009年之后,QQ空間的收入大幅增加,成為排在網(wǎng)絡(luò)游戲之后的第二大收入貢獻(xiàn)部門,黃鉆收入在2010年達(dá)到峰值,也因此QQ空間獲得2009年度的騰訊合作文化獎(jiǎng)。
此后QQ空間的相冊(cè)日上傳照片數(shù)不再受限(用戶體驗(yàn)到的受限是騰訊產(chǎn)品部門策略),其照片累計(jì)存儲(chǔ)量也多達(dá)數(shù)萬(wàn)億張。
TFS存儲(chǔ)系統(tǒng)也逐漸開始為QQ、微信、郵箱、微云、流媒體加速等提供存儲(chǔ)服務(wù),目前已經(jīng)支撐起騰訊90%+的數(shù)據(jù)存儲(chǔ)業(yè)務(wù)。
如果現(xiàn)在回憶2014、2015年的互聯(lián)網(wǎng)公司的競(jìng)爭(zhēng),可能很多人都會(huì)想到那時(shí)春晚的紅包大戰(zhàn)。
可讓謝明他們?nèi)f萬(wàn)沒想到的是,給TFS存儲(chǔ)系統(tǒng)帶來(lái)下一個(gè)壓力的節(jié)點(diǎn)竟然會(huì)是移動(dòng)互聯(lián)網(wǎng)時(shí)代的微信朋友圈。
“PC互聯(lián)網(wǎng)時(shí)代的競(jìng)爭(zhēng)其實(shí)沒有那么激烈,還在吃人口紅利,創(chuàng)業(yè)公司也并沒有那么多,大家覺得日子都還是很好過的。”
從騰訊發(fā)布的財(cái)報(bào)顯示,截止2014年底,微信月活躍用戶達(dá)到5億,就是這些快速增長(zhǎng)的用戶讓存儲(chǔ)團(tuán)隊(duì)感受到了前所未有的沖擊。
這里要說一下存儲(chǔ)系統(tǒng)在微信中的主要作用,微信用戶在給朋友發(fā)送圖片、視頻等文件,甚至發(fā)紅包的時(shí)候,首先這些文件要存儲(chǔ)在騰訊公司的存儲(chǔ)服務(wù)器中,而朋友在看這些圖片和視頻文件的時(shí)候,實(shí)際上他們是讀取了我們存儲(chǔ)在騰訊服務(wù)器的上的內(nèi)容。發(fā)朋友圈亦是如此。
2014年,隨著4G網(wǎng)絡(luò)的普及,微信得以推廣,QQ也可以用手機(jī)登錄,因此,在春節(jié),微信和手機(jī)QQ成為了人們送祝福的主要平臺(tái)。
“比如在除夕,大家都會(huì)到朋友圈去送祝福、發(fā)照片、曬年夜飯等……在2014年的除夕,讓我們感受到了壓力?!彬v訊云架構(gòu)平臺(tái)部技術(shù)運(yùn)營(yíng)與質(zhì)量中心總監(jiān)高向冉如是說。
用戶在除夕的0:00-0:30分之間都在用微信去給親友發(fā)送春節(jié)祝福,這對(duì)騰訊的存儲(chǔ)服務(wù)器的讀寫能力帶來(lái)了很大的挑戰(zhàn)。

微信打開頁(yè)面
需要科普的是,為了控制存儲(chǔ)的成本,存儲(chǔ)服務(wù)的磁盤容量其實(shí)是不斷變大的,但讀寫能力并沒有隨著磁盤容量的變大而提升,實(shí)際上單GB的讀寫能力是成倍下降的。
這背后其實(shí),就是在遇到高并發(fā)(用戶在同一時(shí)間點(diǎn)發(fā)消息/朋友圈)情況下,那時(shí)的騰訊存儲(chǔ)服務(wù)器的讀寫能力是無(wú)法滿足幾億用戶高并發(fā)動(dòng)作的,用戶的直觀感受就是你的消息對(duì)方無(wú)法及時(shí)看到,你也可能無(wú)法及時(shí)收到朋友發(fā)給你的微信/朋友圈。
因此,存儲(chǔ)團(tuán)隊(duì)聯(lián)合微信產(chǎn)品團(tuán)隊(duì)首先在各個(gè)層面制定了相關(guān)的柔性策略,保證用戶可以及時(shí)的將信息發(fā)出去并能被看到,而信息的存儲(chǔ)落盤在30分鐘內(nèi)完成。
而在落盤的過程中,需要存儲(chǔ)團(tuán)隊(duì)通過技術(shù)將磁盤的讀寫能力開放到極致。
“壓力其實(shí)是挺大的,因?yàn)槟阒虚g一旦有什么問題,風(fēng)險(xiǎn)還是很高的?!?/p>
而在之后,這樣情況也并不只是在春節(jié)的時(shí)候發(fā)生,無(wú)論是哪家公司籌謀的活動(dòng),大家都會(huì)來(lái)微信朋友圈來(lái)“曬”。
“很多時(shí)候,友商活動(dòng)策劃做的是否完美,我們可以‘檢驗(yàn)’的,而檢驗(yàn)的依據(jù)就是某一時(shí)間段節(jié)點(diǎn)給騰訊存儲(chǔ)帶來(lái)的壓力。因?yàn)槲⑿诺臉I(yè)務(wù)太大了,一個(gè)活動(dòng)產(chǎn)生了爆點(diǎn),就會(huì)額外給我們存儲(chǔ)帶來(lái)很大的壓力,因?yàn)橛脩羲蟹窒碓谂笥讶Φ膱D片和內(nèi)容最終是要存儲(chǔ)在我們數(shù)據(jù)中心的?!?/p>
得益于2014年春節(jié)期間的經(jīng)歷,騰訊存儲(chǔ)團(tuán)隊(duì)在春節(jié)過后就開始針對(duì)這些“爆點(diǎn)”制定了柔性策略。
2015年春節(jié),微信與央視合作,為觀看春晚的微信用戶發(fā)紅包,也讓微信的用戶量快速增長(zhǎng),除夕凌晨零點(diǎn)的朋友圈等存儲(chǔ)場(chǎng)景也達(dá)到了數(shù)十倍的增長(zhǎng)。

2016年騰訊存儲(chǔ)團(tuán)隊(duì)春節(jié)值班零點(diǎn)后留影
“微信是一個(gè)要出海的業(yè)務(wù),出海其實(shí)給我們帶來(lái)了很多挑戰(zhàn)?!?/p>
說這句話的是現(xiàn)任騰訊云架構(gòu)平臺(tái)部系統(tǒng)研發(fā)中心總監(jiān)郭振宇:“微信出海是有一些競(jìng)爭(zhēng)對(duì)手,特別是在東南亞有LINE,還有WhatApp,東南亞的人和自己國(guó)內(nèi)人進(jìn)行數(shù)據(jù)溝通的鏈路很長(zhǎng)?!?/p>
顯然,這是不利于微信搶占海外市場(chǎng)的。
作為公司業(yè)務(wù)的支持方,我們?cè)诖鎯?chǔ)上面要配合微信團(tuán)隊(duì)做更定制化的服務(wù),因?yàn)槲⑿乓彩球v訊重要戰(zhàn)略業(yè)務(wù),所以當(dāng)時(shí)我們團(tuán)隊(duì)為微信做了很多存儲(chǔ)相關(guān)的業(yè)務(wù)系統(tǒng)。
郭振宇接著說:“比如怎么樣讓圖片傳輸更快,我們?cè)谌珖?guó)建立了很多接入點(diǎn),用戶數(shù)據(jù)只需要傳到最近的地方,國(guó)外只傳到國(guó)外數(shù)據(jù)中心,內(nèi)地也只需傳到內(nèi)地?cái)?shù)據(jù)中心?!?/p>
而這一切,其實(shí)對(duì)于存儲(chǔ)團(tuán)隊(duì)來(lái)說,都不再是什么難題。
云計(jì)算的發(fā)展,讓很多廠商都瞄向了To B的生意,騰訊云亦是如此,但這又何其容易?
集團(tuán)層要制定大的戰(zhàn)略,事業(yè)部要具有To B的思維,技術(shù)上也需要具有To B 的意識(shí)。
但騰訊的存儲(chǔ)部門卻在此走了一次“彎路”。

騰訊云副總裁、云架構(gòu)平臺(tái)部總經(jīng)理謝明
“說到騰訊云,其實(shí)在2012年騰訊開放平臺(tái)就已經(jīng)開始做云了,但是開放平臺(tái)跟現(xiàn)在的騰訊云并不一樣,開放平臺(tái)時(shí)候,我們和合作伙伴對(duì)接時(shí)我們是資源方,因?yàn)槟阋肣Q、QQ空間的資源。但是到后來(lái)騰訊云做To B服務(wù)的時(shí)候,這時(shí)候要靠自己的實(shí)力去證明我們是專業(yè)的?!敝x明如是說。
此時(shí),支持騰訊自己業(yè)務(wù)的TFS存儲(chǔ)系統(tǒng)等,已經(jīng)成熟且穩(wěn)定。在騰訊看來(lái),將TFS存儲(chǔ)系統(tǒng)進(jìn)行一次產(chǎn)品包裝后也能服務(wù)好外部第三方業(yè)務(wù)。
谷歌其實(shí)就是這么做的,目前,Google的云存儲(chǔ)產(chǎn)品GCS建立在ColossusV2的根基上。ColossusV2是典型的元數(shù)據(jù)Federation架構(gòu)的分布式文件存儲(chǔ)系統(tǒng),說白了ColossusV2就是Google由GFS存儲(chǔ)系統(tǒng)改進(jìn)優(yōu)化而來(lái)的。
“但Google的GFS存儲(chǔ)系統(tǒng)是誕生于云計(jì)算興起之前?!爆F(xiàn)任云架構(gòu)平臺(tái)部存儲(chǔ)研發(fā)中心總監(jiān)楊?yuàn)^強(qiáng)接著說:
那時(shí)候扁平式的對(duì)象存儲(chǔ)場(chǎng)景不像今天這樣豐富清晰,所以分布式文件系統(tǒng)管理的單位是文件,過多過小的文件會(huì)導(dǎo)致元數(shù)據(jù)管理爆炸,所以主要面向幾十M的大文件,這樣一個(gè)百字節(jié)的元數(shù)據(jù)可以管理幾十M的大文件,元數(shù)據(jù)單字節(jié)管理效率大概百K級(jí)別,冗余的目錄樹顯然對(duì)對(duì)象存儲(chǔ)場(chǎng)景是多余而且低效的。
而此時(shí),又有幾個(gè)問題擺在了騰訊云存儲(chǔ)產(chǎn)品團(tuán)隊(duì)和存儲(chǔ)技術(shù)團(tuán)隊(duì)面前:
云計(jì)算迅猛發(fā)展,行業(yè)競(jìng)爭(zhēng)的日益激烈,客戶可選擇面較大,對(duì)功能、性能、質(zhì)量、價(jià)格等方面的需求不斷增強(qiáng);
從自身現(xiàn)狀來(lái)說,數(shù)據(jù)量的不斷增大,隨之帶來(lái)軟硬件成本、運(yùn)維成本、優(yōu)化成本的日趨增大;
行業(yè)下游的基礎(chǔ)設(shè)施,如大型數(shù)據(jù)中心、新機(jī)型、新硬件、各種存儲(chǔ)介質(zhì)、網(wǎng)絡(luò)環(huán)境的不斷發(fā)展演進(jìn)。
在這個(gè)形勢(shì)下,2017年,騰訊存儲(chǔ)部門決定要做一個(gè)新的存儲(chǔ)系統(tǒng),一個(gè)更適合云計(jì)算的Blob存儲(chǔ)系統(tǒng)。
“開始我們想的名字是BlobStorage?!?/p>
楊?yuàn)^強(qiáng)笑著對(duì)雷鋒網(wǎng)說:“Blob的意思是一大塊連續(xù)的二進(jìn)制數(shù)據(jù),像一個(gè)視頻文件就是一個(gè)Blob數(shù)據(jù),Storage的意思是存儲(chǔ)空間?!?/p>
顯然,這完全是大家印象中程序員的“正常操作”,但沒有獲得謝明的贊同。
最終存儲(chǔ)系統(tǒng)的名字被確定為「YottaStore」。
“我們是做存儲(chǔ)的,每天打交道的詞匯比如說GB、TB、PB、EB、ZB,而在ZB上面是YB,也就是YottaByte,目前全世界所有的數(shù)據(jù)加起來(lái)也不超過一個(gè)Yotta?!睏?yuàn)^強(qiáng)接著說。
“另外這個(gè)單詞又朗朗上口,中文譯名‘有他’,給人安全可靠放心的感覺,我們?cè)趦?nèi)部的分享課程,就是‘存儲(chǔ)有他,能力無(wú)限’?!?/p>
而這個(gè)名字,也代表了騰訊存儲(chǔ)部門的野心,這個(gè)存儲(chǔ)系統(tǒng)的理論峰值是YB。
“我們現(xiàn)在一個(gè)集群可以存儲(chǔ)1ZB的數(shù)據(jù),如果是1000個(gè)這樣的集群,那我們就可以存儲(chǔ)一個(gè)YB的數(shù)據(jù)。”楊?yuàn)^強(qiáng)很自信的說。

回到重做一個(gè)存儲(chǔ)系統(tǒng)的問題上,為何騰訊會(huì)做出這樣一個(gè)決定?
“我們當(dāng)年將內(nèi)部業(yè)務(wù)上云的時(shí)候,TFS系統(tǒng)支撐我們內(nèi)部業(yè)務(wù)的海量數(shù)據(jù)都是沒問題的,支持外部業(yè)務(wù)當(dāng)然也沒有問題,但我們要把目光放到十年以后?!敝x明如是說。
但事實(shí)上,重新自研一個(gè)存儲(chǔ)系統(tǒng)不是一件容易的事情。
再以谷歌為例,為什么谷歌不做一個(gè)適合于GCS的云上的Blob存儲(chǔ)系統(tǒng)?其實(shí)Google也深諳ColossusV2的問題,在幾年前,谷歌就組建了一個(gè)二三十人團(tuán)隊(duì)去做這件事,但最終卻不了了之。
由于業(yè)務(wù)驅(qū)動(dòng)著技術(shù)的變革,騰訊選擇了Google沒有成功的那條道路,YottaStore在2018年開始了研發(fā),并于2019年正式上線。
“YottaStore,我一直說它是一個(gè)云數(shù)據(jù)存儲(chǔ)系統(tǒng),這跟當(dāng)前業(yè)界絕大多數(shù)公司的做法是完全不同的,它的優(yōu)勢(shì)也是很明顯的?!?/p>
楊?yuàn)^強(qiáng)介紹說:“YottaStore的極限是一個(gè)集群可以管理超上千萬(wàn)臺(tái)服務(wù)器,而要管理這上千萬(wàn)臺(tái)的機(jī)器,我們?cè)瓟?shù)據(jù)管理只需要用600G左右的空間,用一臺(tái)機(jī)器就能存下所有的索引結(jié)構(gòu),管理上千萬(wàn)臺(tái)的存儲(chǔ)節(jié)點(diǎn)服務(wù)器,這在業(yè)界是絕無(wú)僅有的。”
此外,楊?yuàn)^強(qiáng)表示,YottaStore一個(gè)集群可以同時(shí)支持各種不同的冗余模式、任意的EC編碼,同時(shí),集群可以自適應(yīng)各種各樣不同的機(jī)型;對(duì)于存儲(chǔ)節(jié)點(diǎn)的升級(jí),無(wú)論集群規(guī)模多大,YottaStore都可以在20分鐘內(nèi)完成一個(gè)集群的升級(jí)。
更令騰訊存儲(chǔ)團(tuán)隊(duì)驕傲的是,YottaStore開始上線大規(guī)模支撐業(yè)務(wù)的前三個(gè)月一直維持百分之百的可用性,而目前系統(tǒng)仍實(shí)現(xiàn)單人值周零故障運(yùn)行。
“YottaStore存儲(chǔ)系統(tǒng)上線之后,一反通常系統(tǒng)上線后的緊張忙碌的狀態(tài)。就在系統(tǒng)上線的第二天,我們研發(fā)團(tuán)隊(duì)?wèi)阎鵁o(wú)比輕松的心情去吃了一頓人均500多的自助餐,來(lái)犒勞自己?!?/p>
楊?yuàn)^強(qiáng)笑著對(duì)雷鋒網(wǎng)說道。
用戶最為直觀感受的就是,基于YottaStore存儲(chǔ)的騰訊云COS存儲(chǔ)的最低價(jià)格為1分錢/GB/月,而其數(shù)據(jù)持久性達(dá)到了99.999999999%(11個(gè)9)以上。
YottaStore上線后即獲得了騰訊公司級(jí)的業(yè)務(wù)突破獎(jiǎng)。
而如今,基于YottaStore存儲(chǔ)系統(tǒng)的騰訊云對(duì)象存儲(chǔ)COS平臺(tái),正在為快手、OPPO、小紅書、??怠C豹、58同城等幾十多萬(wàn)個(gè)企業(yè)客戶提供了可靠的存儲(chǔ)服務(wù),整體數(shù)據(jù)量高達(dá)EB級(jí)別。
從各種渠道的信息來(lái)看,關(guān)于騰訊這支存儲(chǔ)團(tuán)隊(duì)的報(bào)道少之又少,但其實(shí)在內(nèi)部,這支團(tuán)隊(duì)被稱之為騰訊的“黃埔軍?!薄?/p>
現(xiàn)任騰訊云架構(gòu)平臺(tái)部研發(fā)中心總監(jiān)朱建平也曾是這其中的一員。
“存儲(chǔ)部門走出了很多人去負(fù)責(zé)很多其它方向的技術(shù)研發(fā)。比如做FPGA異構(gòu)加速的,做醫(yī)療AI,做視頻編解碼,同時(shí)還從這個(gè)團(tuán)隊(duì)里面不斷孵化出創(chuàng)新業(yè)務(wù)?!?/p>
朱建平接著說:“我們內(nèi)部說存儲(chǔ)部門是專家的搖籃,分布式存儲(chǔ)平臺(tái),系統(tǒng)設(shè)計(jì)也好,還是運(yùn)營(yíng)等各個(gè)維度,面臨的問題比較多,存儲(chǔ)部門特別能鍛煉人,所以過往一般都是最好的畢業(yè)生放進(jìn)來(lái),然后這邊能力成熟了以后,慢慢又分流到其他戰(zhàn)場(chǎng)去?!?/p>
據(jù)雷鋒網(wǎng)了解,目前騰訊AI、服務(wù)器、運(yùn)管、研效、搜索、CDN、視頻編碼等很多領(lǐng)域的帶頭人都是從存儲(chǔ)團(tuán)隊(duì)出來(lái)的。
而也正是這樣的一個(gè)團(tuán)隊(duì),在為騰訊默默筑建著技術(shù)的根基。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。