補(bǔ)足劣勢(shì),放大自己的優(yōu)勢(shì)
隨著互聯(lián)網(wǎng)以及移動(dòng)互聯(lián)網(wǎng)的興起,非結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長(zhǎng),存儲(chǔ)容量成為了大多數(shù)生成和使用大量非結(jié)構(gòu)化數(shù)據(jù)的用戶和企業(yè)面臨的首要挑戰(zhàn)。
用戶或者企業(yè)必須購(gòu)買更多的存儲(chǔ)基礎(chǔ)設(shè)施,并將其堆疊在現(xiàn)有基礎(chǔ)設(shè)施之上。這種方法在非結(jié)構(gòu)化數(shù)據(jù)線性增長(zhǎng)的情況下有效,但對(duì)于處理當(dāng)今指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù)來(lái)說(shuō),既繁瑣又低效。
而對(duì)象存儲(chǔ)通過(guò)分布式系統(tǒng),將節(jié)點(diǎn)部署在任何需要的地方,都可以邊收集數(shù)據(jù)邊執(zhí)行分析,而不必通過(guò)網(wǎng)絡(luò)發(fā)送所有原始的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理。這一高效而低成本的特性,使得對(duì)象存儲(chǔ)迅速取代了存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)和網(wǎng)絡(luò)連接存儲(chǔ)(NAS),成為了存儲(chǔ)界的新網(wǎng)紅。
實(shí)際上,早在1996年,美國(guó)卡內(nèi)基梅隆大學(xué)就將對(duì)象存儲(chǔ)作為一個(gè)研究項(xiàng)目提出來(lái)。隨后,加州大學(xué)伯克利分校也有推出類似的項(xiàng)目。2002年,F(xiàn)ilepool公司推出了基于內(nèi)容可尋址技術(shù)的Centera系統(tǒng),算是比較早期的對(duì)象存儲(chǔ)系統(tǒng)。
2006年,當(dāng)亞馬遜推出AWS S3(Simple Storage Service)存儲(chǔ)服務(wù)后,正式將對(duì)象存儲(chǔ)作為一項(xiàng)云存儲(chǔ)服務(wù),引入云計(jì)算領(lǐng)域,從此開(kāi)啟了對(duì)象存儲(chǔ)的黃金時(shí)代。
但在國(guó)內(nèi),對(duì)象存儲(chǔ)則起步較晚,領(lǐng)頭者也是鳳毛麟角,作為云計(jì)算領(lǐng)域的國(guó)家隊(duì),天翼云于2013年走上了自主研發(fā)的道路,并在2015年實(shí)現(xiàn)了“跨區(qū)域復(fù)制”這一業(yè)內(nèi)領(lǐng)先的能力。
此后,更是發(fā)揮了中國(guó)電信帶寬優(yōu)勢(shì),打造了一個(gè)強(qiáng)一致性的國(guó)家級(jí)存儲(chǔ)網(wǎng)絡(luò),讓用戶可實(shí)現(xiàn)就近訪問(wèn)和讀寫(xiě)數(shù)據(jù),大幅提升用戶體驗(yàn),并且提高開(kāi)發(fā)者的效率。并攻克“廣域網(wǎng)環(huán)境下如何確保穩(wěn)定性”的技術(shù)難點(diǎn),降低了網(wǎng)絡(luò)波動(dòng)對(duì)存儲(chǔ)系統(tǒng)的影響,提升服務(wù)穩(wěn)定性。
就在2018年6月,天翼云和云上貴州已于6月底正式簽署《基礎(chǔ)設(shè)施協(xié)議》,這標(biāo)志著自2018年2月28日中國(guó)內(nèi)地的iCloud業(yè)務(wù)由云上貴州負(fù)責(zé)運(yùn)營(yíng)后,中國(guó)電信天翼云將和云上貴州共同為iCloud提供云存儲(chǔ)服務(wù),該筆簽約是業(yè)內(nèi)目前最大的云計(jì)算存儲(chǔ)類訂單。
契機(jī)之下,雷鋒網(wǎng)與中國(guó)電信首席專家江峰進(jìn)行了一次深度對(duì)話,還原天翼云打造“國(guó)家級(jí)存儲(chǔ)網(wǎng)絡(luò)”的歷程。
1、從12年的路標(biāo)看未來(lái)
2009年,中國(guó)電信正式啟動(dòng)“翼云計(jì)劃” ,也就是天翼云的前身。
2012年8月,中國(guó)電信對(duì)外發(fā)布了云計(jì)算戰(zhàn)略及解決方案,成為國(guó)內(nèi)首家發(fā)力云計(jì)算的電信運(yùn)營(yíng)商。而彼時(shí),天翼云對(duì)外提供的云服務(wù)還不是今天的OOS對(duì)象存儲(chǔ)服務(wù)。
“2012年,我們從集團(tuán)調(diào)到云計(jì)算公司的時(shí)候,大家其實(shí)還不知道什么是對(duì)象存儲(chǔ),只知道存儲(chǔ)就是磁盤(pán)陣列軟件系統(tǒng)。”
江峰對(duì)雷鋒網(wǎng)回憶到,雖是這樣說(shuō),站在2012年路標(biāo)時(shí)的他也隱隱的感覺(jué)到,對(duì)象存儲(chǔ)是未來(lái)的一個(gè)發(fā)展方向。
但就在一年前,中國(guó)電信集團(tuán)已經(jīng)為云計(jì)算公司集采了一批商用存儲(chǔ),而這批設(shè)備使用的是CSRP規(guī)范,雖然也是S3的一種,但實(shí)際上卻是中國(guó)電信自己造的一稿規(guī)范,而基于這個(gè)規(guī)范開(kāi)發(fā)的云產(chǎn)品上市之后,卻發(fā)現(xiàn)CSRP規(guī)范沒(méi)人用。
右二為江峰
而為了給用戶一個(gè)好的體驗(yàn),江峰團(tuán)隊(duì)決定將上層調(diào)度先規(guī)劃好,底層引擎仍然使用各家的產(chǎn)品,能滿足基本的可用要求即可。
然而在實(shí)踐中發(fā)現(xiàn),如果需要良好的性能,就要將它的產(chǎn)品拆開(kāi),要將上層的接口直接訪問(wèn)底層引擎上。
“廠商知道這樣的性能好,但是他們不愿意暴露底層引擎接口。但廠家在引擎之上再封裝一套接口給我,性能就不行了。”
擺在他們面前只有兩條路了,要么維持現(xiàn)狀繼續(xù)下去,要么自主研發(fā),完全做一套自己的存儲(chǔ)引擎。
“那個(gè)時(shí)候我們花了很多的時(shí)間去糾結(jié)到底要不要自己做,還是拿一套開(kāi)源的修改一下,因?yàn)樽约鹤鲞€是很難的一件事情。”
最終經(jīng)過(guò)不斷論證之后,天翼云存儲(chǔ)團(tuán)隊(duì)決定了自己研發(fā),而且還決定了不基于任何開(kāi)源。
一行行代碼敲下來(lái),就在2014年,一款設(shè)計(jì)最大容量為256PB的OOS V4.0版本面世了。這是第一代分布式存儲(chǔ)引擎。
“當(dāng)時(shí)我們認(rèn)為256PB這一容量上限,可以滿足10年的需求。”江峰回憶到。
然而,就在OOS v4.0面世沒(méi)多久,需求就已經(jīng)超過(guò)了1000PB,而且要求在一個(gè)集群里搞定。面對(duì)這一情況,天翼云存儲(chǔ)團(tuán)隊(duì)從頭開(kāi)始研發(fā),將數(shù)據(jù)結(jié)構(gòu)全部進(jìn)行調(diào)整,對(duì)于數(shù)據(jù)容量上限,也不再去設(shè)立目標(biāo)。
不久之后,OOS v5.0版本也投入使用,不僅僅做到了數(shù)據(jù)結(jié)構(gòu)層面沒(méi)有了容量上限的,并且還實(shí)現(xiàn)了全國(guó)范圍內(nèi)的異地冗余,雖然不是強(qiáng)一致性的,但也是國(guó)內(nèi)首個(gè)可以實(shí)現(xiàn)異地冗余的對(duì)象存儲(chǔ)產(chǎn)品。
2、瞄準(zhǔn)一個(gè)特性“死磕”
“從我們團(tuán)隊(duì)這么多年的經(jīng)驗(yàn)來(lái)說(shuō),對(duì)象存儲(chǔ)需要瞄準(zhǔn)一個(gè)特性一直做下去,這個(gè)特性就是:低成本。”江峰對(duì)雷鋒網(wǎng)說(shuō)到。
為了低成本這個(gè)特性,江峰這個(gè)團(tuán)隊(duì)可謂是較勁腦汁。
在OOS V4.0開(kāi)發(fā)之時(shí),為了減少用戶存儲(chǔ)容量浪費(fèi),在保證數(shù)據(jù)穩(wěn)定的前提下,他們?yōu)榇鎯?chǔ)的數(shù)據(jù)提供動(dòng)態(tài)冗余算法,會(huì)根據(jù)用戶數(shù)據(jù)的具體情況,來(lái)決定是采用糾刪碼還是多副本更節(jié)省用戶的存儲(chǔ)空間。
通過(guò)動(dòng)態(tài)冗余算法,天翼云可以一直將用戶存儲(chǔ)容量浪費(fèi)減小到最低限度,既能保證數(shù)據(jù)的持久性還能為客戶降低成本。
軟件層面將成本降低之后,江峰又將目光瞄向了硬件層面。他發(fā)現(xiàn),要想增加單磁盤(pán)容量,就要增加介質(zhì)的磁密度。但受限于物理工藝,再要增加磁密度會(huì)變得越來(lái)越難了。而磁盤(pán)廠商在這樣的情況下,研發(fā)了疊瓦式磁盤(pán),將密度再次提高。
熟悉的朋友比較清楚,疊瓦式磁盤(pán)(SMR)增加了容量,降低了成本,但這種技術(shù)應(yīng)用也帶來(lái)了問(wèn)題與挑戰(zhàn)。磁道重疊后必須順序?qū)懭?,否則會(huì)對(duì)相鄰磁道的數(shù)據(jù)造成損壞。正因?yàn)槿绱?,目前業(yè)內(nèi)常用的磁盤(pán)文件系統(tǒng),例如EXT/XFS等,由于需要隨機(jī)的修改數(shù)據(jù)從而無(wú)法運(yùn)行在SMR磁盤(pán)上,這對(duì)SMR的應(yīng)用帶來(lái)了不小的困難。
因此,SMR技術(shù)一直都被業(yè)內(nèi)大多數(shù)企業(yè)“嫌棄”并不使用,而這也正是希捷和西數(shù)這兩家硬盤(pán)企業(yè)所頭疼的地方,并沒(méi)有相關(guān)的生態(tài)去支持他們這個(gè)產(chǎn)品,也就導(dǎo)致了這種磁盤(pán)并沒(méi)有文件系統(tǒng)可以使用。但在那時(shí),微軟Azure等極個(gè)別國(guó)際云計(jì)算巨頭卻規(guī)模商用SMR磁盤(pán)。
這一切都被江峰看在眼里,因此在SMR磁盤(pán)上市的第一時(shí)間就聯(lián)系相關(guān)服務(wù)器和磁盤(pán)供應(yīng)商,開(kāi)始了對(duì)SMR磁盤(pán)的測(cè)試。
經(jīng)過(guò)測(cè)試后,他們發(fā)現(xiàn)雖然SMR磁盤(pán)的應(yīng)用存在諸多技術(shù)挑戰(zhàn),但通過(guò)行業(yè)領(lǐng)先廠商的產(chǎn)品趨勢(shì)可以看到未來(lái)硬盤(pán)的發(fā)展方向,SMR技術(shù)將成為主流,即使未來(lái)會(huì)有諸如HAMR等進(jìn)一步提升磁密度的技術(shù)出現(xiàn),只要寫(xiě)數(shù)據(jù)寬度大于讀數(shù)據(jù)寬度,SMR技術(shù)就會(huì)一直存在。
因此天翼云OOS的研發(fā)團(tuán)隊(duì)從2015年起就堅(jiān)定不移的對(duì)Host Managed SMR進(jìn)行自主研發(fā)。在軟件層做了大量的優(yōu)化、消除,解決了技術(shù)提升帶來(lái)的負(fù)面影響,突破了SMR的技術(shù)局限性,體現(xiàn)疊瓦式存儲(chǔ)給單碟存儲(chǔ)容量提升帶來(lái)的優(yōu)勢(shì),既能夠提高單機(jī)存儲(chǔ)容量的上限,又可以避免帶來(lái)讀寫(xiě)效率、讀寫(xiě)性能上的瓶頸。
同時(shí),結(jié)合OOS的特點(diǎn),天翼云設(shè)計(jì)了可以兼容SMR磁盤(pán)的一套類似文件系統(tǒng)的Key-Value存儲(chǔ)系統(tǒng)——KVDisker。結(jié)合對(duì)象存儲(chǔ)的特性,KVDisker能夠有效降低SMR技術(shù)引用帶來(lái)的問(wèn)題與風(fēng)險(xiǎn),將技術(shù)與應(yīng)用完美融合,天翼云開(kāi)創(chuàng)了將SMR磁盤(pán)有效應(yīng)用于云存儲(chǔ)服務(wù)領(lǐng)域的先河,此舉也將天翼云對(duì)象存儲(chǔ)成本降低了20%以上。
值得一提的是,KVDisker也是天翼云存儲(chǔ)團(tuán)隊(duì)完全自主研發(fā),不基于任何已有文件系統(tǒng)(如EXT/XFS)及任何支持SMR的開(kāi)源軟件,實(shí)現(xiàn)直接讀寫(xiě)磁盤(pán)的技術(shù)。
在2015年,規(guī)模使用了SMR硬盤(pán)之后,江峰又將目光瞄向了服務(wù)器上,結(jié)合中國(guó)電信的實(shí)際情況之后,江峰向中國(guó)電信集團(tuán)提出,要定制可以容納60個(gè)盤(pán)的服務(wù)器,而相比于其他廠商,大多廠商的服務(wù)器只能容納20多個(gè)盤(pán)而已。
容納60個(gè)磁盤(pán)的服務(wù)器,并只采用一路CPU,而通過(guò)這樣的方式,天翼云存儲(chǔ)團(tuán)隊(duì)再將采購(gòu)成本降低了50%以上,在實(shí)際使用中,服務(wù)器的CPU利用率也只有20%。
“之前跟互聯(lián)網(wǎng)公司相比,很多人都會(huì)覺(jué)得成本方面,對(duì)于天翼云來(lái)說(shuō)是一個(gè)劣勢(shì),通過(guò)我們不斷優(yōu)化之后,我們?cè)诔杀痉矫婢邆淞伺c互聯(lián)網(wǎng)公司同樣的優(yōu)勢(shì)。”
而在這之后,如何將自己的優(yōu)勢(shì)放大,則也成為了江峰接下來(lái)考慮的重要方向。
如何做一個(gè)“國(guó)家級(jí)存儲(chǔ)網(wǎng)絡(luò)”
“2015年之后,我就在想中國(guó)電信的優(yōu)勢(shì)究竟是什么?中國(guó)電信的優(yōu)勢(shì)就是有網(wǎng)絡(luò),別人做分布式存儲(chǔ)都是建一個(gè)個(gè)資源池,看起來(lái)是把資源池連起來(lái)了,但實(shí)際上這些資源池只是在管理上連接起來(lái)了,數(shù)據(jù)平面沒(méi)有打通。”
在2016年一個(gè)知名的云計(jì)算大會(huì)上,江峰提出,要利用中國(guó)電信的帶寬資源,將國(guó)內(nèi)的所有資源池連接起來(lái),做成一個(gè)國(guó)家級(jí)存儲(chǔ)網(wǎng)絡(luò)。
我們?cè)谇拔闹刑岬?,在OOS v5.0時(shí),中國(guó)電信就已經(jīng)實(shí)現(xiàn)了異地冗余,但是弱一致性的,也就是說(shuō),你在北京寫(xiě)入數(shù)據(jù)之后,需要過(guò)一段時(shí)間才能備份到上?;蛘咂渌胤健?/p>
而現(xiàn)在,江峰所提出的國(guó)家級(jí)存儲(chǔ)網(wǎng)絡(luò)要實(shí)現(xiàn)的是強(qiáng)一致性的,用戶可實(shí)現(xiàn)就近訪問(wèn)和讀寫(xiě)數(shù)據(jù),大幅提升用戶體驗(yàn),并且提高開(kāi)發(fā)者的效率,不用再擔(dān)心用戶在哪,要把資源建在哪里。
“國(guó)家級(jí)存儲(chǔ)網(wǎng)絡(luò)”事實(shí)上就是把全國(guó)的云存儲(chǔ)OOS資源池用高速網(wǎng)絡(luò)互連起來(lái),對(duì)外呈現(xiàn)為一個(gè)統(tǒng)一的云存儲(chǔ)資源池,無(wú)論用戶通過(guò)哪個(gè)物理資源池訪問(wèn)OOS,看到的都是同一個(gè)視圖。
“國(guó)家級(jí)存儲(chǔ)網(wǎng)絡(luò)”的核心技術(shù)在于以下三點(diǎn):
一是如何高效管理數(shù)量眾多、規(guī)模巨大的資源池集群,這本身就是一個(gè)復(fù)雜的系統(tǒng)工程;
二是如何讓每個(gè)用戶從不同的資源池看到同一個(gè)視圖,這不僅要求資源池之間具備“高速通道”,還要求OOS本身在擴(kuò)展性、效率方面有精巧的設(shè)計(jì);
三是如何在相隔數(shù)千公里的多個(gè)資源池之間,既保證數(shù)據(jù)的一致性,又提供極低的延遲。
就在天翼云將資源池跨廣域網(wǎng)部署之后,他們發(fā)現(xiàn)廣域網(wǎng)環(huán)境經(jīng)常會(huì)發(fā)生網(wǎng)絡(luò)抖動(dòng)的情況,而這一情況不解決的話,服務(wù)穩(wěn)定性很難保證。此外,江峰還發(fā)現(xiàn),在廣域網(wǎng)環(huán)境中,TCP網(wǎng)絡(luò)都不可靠,當(dāng)數(shù)據(jù)跨越千里傳輸?shù)臅r(shí)候,你可能發(fā)出123,但經(jīng)過(guò)光網(wǎng)長(zhǎng)距離傳輸,對(duì)方則有概率收到的是321,還不報(bào)錯(cuò)。
后來(lái)經(jīng)過(guò)研究發(fā)現(xiàn),IPv4協(xié)議有一個(gè)弱點(diǎn),校驗(yàn)位不足的情況下會(huì)出現(xiàn)概率性的錯(cuò)誤,但徹底解決這個(gè)問(wèn)題并不是一件易事。
對(duì)此,內(nèi)部多次開(kāi)會(huì)進(jìn)行了溝通,最后,中國(guó)電信云計(jì)算分公司現(xiàn)任總經(jīng)理胡志強(qiáng),提出了一個(gè)要求:必須要自主研發(fā)。
最終,江峰帶領(lǐng)團(tuán)隊(duì)通過(guò)不斷努力,終于攻克了“廣域網(wǎng)環(huán)境下如何確保穩(wěn)定性”的技術(shù)難點(diǎn),降低了網(wǎng)絡(luò)波動(dòng)對(duì)存儲(chǔ)系統(tǒng)的影響,提升了服務(wù)的穩(wěn)定性。同時(shí),基于全局元數(shù)據(jù)環(huán)技術(shù),實(shí)現(xiàn)了跨地域的分布式架構(gòu)“虛擬存儲(chǔ)網(wǎng)絡(luò)”和“業(yè)務(wù)場(chǎng)景敏感的數(shù)據(jù)交付”模型。
從那時(shí)起,中國(guó)電信的存儲(chǔ)網(wǎng)絡(luò)OOS就擁有了資源統(tǒng)一,就近訪問(wèn),多站點(diǎn)多活等功能,滿足用戶在強(qiáng)一致性和最終一致性間進(jìn)行靈活選擇。
不僅如此,天翼云存儲(chǔ)團(tuán)隊(duì)在此基礎(chǔ)之上針對(duì)部分政企客戶推出了高級(jí)特性,不僅保證其數(shù)據(jù)的安全,同時(shí)也降低其存儲(chǔ)成本。
就在這一網(wǎng)絡(luò)建成之后,天翼云存儲(chǔ)也獲得了當(dāng)時(shí)業(yè)內(nèi)最大的一筆云存儲(chǔ)訂單:為云上貴州運(yùn)營(yíng)的iCloud提供底層云存儲(chǔ)服務(wù)。
云上貴州項(xiàng)目組合影
而其所看重的,正是天翼云可以實(shí)現(xiàn)全國(guó)各地都可以實(shí)現(xiàn)就近服務(wù),這也使得,iCloud訪問(wèn)同步速度更快,體驗(yàn)大幅提升。
3、獨(dú)立之后,仍需苦練內(nèi)功
天翼云存儲(chǔ)網(wǎng)絡(luò)上的數(shù)據(jù)早已經(jīng)超過(guò)EB,在可用性上,已經(jīng)實(shí)現(xiàn)了數(shù)十個(gè)月內(nèi)每周的服務(wù)可用性超99.995%。而這也正是天翼云不斷堅(jiān)持自主研發(fā)所取得的成果。
中國(guó)電信剛剛發(fā)布的財(cái)報(bào)顯示,2020年中國(guó)電信全網(wǎng)云計(jì)算收入達(dá)138億元,不光在以市場(chǎng)份額駁斥了運(yùn)營(yíng)商做不好云計(jì)算的理論。同時(shí),中國(guó)電信是全球運(yùn)營(yíng)商中,第一家真正實(shí)現(xiàn)核心的IT系統(tǒng)去IOE的運(yùn)營(yíng)商,通過(guò)自主研發(fā)構(gòu)建了云網(wǎng)數(shù)智,全棧自研的體系,將技術(shù)能力轉(zhuǎn)化為數(shù)字化平臺(tái)推向市場(chǎng)。
此前,一紙任命書(shū)也正式官宣,中國(guó)電信要成立天翼云科技公司,這意味著天翼云將開(kāi)始獨(dú)立運(yùn)作,擺脫國(guó)企的體制限制,將有更大的自主權(quán),可以自主提升員工的薪酬水平,以靈活激勵(lì)機(jī)制吸引人才。
而這必然會(huì)將天翼云的目前的劣勢(shì)進(jìn)一步填補(bǔ),繼續(xù)苦練“內(nèi)功”,在此之下,天翼云未來(lái)可期。