云存儲(chǔ)的幾十年發(fā)展歷程,其計(jì)算架構(gòu)模型,也從ScaleUp走向ScaleOut。但是展望未來(lái)數(shù)字世界的海量需求,目前流行的模型還能夠持續(xù)滿足嗎?本文通過(guò)對(duì)云存儲(chǔ)歷史的回顧,及對(duì)ScaleUp和ScaleOut兩種擴(kuò)展模型的詮釋,來(lái)揭開(kāi)云存儲(chǔ)的未來(lái)模式。
1.云存儲(chǔ)及其歷史
簡(jiǎn)而言之,云存儲(chǔ)(cloudstorage)就是將數(shù)字內(nèi)容安全的存儲(chǔ)在服務(wù)器上,從而任何連接互聯(lián)網(wǎng)的設(shè)備可以方便的獲取。首先讓我們簡(jiǎn)單回顧一下云存儲(chǔ)的歷史。
云存儲(chǔ)的早期雛形要回溯到上個(gè)世紀(jì)的90年代,也就是互聯(lián)網(wǎng)泡沫時(shí)期(dot-comboom),當(dāng)時(shí)有許多家公司,例如EVault,NetMass,Arkeia和CommVault等等[1]均提供在線數(shù)據(jù)備份服務(wù),當(dāng)然它們絕大部分也隨著互聯(lián)網(wǎng)泡沫的破碎而煙消云散了。少數(shù)幸存下來(lái)的有一家叫VeritasNetBackup最后也被Symantec收購(gòu),現(xiàn)在依舊提供SymantecNetBackup的在線存儲(chǔ)服務(wù)。
而真正讓大家耳熟能詳?shù)脑拼鎯?chǔ)是2006年由Amazon提供的AWSS3云存儲(chǔ)服務(wù),其最具有革命意義的變革是,提出了即買即用(pay-per-use)的價(jià)格模型,使得云存儲(chǔ)的使用像水電一樣可計(jì)算衡量。從此云存儲(chǔ)以S3為標(biāo)準(zhǔn)一路絕塵,我們所熟悉的大廠,比如Netflix,Pinterest,Dropbox也是S3的顧客。尾隨的Microsoft和Google也于2010年分別發(fā)布了類似的AzureBlobStorage和GoogleStorage的存儲(chǔ)服務(wù)。
云存儲(chǔ)真正發(fā)展的十幾年中,見(jiàn)證了移動(dòng)互聯(lián)網(wǎng)的崛起,大數(shù)據(jù)的生機(jī)勃發(fā),人工智能的再次復(fù)興,并能夠展望到未來(lái)物聯(lián)網(wǎng),無(wú)人駕駛及各類機(jī)器人自動(dòng)化的世界。海量數(shù)據(jù)的產(chǎn)生,存儲(chǔ),分析,預(yù)測(cè)及應(yīng)用,快速以正反饋循環(huán)方式,推進(jìn)著人類社會(huì)向數(shù)字世界大步邁進(jìn)。所以,為了適應(yīng)數(shù)據(jù)存儲(chǔ)新的需求,各家云存儲(chǔ)產(chǎn)品的應(yīng)用場(chǎng)景及價(jià)格模型,已從單一向多元發(fā)展,比如AWSS3就有Standard,Intelligent-Tiering,Standard-IA,OneZone-IA,Glacier和GlacierDeepArchive六類存儲(chǔ)產(chǎn)品來(lái)滿足各類使用場(chǎng)景,我會(huì)在未來(lái)的文章里針對(duì)性的細(xì)講一下。而本文重點(diǎn)所探討的是,目前云存儲(chǔ)的基礎(chǔ)架構(gòu)體系是否能夠適應(yīng)未來(lái)數(shù)據(jù)存儲(chǔ)的要求和挑戰(zhàn)?為了回答這個(gè)問(wèn)題,讓我們先簡(jiǎn)單回顧一下計(jì)算機(jī)體系架構(gòu)里的ScaleUp和ScaleOut擴(kuò)展模型。
2.ScaleUp和ScaleOut?
ScaleUp又稱為垂直擴(kuò)展(scalevertically)[2],意為在單節(jié)點(diǎn)上添加資源,如CPU,內(nèi)存和存儲(chǔ),在縱向上擴(kuò)展從而獲得更多計(jì)算或存儲(chǔ)能力;ScaleUp初期能夠快速達(dá)到升級(jí)目的,操作起來(lái)相對(duì)比較簡(jiǎn)單,但隨著計(jì)算或存儲(chǔ)的要求越來(lái)越高,硬件資源的添加可能已經(jīng)達(dá)到極限,不僅單節(jié)點(diǎn)的造價(jià)非常昂貴,維護(hù)成本很高,而且更容易留下單點(diǎn)故障的隱患。傳統(tǒng)的RAID(RedundantArrayofInexpensiveDisks)存儲(chǔ)就是此種模式。
ScaleOut又稱為水平擴(kuò)展(scalehorizontally)[2],意為在分布式環(huán)境下,通過(guò)添加節(jié)點(diǎn)計(jì)算或存儲(chǔ)資源,在橫向上滿足更多的計(jì)算存儲(chǔ)需求;隨著計(jì)算和存儲(chǔ)單位價(jià)格的降低和效率的提升,使用低端的商用(commodity)系統(tǒng),利用分布式技術(shù)可以搭建起“超級(jí)計(jì)算”中心,以及后來(lái)衍生出來(lái)的私有或公有云平臺(tái)解決方案。雖然分布式系統(tǒng)會(huì)帶來(lái)一定程度上的軟件復(fù)雜度和管理困難,但由軟件定義的計(jì)算和存儲(chǔ)解決方案,能夠以較低的價(jià)格和較高的魯棒性,優(yōu)雅的解決了海量增長(zhǎng)的計(jì)算存儲(chǔ)需求,也是目前云平臺(tái)的主流技術(shù)。但它就一定能夠承載未來(lái)的更加海量的需求嗎?云存儲(chǔ)的未來(lái)是什么?方向是向左還是向右?
3.未來(lái)向左還是向右?
話說(shuō)天下大勢(shì),分久必合,合久必分,事物發(fā)展的規(guī)律似乎從來(lái)就沒(méi)有什么絕對(duì)。當(dāng)下,云平臺(tái)內(nèi)部似乎已完全是ScaleOut模式了,但當(dāng)我們把鏡頭再拉遠(yuǎn)一點(diǎn),從云平臺(tái)在全球部署的每一個(gè)可用區(qū)來(lái)看,整體上它又是一個(gè)ScaleUp模型,不是嗎?單點(diǎn)投入巨大,耗費(fèi)能源,使用成本高昂。而相反,隨著強(qiáng)大的計(jì)算,存儲(chǔ)和帶寬能力能夠進(jìn)入尋常家庭、工作和生活等邊緣節(jié)點(diǎn),資源閑置或者不均衡使用也變得越來(lái)越明顯。
那么,是否能夠?qū)⑦@些邊緣節(jié)點(diǎn)的計(jì)算存儲(chǔ)能力結(jié)合起來(lái),組成一個(gè)真正意義上的ScaleOut平臺(tái),提供人們?nèi)找嬖鲩L(zhǎng)的計(jì)算存儲(chǔ)需求?
可否將浪費(fèi)或者不對(duì)等的資源重新組合,提供一個(gè)更加節(jié)能環(huán)保的綠色ScaleOut平臺(tái)?
可否摒棄中心化的單點(diǎn)故障和數(shù)據(jù)安全隱患,真正做到廉價(jià)高效,零數(shù)據(jù)泄露的ScaleOut平臺(tái)?
答案是應(yīng)該可以而且必須可以!
縱觀云存儲(chǔ)平臺(tái)的發(fā)展歷史,從單節(jié)點(diǎn)的ScaleUp模式走向可用區(qū)內(nèi)部的ScaleOut模式,又從內(nèi)部的ScaleOut模式走向整體上相對(duì)的ScaleUp模式。而未來(lái)數(shù)字世界的海量計(jì)算和存儲(chǔ)需求的滿足,一定需要真正意義上的全球ScaleOut模型,那就是把邊緣節(jié)點(diǎn)和半中心化節(jié)點(diǎn)高效且系統(tǒng)的組織起來(lái),減少浪費(fèi),提高效率,節(jié)省成本,去除中心。將天空中幾塊為數(shù)不多的白云,變成漫天遍布的朵朵白云,讓人們自由定價(jià)、自由選擇、自由組合。
挑戰(zhàn)雖然巨大,但未來(lái)很美好,讓我們一起努力迎接云存儲(chǔ)的明天!
[1]:HistoryofOnlineStorage
[2]:WikiScalability
文章作者:BruceLee(http://PP.IO總架構(gòu)師)
轉(zhuǎn)載請(qǐng)注明出處
如果有關(guān)于PPIO的交流,可以通過(guò)下面的方式聯(lián)系我:
加我微信,注意備注來(lái)源
wechat:omnigeeker