剛剛,中國移動官宣“移動云大會”升級為“算力網(wǎng)絡(luò)大會”。對此,有媒體老師問我,“有了云計算,為什么我們還需要算力網(wǎng)絡(luò)?”我覺得這是一個好問題,剛梳理了一下個人的觀點,大致如下:
01 - 云計算忙不過來了
一個現(xiàn)實情況是:在數(shù)據(jù)爆發(fā)式增長的今天,傳統(tǒng)云計算顯然“忙不過來”了。
云計算的核心邏輯是通過云服務模型、云計算基礎(chǔ)設(shè)施和云計算架構(gòu)的有機結(jié)合,形成一片計算云,為用戶提供高效、靈活、可擴展的計算服務,以此來提高資源的利用率,降低用戶的運營成本。這種模式下,各類客戶(企業(yè)、個人)都通過網(wǎng)絡(luò)遠程接入云計算數(shù)據(jù)中心,根據(jù)需求進行數(shù)據(jù)存儲和數(shù)據(jù)計算。
但是,隨著各類物聯(lián)網(wǎng)技術(shù)的發(fā)展,全社會產(chǎn)生的數(shù)據(jù)量在爆炸式增長,同時數(shù)據(jù)產(chǎn)生的地點也開始由集中走向徹底分散,這些數(shù)據(jù)都有存儲和計算的需求。這樣一來,問題就出現(xiàn)了——
第一個問題是傳統(tǒng)云計算架構(gòu)難以滿足日益膨脹的海量數(shù)據(jù)的計算需求。雖然云計算架構(gòu)本身具有一定的可擴展性,但當數(shù)據(jù)量達到海量級別時,計算資源、存儲資源和網(wǎng)絡(luò)資源的需求將對傳統(tǒng)云計算架構(gòu)的擴展能力提出巨大挑戰(zhàn)。這很難通過云計算技術(shù)本身的升級來解決。
第二個問題是傳統(tǒng)云計算模式難以滿足實時數(shù)據(jù)處理訴求。云計算本質(zhì)是集中計算以節(jié)省成本,數(shù)據(jù)被終端采集后要先傳輸?shù)皆朴嬎阒行?,完成計算后返回結(jié)果,這中間將產(chǎn)生一定的響應時間,而這對某些業(yè)務場景來說是致命的,比如,無人駕駛、精密生產(chǎn)的智慧工廠等。怎么解決這兩個問題呢?邊緣計算出現(xiàn)了。邊緣計算的核心邏輯是在靠近數(shù)據(jù)源或用戶的地方進行計算和服務提供,通過在網(wǎng)絡(luò)的邊緣側(cè)(即數(shù)據(jù)源附近)執(zhí)行計算任務,減少了數(shù)據(jù)傳輸的延遲,提高了響應速度。而由于每個邊緣計算點的數(shù)據(jù)規(guī)模是可控的,也不會觸及云架構(gòu)的擴展極限。
在邊緣計算的基礎(chǔ)上,端計算也出現(xiàn)了。端計算是指在物聯(lián)網(wǎng)環(huán)境中,各種設(shè)備、傳感器和智能硬件等終端節(jié)點上的計算方式,可以實現(xiàn)數(shù)據(jù)采集、處理和近實時決策。別小看這些零散的算力,海量終端加起來,這也是一個巨大的算力資源,把這些算力匯聚起來分享給其他場景的計算需求,就是算力共享。這樣一來,上面兩個問題都解決了,還順帶解決了客戶數(shù)據(jù)安全性焦慮的問題。
但新問題又出現(xiàn)了——未來算力肯定是泛在的:有集中化的云計算、有節(jié)點式邊緣計算,還有無處不在的端計算。而且這三者的資源比例可能后面兩者的占比會遠大于前者,算力的分布將不再集中在數(shù)據(jù)中心,而是廣泛地分布在邊緣或者端側(cè)的任何位置。
問題就是:這些廣泛分布的算力資源將如何被使用、被共享、被調(diào)度、被協(xié)同呢?答案很簡單,把這些算力用網(wǎng)絡(luò)連起來就可以了。這就是算力網(wǎng)絡(luò)的核心邏輯。
先小結(jié)下前文:在新的需求環(huán)境下,傳統(tǒng)的云計算依然重要,但不再是主角,我們需要一個全新的操作系統(tǒng),對各類泛在的計算資源進行抽象和封裝,為用戶提供更簡單、更便捷、更普惠的算力服務。這個全新的操作系統(tǒng)就是算力網(wǎng)絡(luò)。
02 - 算力網(wǎng)絡(luò)是什么?
算力網(wǎng)絡(luò)是一個全新的算力操作系統(tǒng),那它的核心邏輯是什么?我認為可以從下面兩個層面來理解——
一是資源連接與動態(tài)調(diào)度:算力網(wǎng)絡(luò)通過新型網(wǎng)絡(luò)技術(shù)連接地理分布的算力中心節(jié)點。它動態(tài)實時地感知算力資源狀態(tài),進而統(tǒng)籌分配和調(diào)度計算任務,構(gòu)成全局范圍內(nèi)感知、分配、調(diào)度算力的網(wǎng)絡(luò)。
二是算力的匯聚與共享:算力網(wǎng)絡(luò)在連接的基礎(chǔ)上匯聚算力、數(shù)據(jù)、應用資源,實現(xiàn)資源的共享。通過網(wǎng)絡(luò)的靈活性和算力的可調(diào)度性,算力網(wǎng)絡(luò)可以滿足不同應用場景對算力的需求。
簡單來理解,算力網(wǎng)絡(luò)將實現(xiàn)云、邊、端三級計算的高效協(xié)同工作,形成一張聯(lián)接了所有的計算節(jié)點的算力資源網(wǎng)絡(luò),甚至我們可以理解為,算力網(wǎng)絡(luò)將所有被連接的計算節(jié)點的算力匯集到一個算力池中,實現(xiàn)算力的“一點接入,即取即用”。
那算力網(wǎng)絡(luò)怎么才能實現(xiàn)這么宏偉的目標?
那就離不開算力網(wǎng)絡(luò)的四大組成部分:算力路由-網(wǎng)絡(luò)能感知算力,并為其提供最優(yōu)算力路由;算力調(diào)度-算網(wǎng)大腦智能編排、彈性調(diào)度全網(wǎng)算力資源;算力交易-基于區(qū)塊鏈的算力可信和算力網(wǎng)絡(luò)交易平臺。
智能網(wǎng)絡(luò)-實現(xiàn)云、邊、端全連接的智能IP算力網(wǎng)絡(luò)。算力路由解決了算力感知的問題,算網(wǎng)大腦解決了算力的編排、調(diào)度問題,智能網(wǎng)絡(luò)解決資源的連接和傳送問題,算力交易解決了第三方算力接入的可信問題。上述四大功能的詳細內(nèi)容大家可以去翻翻中國移動算力網(wǎng)絡(luò)系列白皮書。
重點提兩句算網(wǎng)大腦,這是算力網(wǎng)絡(luò)的核心。算網(wǎng)大腦在作用在于統(tǒng)一感知、編排、調(diào)度、協(xié)同“網(wǎng)絡(luò)中的算力”。它需要具備“看得見”“調(diào)得動”“可組合”“有智慧”等能力——
看得見:全域態(tài)勢感知,獲取全域?qū)崟r的算、網(wǎng)、數(shù)資源,以及云、邊、端分布情況,構(gòu)建全域態(tài)勢感知地圖。
調(diào)得動:跨域協(xié)同調(diào)度,將多域協(xié)同的調(diào)度任務智能、自動地分解給各個使能平臺,實現(xiàn)算、網(wǎng)、數(shù)的資源調(diào)度。
可組合:多域融合編排,針對多域融合業(yè)務需求,基于算、網(wǎng)、數(shù)的原子能力按需靈活組合編排。
有智慧:智能輔助決策,基于不同業(yè)務的SLA要求、網(wǎng)絡(luò)整體負載、可用算力資源池分布等因素,智能、動態(tài)地計算出算、網(wǎng)、數(shù)的最優(yōu)協(xié)同策略。(注:引用自華為“算力網(wǎng)絡(luò)”報告)簡單來說,如果說算力網(wǎng)絡(luò)是一臺超級計算機,匯聚了全網(wǎng)的算力,算力大腦就是要把來自各方各面的計算需求以最優(yōu)解的方式合理分配到這臺超級計算機的每個計算單元中。
03 - 為什么我們需要算力網(wǎng)絡(luò)?
算力網(wǎng)絡(luò)能解決傳統(tǒng)云計算無法解決的兩大問題,然而,我認為,算力網(wǎng)絡(luò)對于中國的價值遠不止于此。當前,人工智能是大國競爭的重要賽道,而人工智能的發(fā)展背后需要得到巨量算力的支撐。英偉達創(chuàng)始人黃仁勛曾直言,“算力即權(quán)力”,他主張每個國家都要建立自己的主權(quán)AI基礎(chǔ)設(shè)施。但中國面臨的情況比較特殊,美國商務部長雷蒙多今年1月公開演講稱,美國正在全力阻止中國獲得用來訓練大模型的算力。
從當前產(chǎn)業(yè)實踐層面來看,由于種種主觀的、客觀的原因,國內(nèi)算力資源在規(guī)模和使用成本等方面是無法滿足人工智能的規(guī)模化應用和快速迭代創(chuàng)新的需要。
算力網(wǎng)絡(luò)可能是中國解決算力問題的最佳方案。前不久,四部委聯(lián)合發(fā)布了《關(guān)于深入實施“東數(shù)西算”工程加快構(gòu)建全國一體化算力網(wǎng)的實施意見》,正是國家層面對于人工智能時代算力瓶頸問題思考的結(jié)果。
回到前面,中國移動把“云計算大會”升級為“算力網(wǎng)絡(luò)大會”,此舉背后,恰恰正是中國移動希望結(jié)合自身過去在算力網(wǎng)絡(luò)上的實踐經(jīng)驗,去聯(lián)合產(chǎn)業(yè)界更加聚焦地探索算力網(wǎng)絡(luò)發(fā)展之路。PS. 中國移動算力網(wǎng)絡(luò)大會將于4月28-29日在蘇州隆重召開,大家可以去看看中國移動的實踐、聽聽中國移動的思考。