當前國內算力發(fā)展面臨的主要問題是什么?從國家層面來看,主要是下面五個問題:
第一,算力結構問題:通算資源占比過大,利用率低;智算占比過小,難以有效支撐未來人工智能技術的深入應用;超算資源充裕,但產業(yè)化程度不高;量子計算技術仍不成熟。
第二,算力調度問題:大量算力囤積在各方手里,難以高效利用。受限于技術不完備、協(xié)調機制不健全等原因,已有算力調度平臺可調度的算力規(guī)模、種類和應用場景仍需豐富。
第三,傳輸網絡問題:由于國內算力分布具有顯著的區(qū)域性,而當前跨區(qū)域、多層次算力高速直連網絡尚未完全建立,一定程度上阻礙了西部有效承接東部算力需求。
第四,算力能耗問題:算力盡頭是電力,要真正實現(xiàn)算力的高質量發(fā)展,必須要找到一條綠色之道。
第五,數(shù)據(jù)安全問題:統(tǒng)一集約化的數(shù)據(jù)中心安全防范體系尚未完全建立,一體化安全保障服務能力仍需加強。
這些問題該怎么解決?國家發(fā)展改革委、國家數(shù)據(jù)局、中央網信辦、工業(yè)和信息化部、國家能源局聯(lián)合發(fā)布了《關于深入實施“東數(shù)西算”工程加快構建全國一體化算力網的實施意見》,深入指導了下階段全國一體化算力網的建設思路和要求。而《意見》要發(fā)揮作用、解決問題,終究還是要有人落地執(zhí)行的。在這方面,中國移動作為推動數(shù)字社會建設的國家隊,開創(chuàng)性提出打造像水電一樣、“一點接入、即取即用、按需調度”的算力網絡,主動站到產業(yè)發(fā)展的高度進行了全面規(guī)劃。
從中國移動近期的部署中,我們可以洞察到其站在國家層面助力解決上述五大算力問題的具體落地方案。
針對算力結構問題——
第一,中國移動加大智算資源建設。目前已構建了全棧自主可控、行業(yè)領先的智算中心架構,形成了“N+X”智算資源布局體系。據(jù)了解,中國移動已明確提出2024年的智算部署目標為17EFLOPS,而今年算力計劃資本開支475億元,同比增長21.5%,其中大部分用于智算中心建設。日前,中國移動發(fā)布了《2024—2025年新型智算中心采購招標公告》,招標公告顯示,本次項目采購總規(guī)模達到8054臺,采購規(guī)?;驅⒊?50億元,堪稱行業(yè)內規(guī)模最大的一次人工智能服務器集采,也足以見證中國移動發(fā)力智算基礎設施的決心。當前,中國移動在11個省同步啟動12個智算中心區(qū)域節(jié)點的建設,尤其是在呼和浩特正在建設超大規(guī)模單體智算中心,一張多層級、全覆蓋的智算能力網絡正在快速鋪開。此外,為了支持社會人工智能技術的深入應用,中國移動還基于智算中心底層萬卡高性能算力資源,構建了從高性能算力到AI訓練推理平臺到模型服務的全棧智算產品體系,以支持大規(guī)模萬卡集群的訓練和推理一體化需求。
第二,中國移動加快算力并網以提升社會算力利用率。通算過剩、超算產業(yè)化低,癥結點在于無法實現(xiàn)需求和資源的有效匹配。如何解決這個問題?中國移動提出了“算力并網”的方案,并攜手多個超算中心、智算中心,以及云服務商,共同發(fā)起全國規(guī)模最大的“百川”算力并網行動,打造算力類型最全、規(guī)模最大、覆蓋最廣的“百川”算力并網平臺。當前,“百川”算力并網平臺已接入社會算力近5EFLOPS,和自有算力形成優(yōu)勢互補,總共具備超10EFLOPS的算力供給能力。更關鍵的是,中國移動在并網的基礎上,實現(xiàn)了一張全國算網地圖,同時感知接入通算、智算、超算和量子四類算力,以一個統(tǒng)一運營入口“算龍頭”,將并網后的算力,融合移動云自有能力和產品,統(tǒng)一對外提供任務式服務,助推算力成為普惠級社會服務。
針對算力調度問題——為了解決算力調度問題,2023年移動云發(fā)布業(yè)內首個算網大腦,算網大腦定位為整個算力網絡體系的“智能中樞”,旨在實現(xiàn)多樣算力可泛在部署、極致網絡可智能調度、算網資源可全局優(yōu)化、算網能力可一體供給,可以說,算網大腦是中國移動算力網絡中最硬核的存在。據(jù)了解,當前算網大腦已在具體算網場景中應用,支持東數(shù)西算、智算超算、數(shù)據(jù)快遞等100多種算網業(yè)務,實現(xiàn)日均調度東西部資源上千萬次。從當前的能力上看,中國移動算網大腦已經實現(xiàn)算網融合類業(yè)務的支撐和一體化算網全領域資源拉通(算網大腦2.0),后續(xù)將繼續(xù)推進算網感知融合統(tǒng)一,進一步提升算網大腦的智能化水平,向“算網智腦”升級(算網大腦3.0)。
針對傳輸網絡問題——日前,中國移動宣布其自主研發(fā)的400G全光省際骨干網正式商用。據(jù)了解,400G全光省際骨干網是長距離光信號傳輸網絡設備,能連接邊緣、中心和樞紐集群算力,是算力網絡的連接中樞。相比上一代干線網絡,其傳輸帶寬提升4倍、單比特能耗降低65%。400G全光省際骨干網將支撐算力、數(shù)據(jù)等生產要素實現(xiàn)創(chuàng)新性跨地域優(yōu)化配置,支撐“東數(shù)西算”“東數(shù)西存”等新型應用落地,推動產業(yè)深度轉型升級,語音識別、智慧工廠、自動駕駛等領域的智能應用將向更加高效、便捷方向邁進。此外,結合國家“東數(shù)西算”工程要求及自身算力網絡業(yè)務發(fā)展需求,中國移動還打造了全球規(guī)模最大的SRv6 Policy骨干網——云專網,覆蓋全國31省、300+地市,省際帶寬接近50Tbps,向客戶提供更加全面、高效、靈活、智能的服務。
針對算力能耗問題——AI的盡頭是光伏和儲能,這已經是業(yè)內的共識!以英偉達最新GPU單張能耗1000瓦,單個數(shù)據(jù)中心最起碼是萬卡規(guī)模,其中的能耗可想而知。黃仁勛發(fā)出預警,不能單單考慮計算機,現(xiàn)在也需要考慮地球現(xiàn)有能源是否能支撐。對此,中國移動一直在積極推進綠色算力發(fā)展,在數(shù)據(jù)中心規(guī)劃、設計、選型、建設到運營管理的全生命周期內,都積極引進綠色低碳技術和產品。例如,在數(shù)據(jù)中心的建設過程中,采用智能節(jié)能方案,降低數(shù)據(jù)中心的PUE。同時積極探索可再生能源在數(shù)據(jù)中心的應用,減少對傳統(tǒng)能源的依賴,降低碳排放。
針對數(shù)據(jù)安全問題——此前,中國移動發(fā)布了《算力網絡安全白皮書》,提出了“一體化全程可信”安全理念,并在國內外多個標準組織立項算力網絡安全總體要求、算力網絡數(shù)據(jù)安全等關鍵標準11項,形成了較為完善的算力網絡安全標準體系。這些標準的制定和完善,為算力網絡的數(shù)據(jù)安全提供了有力的保障。當前,中國移動算力網絡安全防護體系已為8大行業(yè)近千家政企客戶提供了超千次的安全服務。這些服務包括但不限于數(shù)據(jù)安全保障、網絡安全監(jiān)測、威脅情報分析等,為客戶提供全方位的安全保障。
算力即權力。掌握和控制算力,就意味著在某種程度上掌握了對信息處理和決策制定的能力,進而擁有了影響社會和經濟運行的權力。當前世界各國正在積極推進算力的建設和運營,尤其是中美之間圍繞算力正在開展新一輪的角力。
在這樣的大背景下,中國移動大力推進算力網絡建設,目標我認為很明確,就是要成為國家級算力網,成為未來社會算力流通的大動脈,以更智能、更集約、更普惠的算力服務推動各行業(yè)的數(shù)字化轉型和智能化升級,提升業(yè)務效率和創(chuàng)新能力,從而推動數(shù)字經濟的發(fā)展。這就是我理解的中國移動的算網雄心。