2023年即將落下帷幕,回眸2023年,ICT產業(yè)穩(wěn)步發(fā)展,運營商與產業(yè)鏈上下游企業(yè)攜手并進,5G行業(yè)應用遍地開花、算力網絡走向縱深、大模型百花齊放、技術創(chuàng)新加速ICT發(fā)展、創(chuàng)新企業(yè)引領產業(yè)未來。
自12月4日起,通信世界全媒體將以“蝶變·日新”為主題,全面推出2023年度盤點系列報道,從“大咖請回答”“年終產業(yè)回眸”“跨越2023”三大板塊梳理2023年產業(yè)發(fā)展脈絡,盤點產業(yè)發(fā)展最新成果,以專業(yè)行業(yè)媒體視角帶領大家回顧ICT產業(yè)的2023。今日的“大咖請回答”板塊,我們特邀中國電信股份有限公司研究院副院長陳運清暢談2023年算力行業(yè)發(fā)展。
陳運清:中國電信股份有限公司 研究院副院長
毋庸置疑,2023是算力發(fā)展全面發(fā)力的一年。當前,算力已經成為推動數(shù)字經濟發(fā)展的重要力量,成為戰(zhàn)略發(fā)展支柱產業(yè)之一。同時,隨著人工智能、大模型等新興產業(yè)的全面爆發(fā),對于算力的需求也在倍數(shù)增加,算力領域也隨之衍生出更多發(fā)展方向,產業(yè)進一步走深向實。
回顧2023年,算力網絡產業(yè)發(fā)生了哪些重要事件?對行業(yè)發(fā)展有何影響?在大模型全面爆發(fā)的元年,算力網絡又面臨了哪些挑戰(zhàn)?對此,通信世界全媒體記者采訪了中國電信股份有限公司研究院副院長陳運清,聆聽他對2023年算力行業(yè)應用發(fā)展的真知灼見。
澎湃的2023:算力發(fā)展迎來兩大重要趨勢
今年6月,工業(yè)和信息化部、中央網信辦、教育部、國家衛(wèi)生健康委、中國人民銀行、國務院國資委等六部門聯(lián)合印發(fā)《算力基礎設施高質量發(fā)展行動計劃》,提出到2025年,我國算力規(guī)模超過300EFLOPS,智能算力占比達到35%;存儲總量超過1800EB,先進存儲容量占比達到30%以上;圍繞工業(yè)、金融、醫(yī)療、交通、能源、教育等重點領域,各打造30個以上應用標桿。《行動計劃》的發(fā)布為我國近幾年的算力發(fā)展指明了前進的道路,穩(wěn)定了發(fā)展的“軍心”。
在陳運清看來,2023年的算力發(fā)展共有兩大重要趨勢:一是全球算力規(guī)模的進一步高速增長,算力作為數(shù)字信息基礎設施核心資源的作用日益凸顯;二是AI大模型的出現(xiàn)和不斷發(fā)展,促使智算需求持續(xù)提升。
截至2023年8月,我國算力總規(guī)模達到197EFLOPS,位居全球第二;其中智能算力規(guī)模同比增長45%,占整體算力規(guī)模比例提高至25.4%。“這些數(shù)字代表的趨勢表明,智能算力正成為支撐數(shù)字經濟發(fā)展的新引擎?!标愡\清告訴記者。
2023年,隨著ChatGPT的大火,大模型席卷了整個ICT產業(yè),我國也呈現(xiàn)出“百模大戰(zhàn)”的產業(yè)趨勢。值得注意的是,隨著大模型極速發(fā)展,同時也引爆算力缺口,使得智算規(guī)模高速增長。2023年,我國新增算力基礎設施中智能算力占比過半,智算中心正在支撐人工智能產業(yè)的快速發(fā)展,成為人工智能產業(yè)及經濟增長“新動能”。預計到2025年,智算中心將支撐人工智能產業(yè)規(guī)模發(fā)展達到4000億,帶動5萬億產業(yè)目標;預計到2030 年達到1萬億,帶動10萬億元產業(yè)目標。此外,全球AI增速遠超數(shù)字化轉型及GDP,其中中國的智能算力CAGR就達到52.3%,預計2026年將達到1271.4EFlops。
把握機遇的當下:算網一體將成為最終融合形態(tài)
盡管當下,ICT產業(yè)正是穩(wěn)步發(fā)展,運營商與產業(yè)鏈上下游企業(yè)攜手并進,技術創(chuàng)新加速ICT發(fā)展。但不得不忽視的是,算力、大模型全面爆發(fā),大模型技術更新迭代加速,產業(yè)需求爆發(fā)等多方面挑戰(zhàn)。陳運清指出,在當前的趨勢下,算力網絡的長期演進需要面對四大方面的需求:
一是要滿足泛在普惠的業(yè)務需求,即要面對千萬級的2C2B2H用戶及百萬級的訓推數(shù)據流并發(fā);二是要能使算力網絡提供應用級的保障。需要算力網絡具備算力需求和網絡能力實時感知的能力并能夠在數(shù)據流抵達算力節(jié)點過程中持續(xù)保障差異化和高吞吐能力;三是要求算力網絡能夠提供租戶級的網絡資源彈性供給能力和大規(guī)模定制化靈活調整的能力;四是要求算力網絡具備網絡數(shù)據和網絡能力的開放接口的靈活調用能力。“對電信運營商而言,這四方面的需求需要依據現(xiàn)有網絡和云網運營系統(tǒng)的疊加補充后不斷優(yōu)化、完善后才能逐步加以構建,是一個復雜的需要分階段實施的系統(tǒng)工程?!标愡\清補充道。
面向未來,數(shù)字信息基礎設施中的AI智算和網絡兩大核心要素,勢必需要相互促進,才能得以整體均衡發(fā)展。在談及未來數(shù)十年的產業(yè)發(fā)展趨勢,陳運清著重提到了兩方面。首先,隨著AI算力得以大幅度的提升,支持算力架構從CPU演進為CPU+GPU+NPU/DPU的融合異構算力架構,云邊端的算力協(xié)同則變?yōu)榱藙傂???梢灶A見,今后會有70%的數(shù)據會在邊緣產生和處理,而且隨著各類終端的算力處理能力的加強,端側算力會上移,云則會向分布式算力布局的方向發(fā)展,即云側算力下沉,為此越來越需要云邊端算力的三體協(xié)同。
其次,業(yè)務形態(tài)變化會推動作為數(shù)字信息基礎設施主體的網絡部分的持續(xù)演進,即逐步將網絡與海量的數(shù)據相結合,并由此向意圖驅動的智能服務網絡演進。所以,未來網絡的目標是成為具備確定性體驗和通信感知融合能力的立體超寬的智能化網絡,從而使得網絡成為新型數(shù)字信息基礎設施的基礎底座。綜上兩個行業(yè)發(fā)展趨勢而言,AI智算和智能化網絡逐步實現(xiàn)深度融合,最終走向算網一體。
全面迸發(fā)的未來:智算或將站上算力發(fā)展“主舞臺”
AI大模型不斷發(fā)展,使得智算需求持續(xù)攀升。據悉,GPT-3的token數(shù)為3000億,參數(shù)規(guī)模為1750億;折合算力當量3646Pflops-days,需上萬張英偉達A100卡(單節(jié)點1000P智算中心訓練約3.6天)。而GPT4的token數(shù)為13萬億,參數(shù)規(guī)模1.8萬億折合算力當量249Eflops-days,約2.5萬張英偉達A100卡(單節(jié)點1000P智算中心訓練約249天)??梢钥吹?,從GPT-3到GPT-4,token數(shù)增長約43倍,參數(shù)規(guī)模增長約10倍,算力需求增長則為約70倍。這意味著為滿足大模型帶來的智算需求的快速增長,新型智算中心至少需要萬卡GPU的以上的水平。在陳運清看來,數(shù)據中心內如何高效率的把這些萬卡級GPU有效互聯(lián),構建無損的數(shù)據中心內組網(DCN)就成為一個首先要攻克的方向或領域。同時,算力網絡還需要把計算任務有效送達到相應的算力節(jié)點,這期間包含了算網調度、算力感知、存算一體、算力路由和算力切片等細分技術方向?!八懔W絡并非一夜之間憑空產生的。算力網絡的構建需要充分借鑒已有云計算的發(fā)展路徑和已有基礎承載網絡的發(fā)展。算力路由系統(tǒng)也需要與已有的一體化云網運營系統(tǒng)和SRv6路由承載協(xié)議充分結合。從兩個大的融合維度上看,算力網絡包含了以網強算和以網促算兩個維度。以網強算的抓手是構建AI智能數(shù)據中心網絡?!标愡\清解釋道。借助于此,實現(xiàn)AI智算中心內異構算力的統(tǒng)一承載,同時做到網絡與計算間的解耦,從而使能AI智算網絡開放架構。“以網促算的目標是打造超寬、高彈性、高吞吐的智算廣域網絡,通過匹配400GE低時延智算IP網絡,實現(xiàn)多云、多算力的靈活連接和并完成算力調度的任務。對應的IP承載網能夠提供租戶級按需彈性服務,使得性價比優(yōu)于數(shù)據快遞,伴隨著網絡吞吐量倍增帶來的數(shù)據傳輸效率的大幅度提升,以達到或接近于廣域無損的數(shù)據傳輸效果?!标愡\清最后說道。
作者:王禹蓉
責編/版式:蓋貝貝
審核:舒文瓊
監(jiān)制:劉啟誠