水稻有4萬多個基因,如何破解其基因密碼,讓傳統(tǒng)育種方式轉型升級?浩瀚宇宙中的快速射電暴,持續(xù)時間僅有幾毫秒,如何借助數(shù)據(jù)挖掘揭開其起源的奧秘?……在浙江杭州的之江實驗室內(nèi),這些國家重大科研項目瞄準的“世紀難題”,正在被智能計算“數(shù)字反應堆”逐個破解。
之江實驗室是浙江競逐智能計算賽道、打造區(qū)域競爭優(yōu)勢的一個縮影。4月12日,記者隨“算力中國行”大型調(diào)研采訪團走進長三角中心城市杭州,看到一條獨具特色的智算“浙江路徑”已經(jīng)初露雛形。
浙江省經(jīng)濟和信息化廳相關負責人告訴記者:“智算產(chǎn)業(yè)已成為浙江省著力打造的標志性產(chǎn)業(yè),也是省里正在重點推進的‘415X’產(chǎn)業(yè)集群之一?!痹谶@個良渚文化的發(fā)源地,從網(wǎng)絡、芯片、操作系統(tǒng)到整機、應用的智算產(chǎn)業(yè)鏈上下游玩家正在匯集,形成協(xié)同發(fā)展的創(chuàng)新產(chǎn)業(yè)生態(tài)。
之江實驗室的“數(shù)字反應堆”
2022年3月,我國科研團隊基于“中國天眼”的觀測證據(jù),在快速射電暴起源研究中取得重要成果。研究團隊夜以繼日地巡視著浩瀚宇宙,每天產(chǎn)生的數(shù)據(jù)高達300TB,足以裝滿300臺個人電腦。
之江實驗室多模光纖顯微內(nèi)窺鏡展臺
以前,研究人員面對海量數(shù)據(jù)就像“大海撈針”。如今,基于異構資源計算運行的之江實驗室“數(shù)字反應堆”展開智能計算,讓深度挖掘快速射電暴數(shù)據(jù)成為可能。不止在天文領域,新材料、生物醫(yī)藥等越來越多的領域,都離不開智能算力的支撐。
“調(diào)研發(fā)現(xiàn),我國算力的利用率還不足30%,尚未被充分利用開發(fā)。其中一個重要原因,是算力資源尚不能針對性解決行業(yè)研究領域的問題,且算力資源分散分布,集中調(diào)用起來十分困難?!敝瓕嶒炇抑魅巍⒅悄苡嬎銛?shù)字反應堆總設計師,浙江大學黨委副書記朱世強告訴《中國電子報》記者。
基于這一考慮,之江實驗室聯(lián)合10余家頂級創(chuàng)新機構,于2021年10月正式啟動了智能計算“數(shù)字反應堆”這一重大科學裝置,以算力為“燃料”,在“數(shù)字反應堆”引擎推動下,讓異構算力資源聚合和調(diào)度成為可能,為不同垂直行業(yè)帶來“裂變”。
為提供充足的算力,之江實驗室落成了目前國內(nèi)同類科研機構中規(guī)模最大、等級最高的算力中心之一?!皵?shù)字反應堆”聚合起智能超算、智算集群,類腦計算機、圖計算機等算力資源,協(xié)同整合算力可達10EFlops(每秒1000京次浮點運算次數(shù))。
“數(shù)字反應堆”已經(jīng)開枝散葉,滿足了育種、制藥、材料、基因等多個垂直行業(yè)創(chuàng)新研發(fā)的核心需求。以材料科技領域為例,傳統(tǒng)研發(fā)模式是把不同元素原料混起來,一點點調(diào)整,反復試錯。在數(shù)字反應堆打造的新平臺上,從篩選到建模再到設計驗證都有人工智能為其助力。
智能計算何以擔此大任?之江實驗室智能計算數(shù)字反應堆總架構師潘愛民告訴《中國電子報》記者,智能計算不是超級計算、云計算的替代品,也不是現(xiàn)有計算的簡單集成品,而是根據(jù)任務所需,以最佳方式和最恰當?shù)挠嬎惴椒?,解決實際問題的一種計算形態(tài)。
潘愛民透露,之江實驗室建設“數(shù)字反應堆”還有更深層的原因。一方面在于降低項目中復雜任務的計算門檻。以不同技術實現(xiàn)的計算資源,往往具有不同的系統(tǒng)架構或指令集,用戶有時還必須專門編寫程序。有了該系統(tǒng)的統(tǒng)籌協(xié)調(diào),用戶不必再為重復開發(fā)、軟硬件不兼容等撓頭。數(shù)字反應堆還可為科研人員提供“零代碼一鍵部署”服務,幫助他們以最少的手動編碼開發(fā)出功能強大的應用。
另一方面是服務于我國算力產(chǎn)業(yè)的發(fā)展特點。不同于ChatGPT背后有強大產(chǎn)業(yè)鏈的支撐,我國在大模型、數(shù)據(jù)和智算芯片等環(huán)節(jié)還沒那么完善。在這樣的現(xiàn)實情況下,提供這樣一套兼容不同型號產(chǎn)品、不同體系架構的算力基礎設施就顯得愈發(fā)重要。
浙江智算產(chǎn)業(yè)呈“鏈式”發(fā)展態(tài)勢
每個地區(qū)都有自己的競爭優(yōu)勢。在浙江,智能計算就是區(qū)域競爭的關鍵變量之一。
根據(jù)國家信息中心發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》,“十四五”期間,在智算中心實現(xiàn)80%應用水平的情況下,城市對智算中心的投資,可帶動人工智能核心產(chǎn)業(yè)增長約2.9-3.4倍、帶動相關產(chǎn)業(yè)增長約36-42倍。
杭鋼云計算數(shù)據(jù)中心智慧化應用
華為公司前期調(diào)研發(fā)現(xiàn),浙江省AI算力需求旺盛,有超過80%的企業(yè)、科研單位迫切需要外部專業(yè)力量在智能應用算力部署、性能調(diào)優(yōu)、算法調(diào)優(yōu)和數(shù)據(jù)標注予以支持,本地智能化算力服務供給還不充足。
浙江省經(jīng)濟和信息化廳相關負責人告訴記者,近年來,浙江省著力提升高性能算力占比,提升算力算效水平。推進數(shù)據(jù)中心算力供應多元化,支撐各類智能應用。截至今年2月底,浙江省已建數(shù)據(jù)中心150多個,在杭州、嘉興、湖州、金華、溫州等地皆有布局。到“十四五”末期,浙江省算力規(guī)模將達到23.66EFlops(每秒2366京次浮點運算次數(shù))。
從網(wǎng)絡、芯片、操作系統(tǒng)到整機再到應用,浙江省正在聚合整條產(chǎn)業(yè)鏈上下游的玩家,成為我國智算產(chǎn)業(yè)“版圖”上舉足輕重的一部分。
經(jīng)過幾年的積累,中國(杭州)算力小鎮(zhèn)、杭州智能計算示范中心、中國(浙江)智能計算產(chǎn)業(yè)創(chuàng)新園等一批重要算力設施園區(qū)平臺載體相繼揭牌、投運;寧波人工智能超算中心、阿里仁和液冷數(shù)據(jù)中心智算資源(部分投產(chǎn),總規(guī)劃250P)等一批先進算力設施建設如火如荼……浙江已經(jīng)形成電信運營商、互聯(lián)網(wǎng)企業(yè)、金融公司、大型生產(chǎn)企業(yè)及政府事業(yè)單位、研究院所、國有企業(yè)“攜手并進”的發(fā)展態(tài)勢,同時帶動全省智能算力基礎設施產(chǎn)業(yè)生態(tài)不斷“外溢”。
近日,浙江移動的算力網(wǎng)絡與杭州人工智能計算中心實現(xiàn)AI算力并網(wǎng),完成了杭州智團信息技術有限公司的宮頸細胞學病理AI模型訓練任務的調(diào)度。并網(wǎng)成功后,推理時間從之前的2分鐘降低到1.2秒,模型訓練時間從168小時降低到120小時。杭州聯(lián)匯科技、杭州它人機器人等企業(yè)也正在使用杭州人工智能計算中心的AI服務,進行流程的對接及模型的調(diào)試優(yōu)化。
浙江省經(jīng)信廳相關負責人告訴記者,未來浙江省將推動一批低算力的數(shù)據(jù)中心向智算中心轉型升級,推動CPU、GPU 等異構算力部署,提高數(shù)據(jù)中心算力算效水平和供應能力,為各類應用提供高質(zhì)量的AI算力服務,豐富算力應用場景,形成多層次算力設施體系。
據(jù)了解,目前我國的智算中心采用了高標準建設,100P算力是起步目標,該算力大約相當于5萬臺高性能電腦。這也意味著,智算中心建設對軟硬件的要求更高。
華為公司依托杭州人工智能計算中心,將鯤鵬/昇騰生態(tài)等根技術交付給本地產(chǎn)業(yè)伙伴,打造差異化產(chǎn)品面對細分市場,讓自研產(chǎn)品向全國延展;面對未來大量的異構算力需求,新華三為行業(yè)打造了智算中心解決方案,利用“一芯多云”構建智算中心基礎環(huán)境,覆蓋了自動駕駛、智能駕倉、小分子研發(fā)、蛋白預測、智能客服等細分行業(yè)場景。
“下一步的重點工作之一,是要推動算網(wǎng)產(chǎn)業(yè)生態(tài)繁榮。強化‘鏈式思維’,形成龍頭企業(yè)帶動、大中小企業(yè)協(xié)作、打造安全穩(wěn)定、自主可控、開放共贏的算網(wǎng)產(chǎn)業(yè)繁榮新生態(tài)?!闭憬〗?jīng)信廳相關負責人說。
東西部地區(qū)應加強場景挖掘和合作研究
走進阿里云仁和數(shù)據(jù)中心的液冷機房,耳邊沒有空調(diào)運行的“嗡嗡”聲,一座座臥式機柜整齊排列,一排排服務器靜靜躺在絕緣冷卻液里。這里是全國規(guī)模最大的單相浸沒液冷集群,全程用于散熱的能耗幾乎為零,實現(xiàn)了數(shù)據(jù)中心100%無機械制冷,數(shù)據(jù)中心PUE(電能利用效率)可低至1.09。
“數(shù)據(jù)中心應用液冷技術是大勢所趨?!卑⒗镌苹A設施IDC研發(fā)事業(yè)部總經(jīng)理王朝陽告訴記者,我國數(shù)據(jù)中心年用電量約占全社會用電的2%,隨著算力爆發(fā)式增長,所需的服務器數(shù)量也會相應增加,這就要求業(yè)界采用更高效節(jié)能的散熱技術。
“相較于容易受到溫濕度、灰塵影響的傳統(tǒng)風冷散熱,浸沒式液冷散熱不僅故障率低、不受氣候和地域閑置,尤其適合部署在極寒或溫濕度較高的南方?!睋?jù)王朝陽介紹,浸沒式液冷數(shù)據(jù)中心還有另一大優(yōu)勢,即單機柜可部署功率密度15—100kW,這意味著相同電力容量,液冷數(shù)據(jù)中心可以多部署約50%的服務器,這也能更好地適應AI訓練等大算力業(yè)務場景。
為迎接智能計算時代的到來、提升算效,除了數(shù)據(jù)中心要實現(xiàn)技術創(chuàng)新,綜合提升規(guī)模、算力、智能化外,還要在算力跨域調(diào)度、樞紐集群互聯(lián)模式、算力與需求高效匹配等方面進行優(yōu)化。
“目前來看,現(xiàn)有算力樞紐集群間多采用點對點的直連網(wǎng)絡模式,網(wǎng)絡相對封閉,資源利用率低、建設投資大、普惠程度低,不利于算力產(chǎn)業(yè)規(guī)?;l(fā)展?!庇粑娘w建議,基于國家新型互聯(lián)網(wǎng)交換中心的扁平化架構,依托區(qū)域內(nèi)匯聚、樞紐內(nèi)協(xié)同和樞紐間貫通,開放化共享算力調(diào)度專網(wǎng),探索跨行業(yè)、跨部門、跨系統(tǒng)聯(lián)動的算力調(diào)度場景應用。強化算力資源高效供給。
智能算力時代,算力與需求和應用要高效匹配。在浙江電信云網(wǎng)發(fā)展部副總經(jīng)理曹懿軍看來,當前算力產(chǎn)業(yè)跨域調(diào)度的需求場景不夠明確,盈利模式尚未明確,不少企業(yè)僅僅停留在基礎設施建設階段。應當針對綜合性、復雜性的工程項目,要鼓勵聯(lián)營等創(chuàng)新組織模式;鼓勵采用“算力券”等創(chuàng)新業(yè)務模式,探索以此為核心的算力中心運營成本統(tǒng)籌結算分擔機制。他認為,東西部政府應加強場景挖掘和合作研究,共同鼓勵“東數(shù)西算”“東數(shù)西存”“東數(shù)西渲”等重點場景規(guī)?;趸?/p>
“存儲設施是數(shù)據(jù)永久性的‘家’,存儲設備及成套系統(tǒng)是支撐新型數(shù)據(jù)基礎設施存儲能力建設的直接影響因素?!拔覈跀?shù)據(jù)基礎設施布局方面,存在‘重計算、輕存儲’的問題,根據(jù)不完全統(tǒng)計,目前我國存算比例為1:3.3,但歐美發(fā)達國家這一比例為1:1.5?!焙贾莺晟伎萍脊煞萦邢薰究?a class="article-link" target="_blank" href="/tag/%E5%B7%A5%E7%A8%8B%E5%B8%88/">工程師單東來表示,建議出臺相關扶持政策加快存儲上下游產(chǎn)業(yè)鏈的全面發(fā)展,除了核心的存儲器、存儲芯片等,還應更多關注存儲系統(tǒng)集成等產(chǎn)業(yè)中下游緩解,進而有效提升新型數(shù)據(jù)基礎設施的存儲能力。
作者丨齊旭
編輯丨劉晶
美編丨馬利亞
監(jiān)制丨趙晨