作者:豐寧
日前,國務(wù)院國資委召開的AI人工智能專題推進(jìn)會火爆全網(wǎng),受到了行業(yè)的廣泛關(guān)注。
會議要求,中央企業(yè)要主動擁抱人工智能帶來的深刻變革,把加快發(fā)展新一代人工智能擺在更加突出的位置。會議強調(diào)“要夯實發(fā)展基礎(chǔ)底座,把主要資源集中投入到最需要、最有優(yōu)勢的領(lǐng)域,加快建設(shè)一批智能算力中心”;“強化需求牽引,加快重點行業(yè)賦能,構(gòu)建一批產(chǎn)業(yè)多模態(tài)優(yōu)質(zhì)數(shù)據(jù)集,打造從基礎(chǔ)設(shè)施、算法工具、智能平臺到解決方案的大模型賦能產(chǎn)業(yè)生態(tài)”。會上有10家中央企業(yè)簽訂倡議書,表示將主動向社會開放人工智能應(yīng)用場景。作為國民經(jīng)濟(jì)的重要支柱,央企在人工智能領(lǐng)域的布局和發(fā)展更是備受關(guān)注。央企加速布局人工智能,將為相關(guān)行業(yè)帶來新的發(fā)展機遇,同時也體現(xiàn)了國家對于人工智能的高度重視和大勢所趨。
隨著全球AI技術(shù)的快速發(fā)展,智能算力已成為推動經(jīng)濟(jì)增長和社會進(jìn)步的關(guān)鍵要素。中國作為全球最大的經(jīng)濟(jì)體之一,正積極應(yīng)對這一技術(shù)變革,加強智能算力的研發(fā)和應(yīng)用,以提升國家競爭力。
在深入了解中國在智算市場的布局之前,先來了解一下什么是“智能算力”?我們?nèi)粘I钪卸加心男r候會接觸到智能算力?
何為智能算力?
按照《中國算力白皮書(2022年)》的定義,算力主要分為四部分:通用算力、智能算力、超算算力、邊緣算力。通用算力以CPU芯片輸出的計算能力為主;智能算力以GPU、FPGA、AI芯片等輸出的人工智能計算能力為主;超算算力以超級計算機輸出的計算能力為主;邊緣算力主要是以就近為用戶提供實時計算能力為主,是前三種的組合。
單從概念上看似乎覺得有一些遙遠(yuǎn),但實際上,智能算力已經(jīng)深入到了我們生活的方方面面。倘若說起春節(jié)檔電影中的特效、渲染和人臉識別,或者是我們?nèi)粘J褂玫闹悄芸头?、語音翻譯等應(yīng)用,這些背后都離不開智能算力的支持。
如果說人工智能是創(chuàng)新的加速器,那么智算中心則可以為各類技術(shù)創(chuàng)新提供支撐。
大模型引發(fā)算力缺口,中國需要多少智能算力?
2023年眾多大模型產(chǎn)品發(fā)布,基于大模型的AIGC技術(shù)在文本生成、知識回答、圖像生成、邏輯推理等方面表現(xiàn)出遠(yuǎn)超預(yù)期的效果,吸引了大量用戶與市場關(guān)注。
據(jù)不完全統(tǒng)計,截至2023年10月,中國大模型創(chuàng)新主體共254家,分布于20余個省市/地區(qū),其中,北京122家,數(shù)量居全國首位。截至2024年1月,備案上線大模型38款,占全國近一半。百度發(fā)布文心一言4.0,用戶規(guī)模過億,日均調(diào)用量達(dá)千萬次;智譜AI研發(fā)第四代基座大模型GLM4,開源版全球下載量超1000萬次,是目前開源影響力最高的國產(chǎn)大模型;百川智能發(fā)布實現(xiàn)全球最長上下文窗口的大模型Baichuan2,開源版僅四個月全球下載量超600萬次;中科院自動化所發(fā)布全球首個千億參數(shù)多模態(tài)大模型紫東太初2.0。在深度學(xué)習(xí)框架方面,百度飛槳知名度與使用率均處國內(nèi)第一梯隊,國內(nèi)市占率近36%,截至2023年12月底,已凝聚1070萬開發(fā)者,服務(wù)23.5萬家企事業(yè)單位。
在實際應(yīng)用中,利用AI技術(shù)自動生成內(nèi)容的生產(chǎn)方式打造的“數(shù)字人”效果媲美真人水平;人工智能預(yù)測蛋白質(zhì)結(jié)構(gòu)給基礎(chǔ)研究帶來全新的研究手段;人工智能驅(qū)動的聊天機器人能夠?qū)W習(xí)和理解人類的語言并與人類進(jìn)行對話;華為云開發(fā)的“盤古氣象大模型”在預(yù)報臺風(fēng)軌跡和登陸時間方面大顯身手……
看得見的AIGC蓬勃發(fā)展背后,是看不見的智能算力在支撐。大模型爆發(fā)掀起了新一輪AI熱潮,也改變了智能算力需求與格局。
工業(yè)和信息化部、中央網(wǎng)信辦、教育部、國家衛(wèi)生健康委、中國人民銀行、國務(wù)院國資委等六部門聯(lián)合印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》提出到2025年,中國算力規(guī)模超過300EFLOPS,智能算力占比達(dá)到35%。
說到這里可能會有人發(fā)問:FLOPS是什么?300EFLOPS是什么水平?
FLOPS是算力的單位,衡量算力資源每秒進(jìn)行浮點運算的次數(shù),是Floating-point operations per second的英文縮寫。它常被用來估算電腦的執(zhí)行效能,尤其是在使用到大量浮點運算的科學(xué)計算領(lǐng)域中,比如機器視覺相關(guān)圖像處理的訓(xùn)練與推理。
FLOPS前面加上字母表示更大的算力單位:
一個MFLOPS(megaFLOPS)等于每秒一百萬(=10^6)次的浮點運算。
一個GFLOPS(gigaFLOPS)等于每秒十億(=10^9)次的浮點運算。
一個TFLOPS(teraFLOPS)等于每秒一萬億(=10^12)次的浮點運算。
一個PFLOPS(petaFLOPS)等于每秒一千萬億(=10^15)次的浮點運算。
一個EFLOPS(exaFLOPS)等于每秒一百億億(=10^18)次的浮點運算。
下面舉幾個例子方便了解:通過大量數(shù)據(jù)樣本進(jìn)行人工智能模型訓(xùn)練時,根據(jù)數(shù)據(jù)規(guī)模、檢測效果、模型類別的不同,訓(xùn)練一次的算力需求大概為2-19PFLOS不等;在人臉、語言識別的推理過程中,根據(jù)識別精度、并發(fā)數(shù)量等的不同,對算力的需求跨度可能從10GFLOPS-64TFLOPS,智能駕駛為完成環(huán)境感知、決策避障、自車定位等功能時的算力需求大概為8TFLOPS。
截至2023年6月底,全國在用數(shù)據(jù)中心機架總規(guī)模超過760萬標(biāo)準(zhǔn)機架,算力總規(guī)模達(dá)到197EFLOPS,位居全球第二。
在大模型需求驅(qū)動下,智算中心項目如雨后春筍般涌現(xiàn)。
30余座城市搶建智算中心
隨著下游算力需求的集中爆發(fā)和“東數(shù)西算”的推進(jìn),各級政府、運營商、互聯(lián)網(wǎng)企業(yè)紛紛開啟智算中心建設(shè)計劃。據(jù)國家信息中心與相關(guān)部門聯(lián)合發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》顯示,目前全國正在建設(shè)或提出建設(shè)智算中心的城市已經(jīng)超過30個,經(jīng)典案例包括京津冀大數(shù)據(jù)智算中心、長沙5A級智能計算中心等。
智算中心建設(shè)的企業(yè)主體則包括三大電信運營商和部分互聯(lián)網(wǎng)企業(yè)。運營商推動建設(shè)的智算中心具有一定公共服務(wù)屬性,成為政府主導(dǎo)的算力基礎(chǔ)設(shè)施建設(shè)的良好補充。以百度、阿里、騰訊為代表的互聯(lián)網(wǎng)企業(yè)也紛紛建設(shè)智算中心,以推動自身業(yè)務(wù)發(fā)展、更好地推動客戶人工智能場景落地。
前瞻結(jié)合至頂智庫統(tǒng)計,截至2023年8月,中國已投入運營和在建的智算中心分布在北京、上海、南京、杭州等多個城市。從區(qū)域分布來看,中國智算中心集中于東部地區(qū)和中部地區(qū)。其中,東部地區(qū)智算中心數(shù)量達(dá)25個,占比62.5%,排名第一,以京津冀和長三角地區(qū)為主;中部地區(qū)占比17.5%,排名第二;西部和東北地區(qū)的智算中心數(shù)量占比分別為12.5%和7.5%。
值得注意的是,北京是發(fā)力智算中心的主要地區(qū)之一。北京在海淀、朝陽、經(jīng)開區(qū)、石景山、門頭溝、大興、豐臺等區(qū)均布局智算中心,目前已建成智能算力總規(guī)模約5000P。
近日,石景山區(qū)北重科技文化產(chǎn)業(yè)園的四跨廠房已開啟火熱的改造施工,建成后初期將具備610P的算力,相當(dāng)于30萬臺高性能電腦的計算能力,可供一個人工智能大模型在30秒內(nèi)完成對近1000萬張圖片的學(xué)習(xí)和識別,預(yù)計今年10月即可建成投用。
剛剛開年就動作頻頻
新年伊始,各大運營商便積極行動起來,紛紛加強在智能計算中心領(lǐng)域的布局。
1月8日,中國移動智算中心(武漢)在武漢未來科技城開放運營,已建成1500PFLOPS服務(wù)能力,到今年底計劃擴容至6800PFLOPS,成為華中地區(qū)規(guī)模最大的智算中心。
1月22日,上海電信在上海點亮“大規(guī)模算力集群暨人工智能公共算力服務(wù)平臺”,計劃2024上半年在上海規(guī)劃建設(shè)到達(dá)15000卡,總算力超4500P,其中單池新建國產(chǎn)算力達(dá)萬卡,預(yù)計成為國內(nèi)首個超大規(guī)模國產(chǎn)算力液冷集群。
1月30日,中國聯(lián)通人工智能創(chuàng)新中心成立儀式在京舉行。值得注意的是,2023年11月24日中國聯(lián)通長三角(蕪湖)智算中心項目才正式開工。
可以看到電信、移動、聯(lián)通三大電信運營商正在聚力“東數(shù)西算”數(shù)據(jù)中心集群建設(shè),全力推進(jìn)各自相關(guān)項目,加快打造全國算力中心城市和智算中心,促進(jìn)數(shù)字經(jīng)濟(jì)與實體經(jīng)濟(jì)深度融合。
AI服務(wù)器是智算中心建設(shè)中最關(guān)鍵的設(shè)備
AI服務(wù)器是智算中心建設(shè)中投入比重最大、最為關(guān)鍵的設(shè)備。
據(jù)市場研究機構(gòu)IDC的最新報告顯示,從2022上半年到2023年上半年,中國AI服務(wù)器市場規(guī)模成長了54%,其中GPU服務(wù)器依然是主導(dǎo)地位,占據(jù)92%的市場份額,達(dá)到30億美元。同時NPU、ASIC 和 FPGA等非GPU加速服務(wù)器以同比17%的增速占有了8%的市場份額,達(dá)到2億美元。
2023年上半年,從廠商銷售額角度看,浪潮、新華三、寧暢位居前三,占據(jù)了70%以上的市場份額;從服務(wù)器出貨臺數(shù)角度看,浪潮、坤前、寧暢位居前三名,占有近60%的市場份額。
AI服務(wù)器依賴高性能芯片供給。中國市場面臨的算力缺口給國內(nèi)的芯片發(fā)展帶來新的機遇。中國本土的AI芯片廠商發(fā)展正處于快速增長的階段并取得了顯著的成就,吸引了大量的投資和關(guān)注。這些企業(yè)在AI芯片設(shè)計、算法優(yōu)化、生產(chǎn)制造等方面具備了一定的實力和競爭優(yōu)勢。此外,中國政府的政策支持也起到了重要的推動作用。2023年上半年,中國加速芯片的市場規(guī)模超過50萬張。從技術(shù)角度看,GPU卡占有90%的市場份額;從品牌角度看,中國本土AI芯片品牌出貨超過5萬張,占比整個市場10%左右的份額。
從國產(chǎn)AI服務(wù)器所需的AI加速芯片的供應(yīng)商來看,目前國內(nèi)阿里巴巴(含光系列)、百度(昆侖系列)、華為(昇騰系列)等云服務(wù)提供商都有自研的云端AI加速芯片。還有寒武紀(jì)(思元系列)、海光信息(深算系列)、燧原科技、天數(shù)智芯、壁仞科技、摩爾線程、沐曦等。此外,景嘉微、龍芯中科等也在研發(fā)云端AI加速芯片。
從2023年上半年的數(shù)據(jù)來看,中國AI服務(wù)器芯片國產(chǎn)化率較去年出現(xiàn)了下降,比例從去年的15%左右下降到10%左右。這主要是因為高端訓(xùn)練服務(wù)器的需求大幅增長,而國產(chǎn)芯片性能難以跟上。
為了進(jìn)一步提升國產(chǎn)AI服務(wù)器的性能,不僅需要芯片廠商在技術(shù)上持續(xù)創(chuàng)新,提高芯片的性能和穩(wěn)定性,還需要這些芯片廠商深入了解市場需求,開發(fā)出更符合實際應(yīng)用場景的芯片產(chǎn)品。同時,政府、企業(yè)和研究機構(gòu)也應(yīng)加大投入,支持國產(chǎn)芯片產(chǎn)業(yè)的發(fā)展,為其提供更多的研發(fā)資源和市場機會。
如何讓智算中心真正用起來?
智算中心建成后,如何令其在運營過程中發(fā)揮更大的作用,依舊是一個非常關(guān)鍵的問題。
當(dāng)下智算中心已逐漸賦能區(qū)域產(chǎn)業(yè)集群發(fā)展,但值得注意的是,其在多元算力融合、上下游協(xié)同、建設(shè)應(yīng)用聯(lián)動、能源消耗、使用價格等方面仍面臨諸多挑戰(zhàn)。
比如:通用算力和專用算力還有待融合。在自動駕駛、智慧醫(yī)療、智慧城市等不同場景中,算力需求不同。單一化算力方案難以滿足多元算力需求,不能兼顧多產(chǎn)業(yè)和多領(lǐng)域。
算力、算法和數(shù)據(jù)協(xié)同不足。這些年來建設(shè)的智算中心,不同的芯片平臺、算法模型、數(shù)據(jù)庫、應(yīng)用層面部分處于垂直一體化“孤島”狀態(tài),軟硬件兼容性問題有待改進(jìn)。
投資建設(shè)運營有待聯(lián)動。智算中心投資、建設(shè)和運營往往由不同主體負(fù)責(zé)。前期建設(shè)單位往往對建設(shè)后運營的模式、服務(wù)標(biāo)準(zhǔn)投入不足,出現(xiàn)了管頭不管尾、建設(shè)運營割裂的現(xiàn)象,影響客戶體驗。
碳排放和能耗高。設(shè)備自身的能耗排放帶來非常大的挑戰(zhàn),比如OpenAI公司的超大規(guī)模預(yù)訓(xùn)練模型GPT-3訓(xùn)練所需的耗電量為19萬千瓦時,相當(dāng)于2021年人均用電量的228倍。
投資成本和應(yīng)用價格待規(guī)范。智算中心的投建成本較高,部分智算中心每 100P半精算力的投資成本高達(dá)5億-6億元,遠(yuǎn)遠(yuǎn)高出正常市場價格,同時使用成本也較高,比如據(jù)保守估計GPT-3大模型訓(xùn)練費用超過1200萬美元。
智算中心建設(shè)需要結(jié)合建設(shè)基礎(chǔ)、當(dāng)?shù)鼗騾^(qū)域產(chǎn)業(yè)特色,分類引導(dǎo)施策,改建并行,發(fā)展與數(shù)字經(jīng)濟(jì)相適應(yīng)的智算中心;還需要選擇合理的建設(shè)和運營模式,實現(xiàn)長效運營、促進(jìn)有序布局,保證智算中心所釋放的經(jīng)濟(jì)社會效益最大化。
如今中國智算中心產(chǎn)業(yè)發(fā)展正在克服1.0時代的挑戰(zhàn)進(jìn)入2.0時代,中國在智算中心的建設(shè)中,始終堅持以算力融合、軟硬協(xié)同、建運一體、能耗低碳、成本優(yōu)化、需求牽引、安全可信為基礎(chǔ),穩(wěn)步推進(jìn)智算中心的發(fā)展。