編者按:“中國AI到底發(fā)展得怎么樣了?”在各種社交平臺上,我們經(jīng)常會看到這樣的問題,也會看到各種各樣的答案,但這些答案有著普遍的缺陷。它們往往只抽取一兩個片段或案例,用非常取巧,甚至有點抖機靈的方式,極端唱好或者唱衰中國AI。
事實上,所謂的中國AI產(chǎn)業(yè)覆蓋面非常廣泛。每個領(lǐng)域有各自的發(fā)展特點,產(chǎn)業(yè)優(yōu)勢以及產(chǎn)業(yè)局限性,很難用過分簡單的方式,來概括事實上非常復(fù)雜的AI產(chǎn)業(yè)。
或許,復(fù)雜的問題就應(yīng)該有詳細的答案。就像一幅小畫,畫不盡中國廣袤的山水。
想要探尋中國AI的底色,需要梳理來龍去脈,需要回看一步一景,需要去畫一幅長卷。
今天我們都知道,驅(qū)動AI算法工作的“燃油”是AI算力。尤其當(dāng)深度學(xué)習(xí)算法發(fā)展到了預(yù)訓(xùn)練大模型階段,AI算力已經(jīng)成為整個AI領(lǐng)域的最大成本開銷。根據(jù)相關(guān)數(shù)據(jù),算力成本要占到大模型訓(xùn)練成本的70%左右,在大模型推理階段則高達95%。
如果說,AI產(chǎn)業(yè)是一間工廠,那么AI算力就是工廠所需的煤和石油。更為致命的是,這些“煤和石油”的供應(yīng)處在一種半壟斷狀態(tài)。在這次AI復(fù)興當(dāng)中,英偉達用GPU占據(jù)全球AI算力市場的主導(dǎo)地位。英偉達的高端AI算力不僅成本高昂,供不應(yīng)求,但對于蓬勃發(fā)展的中國AI產(chǎn)業(yè)來說,能否確保其供應(yīng)穩(wěn)定都要打上大大的問號。
在算力貴且不穩(wěn)的前提下,中國AI產(chǎn)業(yè)卻涌現(xiàn)出了巨大的AI算力需求。根據(jù)相關(guān)數(shù)據(jù)預(yù)測,2030年全球AI算力的需求將達到2020年的500倍。其中,中國AI算力的增長是主要驅(qū)動力。目前階段,中美之間的AI算力差不多是1比1.5。種種跡象顯示,未來兩國間的AI算力需求將拉平,甚至中國反超。
成本高昂、供應(yīng)不穩(wěn),需求激增,這三點勾勒出了中國AI算力的整體發(fā)展背景。
AI算力就是生產(chǎn)力。在種種令人不安的局面下,中國AI開始了聚沙成塔般的算力突圍。
搶跑于AI時代
2017年,是人工智能第三次興起的第一年。在這一年里,AlphaGO實現(xiàn)了對人類棋手的全面勝利,自動駕駛被廣泛看好,深度學(xué)習(xí)算法四處開花。而這一切算法表現(xiàn)的背后,都離不開AI算力的支持。
這一年,英偉達拉開了股價飆升,AI算力產(chǎn)品頻繁迭代的大幕。谷歌開始在云上布局TPU等自研算力。全球半導(dǎo)體產(chǎn)業(yè)開始看到AI算力這個極具想象力的新方向。
而與此前歷次半導(dǎo)體風(fēng)口不同的是,這次中國的從業(yè)者們沒有后知后覺,待產(chǎn)業(yè)成熟后再加油追趕,他們選擇了搶跑。
在2017年10月,海思打造了麒麟970,把端側(cè)AI算力帶到了華為手機。11月,中國科學(xué)院和寒武紀共同發(fā)布了新一代產(chǎn)品,其中包括面向手機與云端的AI處理器。這在當(dāng)時被稱為全球首個深度學(xué)習(xí)專用處理器芯片。
如果說,這些芯片還更多集中在端側(cè)場景,不能直接對標英偉達提供的高端AI算力,尤其是AI訓(xùn)練算力,那么到了2018年,情況就正式發(fā)生了改變。
2018年10月,華為正式發(fā)布了全棧全場景AI解決方案。構(gòu)成全站全場景AI主體的,是兩款華為自研的AI芯片,也就是當(dāng)年發(fā)布了用于推理的昇騰310,以及預(yù)告中的昇騰910,伴隨著昇騰這個名字的出現(xiàn),華為在AI基礎(chǔ)設(shè)施領(lǐng)域的一系列布局開始浮現(xiàn)出來。
彼時,中美之間的貿(mào)易摩擦還沒有開始。中國科技界不會料想到科技封鎖的大棒即將迎面而來,更不會料想到AI算力這個還非常新穎、前沿的概念,居然會在幾年后成為美國反復(fù)操縱,極力打擊的中國科技“命門”所在。
如果沒有華為對AI機遇的預(yù)判,昇騰在AI算力上的搶跑,或許后面的故事,就會是另一個走向。
2019年到2022年,中國AI算力發(fā)展進入第二階段。簡要概述這個階段的發(fā)展目標,就是把AI芯片變成了AI算力。
提及AI計算,很多朋友會有種疑惑,一方面國產(chǎn)AI芯片似乎非常多,時不時就能看到相關(guān)報道,但另一方面卻又都說AI算力卡脖子。其中的問題,就在于芯片和算力是有區(qū)別的。
芯片需要能夠量產(chǎn),能夠變成板卡、服務(wù)器、小站等計算產(chǎn)品,還需要具備全套的軟件生態(tài)來幫助用戶進行調(diào)用、開發(fā),需要與各個應(yīng)用場景進行適配,證明可用性。在這一系列問題都得到解決之后,還需要形成足夠大的市場規(guī)模。
要頂著性能沒有英偉達好,成本、生態(tài)、商業(yè)信任全都沒有優(yōu)勢的逆境走向市場,國產(chǎn)AI算力這條路非常艱難。這也是為什么絕大多數(shù)國產(chǎn)AI芯片都只能停留在研制成功的新聞通稿里。
萬幸的是,在中美貿(mào)易摩擦的背景下,這一階段重要科技領(lǐng)域的自主可控成為各界共識,而AI算力在其中首當(dāng)其沖。所以,國產(chǎn)AI算力沒有像此前的算力國產(chǎn)化議題那樣,反復(fù)被質(zhì)疑是否有必要自研,全球化采購是否成本更優(yōu)。因為理智的科技從業(yè)者都知道,AI算力被當(dāng)作美國的棋子只不過是早晚的問題。
在政策形勢、市場需求,以及頭部科技企業(yè)的帶動下,國產(chǎn)AI芯片的算力轉(zhuǎn)化雖然沒有百花齊放,但也順利完成了階段性的目標升級。
2019年8月,可用于AI訓(xùn)練,能直接對標英偉達高端產(chǎn)品的昇騰910芯片正式發(fā)布。其整數(shù)精度(INT8)算力可以達到640TOPS,整體性能接近了英偉達的A100。這標志著,中國AI算力的“拳頭產(chǎn)品”來到了全球一線水平。
隨后,昇騰生態(tài)的建設(shè)全面加速。深圳鵬城實驗室基于昇騰910搭建了“鵬城云腦Ⅱ”,實現(xiàn)了中國首個自主可控的E級智能算力平臺,可以提供不低于1000Pops的整機AI計算能力和64PB的高速并行可擴展存儲。在武漢等25個城市,搭建了基于?昇騰AI集群的人工智能計算中心,借助“東數(shù)西算”熱潮,開啟了云端AI算力這一新型基礎(chǔ)設(shè)施的建設(shè)。
其他科技公司,同樣也在這一階段推動著AI芯片走向AI算力。百度在2020年量產(chǎn)了?昆侖芯1代AI芯片,?隨后在百度搜索引擎、?小度等業(yè)務(wù)中進行了部署。隨后,基于百度自身業(yè)務(wù)與百度智能云龐大的AI算力需求,昆侖芯片達成了一定的量產(chǎn)規(guī)模。
先后布局AI芯片的,有華為這樣的全產(chǎn)業(yè)鏈科技公司,也有阿里、百度等基于云計算業(yè)務(wù)拓展的AI芯片布局,同時還有寒武紀、海光信息、燧原科技、天數(shù)智芯、壁仞科技、摩爾線程、龍芯中科等半導(dǎo)體企業(yè)。中國AI算力的產(chǎn)業(yè)縱深,在一定程度上被拉開,IT市場的國產(chǎn)化AI算力選擇也開始多樣了起來。
時間來到2022年,一個關(guān)鍵性指標開始浮出。根據(jù)IDC發(fā)布數(shù)據(jù),2022年中國AI加速卡出貨量約為109萬張,其中英偉達市場份額約為85%,昇騰市場占有率10%,百度昆侖為2%,寒武紀和燧原科技均為1%。
這意味著,中國AI計算市場上的國產(chǎn)化占比已經(jīng)超過了10%。雖然這個規(guī)??瓷先ヒ琅f不夠大,但它意味著國產(chǎn)AI算力已經(jīng)獲得了穩(wěn)定的市場基數(shù),成為除了英偉達之外,中國AI計算具有可行性的第二選擇。
這是用極限速度跑出來的10%,也成為中國AI產(chǎn)業(yè)的壓艙石。
達摩克里斯之劍
記得2018年,我與一些AI開發(fā)者、AI公司的創(chuàng)始人聊過GPU供應(yīng)問題。在問到他們是否認為英偉達GPU會走向斷供的問題時,大家普遍覺得不用擔(dān)心,一方面是因為中國市場足夠大,且增長足夠快,英偉達不可能放棄,另一方面中美之間的AI技術(shù)差距還很明顯,美國政府沒有必要在這個領(lǐng)域出手干預(yù)。
然而事實證明,達摩克里斯之劍終會落下,我們永遠不能樂觀地認為科技鐵幕上能打開一扇小窗。
2022年國產(chǎn)AI算力能夠走向規(guī)模化商用的另一重推動力,是因為英偉達高端GPU的禁售風(fēng)波開始了。在此之前,英偉達雄踞了中國AI芯片市場超過90%的份額。但在2022年10月,美國商務(wù)部以擔(dān)心軍用轉(zhuǎn)化為借口,對出口中國的AI芯片啟動管制。其中,英偉達的H100和A100等高端GPU成為主要管制對象。
對于這個荒謬的新規(guī),英偉達也并非沒有尋找出路。作為禁令的對策,英偉達馬上開發(fā)了兩款專為中國市場設(shè)計的“平替”,也就是A800和H800。這兩款GPU性能都低于美國制裁措施規(guī)定的閾值,但在性能降低的同時,價格卻進行了上漲。
然而即使這樣的替代方案,也在一年后被宣告“此路不通”。美國商務(wù)部在2023年10月宣布禁止英偉達向中國供應(yīng)A800和H800,而且新的禁售令不僅影響英偉達,還將AMD和英特爾的芯片覆蓋在內(nèi),并且影響了大量芯片設(shè)備廠商。這種做法,可謂是堵上了中國獲取中高端AI算力供應(yīng)的全部大門,甚至計劃對使用亞馬遜云、微軟云等美國云計算平臺來獲取云端AI算力的中國企業(yè)進行限制。鐵閘落下,空余無奈。
當(dāng)然,英偉達也并沒停下試試看的腳步。英偉達又一次設(shè)計了三款面向中國的“特供版”。其中,能夠用于AI訓(xùn)練的H20在理論上只有H100的20%綜合性能,縮水之嚴重令人驚嘆。
至此我們或許可以說,依靠進口的中國AI算力之路已經(jīng)被堵得水泄不通,接下來,只能路自己修,步自己走。
鼎有三足
幸運的是,修出來的路還不止一條。在今天,國產(chǎn)AI算力已經(jīng)可以通過多種方式供應(yīng)市場。它們支撐著百模大戰(zhàn)的繁榮,實現(xiàn)了英偉達禁令甚至沒有激起太大的水花。當(dāng)然,這些方式互有交疊,用戶可以有多樣化的搭配與選擇。但整體而言,今天中國AI算力的來源有三條途徑:
第一種,全國算力網(wǎng)絡(luò)與云端AI算力。
在科技自立自強的大背景下,幾年來中國極大程度上加強了AI算力設(shè)施的基礎(chǔ)建設(shè)。作為“東數(shù)西算”的核心組成部分,中國興建了大量智算中心,預(yù)計在2025年將提供超過105EFLOPS的AI算力,組成了一張龐大的AI算力網(wǎng)絡(luò)。
而作為與國家AI算力基礎(chǔ)設(shè)施結(jié)合相對緊密的運營商,也正在加緊提升對算力網(wǎng)絡(luò)的利用與挖掘。在目前階段,運營商紛紛加碼云計算與AI大模型,逐漸形成了云端AI算力在技術(shù)上的成熟與長期成本上的優(yōu)勢。
與此同時,各大云計算廠商也加強了AI算力的投入。一方面趕在禁令之前,大量囤積英偉達高端顯卡,另一方面也在探索自研AI芯片的使用,以及對其他國產(chǎn)AI算力的引入。
綜合來看,全國一體化的AI算力網(wǎng)絡(luò),正在成為中國智能化的主要算力基石。
第二種,昇騰生態(tài)。
經(jīng)過多年的發(fā)展,華為已經(jīng)將昇騰建設(shè)為國內(nèi)最為成熟,且完全沒有英偉達GPU參與的AI計算生態(tài)。科大訊飛創(chuàng)始人劉慶峰曾經(jīng)表示,華為的昇騰AI芯片可以達到與英偉達A100相當(dāng)?shù)男阅堋?/p>
相對來說,昇騰的優(yōu)勢在于軟硬件體系較為齊備,可以廣泛使用華為自研的技術(shù)進行支持;可以和同樣由華為打造的鯤鵬生態(tài)結(jié)合,實現(xiàn)多元計算;整體產(chǎn)業(yè)生態(tài)較為繁榮,硬件、軟件合作商豐富。弱勢之處則在于,外界對昇騰芯片還是有性能不足與價格過高的質(zhì)疑,并且昇騰生態(tài)相對封閉,與其他廠商的AI算力生態(tài)基本不打通。
今天,中國已經(jīng)有一半的大模型由昇騰來支撐,并且華為云已經(jīng)將昇騰算力帶到了云端,推出了昇騰AI云服務(wù)。可以說,昇騰的出現(xiàn)和成長,讓中國有了可以對標英偉達生態(tài)的AI算力選擇。
第三種,異構(gòu)智算。
昇騰之外,大多數(shù)AI芯片廠商還無法實現(xiàn)規(guī)?;鲐洠嗍且詤⑴c混合型算力的方式,加入數(shù)據(jù)中心、企業(yè)AI集群的建設(shè)當(dāng)中。目前情況下,大多數(shù)企業(yè)與數(shù)據(jù)中心還是會選擇英偉達來構(gòu)建AI算力的主體,同時通過加入海光、寒武紀等國產(chǎn)芯片以及加速卡來構(gòu)建AI算力,或者采取使用英偉達GPU進行訓(xùn)練,使用國產(chǎn)AI算力進行推理的模式。比如說,百度在文心一言訓(xùn)練中使用的是英偉達GPU,推理側(cè)則使用自主研發(fā)的昆侖芯2代。
類似策略,可以逐漸降低對英偉達的依賴度,并且發(fā)揮出多元化的AI芯片優(yōu)勢。由此,異構(gòu)智算開始成為企業(yè)和數(shù)據(jù)中心新的需求。面向這種需求,IT廠商也正在捕捉機會。比如聯(lián)想推出了完全異構(gòu)智算平臺,來幫助實現(xiàn)異構(gòu)化AI算力的管理與調(diào)配;新華三推出了面向異構(gòu)智算的網(wǎng)絡(luò)解決方案,解決異構(gòu)智算帶來的丟包與負載等問題。
這三根“足”,給中國AI算力帶來了某種穩(wěn)定性。經(jīng)過極限情況下的多年經(jīng)營與發(fā)展,今天中國AI算力談不上充沛與廉價,至少有了可以遮風(fēng)擋雨的穩(wěn)固。
至少我們可以看到,中小企業(yè)應(yīng)用AI算力的綜合門檻正在降低,AI算力的選擇在增多,異構(gòu)協(xié)同能力在加強,并且熟悉了昇騰與海光DCU這樣能夠直接替代英偉達GPU的存在。中國AI是否會因為算力而陷入生存僵局,已經(jīng)不再是個問題。
總結(jié)一下,在AI算力層面,我們有辦法,但辦法不夠好,其實也不夠多。
然而換個角度想想,幸好我們有方法,否則麻煩就大了。
依靠精準的預(yù)判搶跑,在多重助力下超高速發(fā)展,在外部壓力下極限成型。
智算,終成國之重器。