作者:暢秋
從2023上半年開始,英偉達的AI服務器用GPU(特別是H100)就供不應求了,這種狀況一直持續(xù)到今天。之所以如此,問題出在生產(chǎn)環(huán)節(jié),主要涉及臺積電的先進制程和封裝產(chǎn)能,特別是CoWoS封裝,市場上具備這種先進封裝量產(chǎn)能力的廠商并不多,而臺積電沒有預料到市場對英偉達GPU的需求增長爆發(fā)力如此之強,在2023年第二季度才開始大規(guī)模擴增CoWoS產(chǎn)能。
近期,市場傳來了一個好消息,瑞銀(UBS)的最新報告顯示,英偉達大幅縮短了AI GPU的交貨周期,從2023年底的8~11個月縮短到了現(xiàn)在的3-4個月。這對英偉達客戶來說是非常利好的。
CoWoS封裝產(chǎn)能是關鍵
交貨時間縮短,表明臺積電擴增的CoWoS封裝產(chǎn)能開始釋放。據(jù)悉,臺積電要在2024年底前將相關產(chǎn)能從2023年中的水平增加一倍,從目前的情況來看,臺積電及其合作伙伴的CoWoS產(chǎn)能擴增進展快于預期,使得以H100為代表的高性能GPU交貨時間大幅縮短。
產(chǎn)業(yè)人士分析,從2023年7月到年底,臺積電積極調(diào)整CoWoS封裝產(chǎn)能,已逐步擴充并穩(wěn)定量產(chǎn),去年12月,臺積電CoWoS月產(chǎn)能增加到1.4萬~1.5萬片。
雖然臺積電在積極擴產(chǎn),但只這一家的產(chǎn)能還是無法滿足市場需求,因此,英偉達已經(jīng)在2023年向臺積電以外的專業(yè)封測代工廠(OSAT)尋求幫助,主要包括日月光和安靠(Amkor),其中,安靠在2023年第四季度已開始提供相關產(chǎn)能,日月光投控旗下矽品也于2024年第一季度開始供應CoWoS封裝產(chǎn)能。
2024年,AI芯片用先進封裝產(chǎn)能依然會供不應求,包括臺積電、日月光、安靠、力成、京元電在內(nèi)的專業(yè)封測代工廠,將會在今年擴大資本支出,以布局先進封裝產(chǎn)能。
根據(jù)臺積電的擴產(chǎn)節(jié)奏,預計到今年第四季度,該晶圓代工龍頭的CoWoS月產(chǎn)能將大幅擴充到3.3萬~3.5萬片。
今年,日月光的資本支出規(guī)模將同比增長40%~50%,其中,65%的投資用于封裝,特別是先進封裝項目。日月光投控營運長吳田玉表示,今年的先進封裝與測試營收占比會更高,AI相關先進封裝收入將翻倍,今年相關營收至少增加2.5億美元。力成也在擴大先進封裝產(chǎn)能,該公司董事長蔡篤恭表示,下半年將積極擴大資本支出,規(guī)模有望達到100億元新臺幣。力成主要布局扇出型基板封裝(fan out on substrate)技術,整合ASIC和HBM先進封裝,在AI用HBM內(nèi)存方面,力成有望在今年第四季度量產(chǎn)相關產(chǎn)品。為滿足CoWoS封裝后的晶圓測試需求,今年,京元電相關晶圓測試產(chǎn)能將擴充兩倍。
競爭對手雪上加霜
近些年,全球AI核心處理器市場幾乎被英偉達GPU壟斷,此次,該公司供貨能力進一步提升,對于各家競爭對手來說,真是雪上加霜,有些廠商的日子更難過了,特別是一些對標英偉達產(chǎn)品的創(chuàng)業(yè)公司,有的已經(jīng)接近倒閉。
據(jù)The Information統(tǒng)計,在北美地區(qū),至少有12家AI芯片創(chuàng)業(yè)公司想從英偉達獨享的生成式AI算力紅利中分一杯羹。在這些創(chuàng)業(yè)公司中,創(chuàng)辦時間最長的不超過8年,有5家都是2022年創(chuàng)辦的,有4家創(chuàng)始成員有谷歌背景。
這12家AI芯片創(chuàng)業(yè)公司,有的定位做訓練,有的主攻推理,有些則更進一步,將其產(chǎn)品定位瞄準特定類型的AI模型。推理一直是更受歡迎的選擇,因為很多客戶使用或微調(diào)已經(jīng)被訓練過的模型,而不是從頭開始構(gòu)建一個新模型。AI芯片創(chuàng)業(yè)公司d-Matrix、Etched.ai、Extropic、SiMa.ai、Groq正在構(gòu)建專門用于某些模型架構(gòu)的芯片,如為OpenAI和Anthropic的大語言模型提供動力的Transformer。這些公司認為,專用芯片比英偉達、Cerebras、Lightmatter、Rain AI、Tenstorrent等的通用芯片更快、效率更高。
還有幾家創(chuàng)業(yè)公司正在開發(fā)新GPU技術和產(chǎn)品,包括專用的AI加速器和針對特定應用優(yōu)化的定制芯片。如果這些創(chuàng)業(yè)公司的技術被證明優(yōu)于老牌企業(yè),他們可能會成為顛覆者,但是,從過去幾年的技術和產(chǎn)品發(fā)展情況來看,短時間內(nèi),要想顛覆英偉達的產(chǎn)品和生態(tài)系統(tǒng),難度非常大,已經(jīng)有幾家公司支撐不住了,由于它們開發(fā)的新技術和產(chǎn)品很難在市場上銷售出去,導致資金鏈非常緊張。
以英國的Graphcore為例,該公司正在考慮出售給外國買家,據(jù)媒報道,Graphcore一直在與主要科技公司進行談判,因為它正在尋求資金來彌補日益增長的虧空。2023年,Graphcore就曾表示,在銷售額下降46%且虧損增加后,它需要新的資金。
中國市場緊迫感增加
目前,全球AI市場用到的GPU,先進且用量最大的是H100,但該產(chǎn)品在巨大的中國大陸市場難以實現(xiàn)大規(guī)模銷售。對于英偉達來說,產(chǎn)能問題的解決,可以實現(xiàn)更多訂單,對于中國大陸市場來說,全球市場GPU供應量的增加,會進一步增加本土AI服務器和應用企業(yè)的緊迫感,因為全球AI應用水平會隨GPU供應量的大幅增加而提升進步速度,在類似于H100這樣的主芯片供應受限的情況下,中國市場必須另謀出路,才能保證本土市場AI服務器系統(tǒng)和應用水平不掉隊。
在A800和H800芯片被禁售以后,英偉達又為中國大陸市場提供了新的方案——H20、L20和L2。但是,在目前這種情況下,中國客戶是否愿意大規(guī)模采用英偉達這些降級版本AI芯片呢?
據(jù)報道,自2023年11月以來,阿里巴巴和騰訊等互聯(lián)網(wǎng)大廠一直在測試英偉達降級版本芯片,這些中國企業(yè)已經(jīng)向英偉達表示,他們計劃在2024年訂購的芯片數(shù)量將大大低于他們最初的計劃。測試人員強調(diào),與英偉達常規(guī)GPU相比,需要更多的H20芯片來抵消性能差異,從而導致費用大幅增加?;诖耍袊就猎O計制造的相關芯片對買家更具吸引力,阿里巴巴和騰訊等企業(yè)正在將更多訂單轉(zhuǎn)移到本土芯片供應商。
這種采購行為的轉(zhuǎn)變在包括百度和字節(jié)跳動在內(nèi)的其它主要芯片買家中也很明顯。據(jù)TrendForce統(tǒng)計,中國云計算公司使用的高端AI芯片中,約有80%來自英偉達,但這一比例在未來5年內(nèi)可能會下降至50%~60%。
與此同時,百度和阿里巴巴等中國CSP也在積極投資自研AI芯片。
百度于2020年推出了首款自研的AI芯片昆侖芯,并在2021年推出第二代,計劃在2024年推出第三代。在收購中天微并成立T-Head Semiconductor(平頭哥)后,阿里巴巴也開始設計AI芯片,代表產(chǎn)品是含光800。雖然T-Head最初與外部公司合作進行ASIC芯片設計,但從2023年開始,阿里巴巴將主要依賴內(nèi)部資源來加強其下一代ASIC芯片設計,特別是阿里云的AI基礎設施。
近些年,華為、寒武紀、天數(shù)智芯等中國本土企業(yè)也在潛心研究高性能AI芯片,產(chǎn)品力不斷升級。以華為昇騰910為例,該款芯片采用7nm制程,集成了超496億個晶體管,可以提供320TFLOPS的FP16計算速度或640TOPS的INT8算力,略高于英偉達A100的FP16計算速度(312TFLOPS,不采用英偉達稀疏技術)。
AI服務器生產(chǎn)和代工的商機
從目前的發(fā)展情況來看,2024年,AI服務器和相關系統(tǒng)將會加快組裝、生產(chǎn)和應用節(jié)奏,TrendForce認為,2024年,全球AI服務器數(shù)量將超過160萬臺(包含采用高端GPU的AI訓練服務器,以及采用中低端GPU、FPGA、ASIC的AI推理服務器),同比增長40%,這將為相關芯片和電子制造代工業(yè)務(EMS)帶來更多商機,特別是中國臺灣和中國大陸相關廠商,有更多可以挖掘的市場空間。
目前,各大云服務提供商正在競相布局LLM與生成式AI應用,如Google的Gemini,Amazon也在訓練新的LLM。預計中小語言模型會是2024年新興競爭領域,許多更為定制化、符合運算效率的模型將陸續(xù)出現(xiàn),例如Llama-2、Microsoft Phi-2、Google Gemini Nano 2等。而隨著英偉達GPU供應能力的提升,這些AI應用面市的速度會加快,對相關服務器生產(chǎn)和代工的需求也會提升。
近期,中國臺灣AI服務器供應鏈高度關注AI芯片供應狀況的變化。供應鏈人士表示,鴻海是英偉達板卡主要供應商,也是HGX、DGX等服務器平臺供應商,市占率超過70%,許多產(chǎn)品甚至獨家供應。鴻海董事長劉揚偉先前公開表示,鴻海AI服務器業(yè)務接單狀況相當好。
廣達同樣看好今年AI服務器出貨,該公司預期,如果AI芯片供貨緩解,最快5月起,AI服務器出貨量將明顯提升,下半年將進入出貨爆發(fā)期,今年AI服務器營收增長幅度將達到兩位數(shù)百分比。
據(jù)悉,緯創(chuàng)手握英偉達CoWoS AI芯片基板85%訂單,也是AMD和英特爾AI芯片模組、基板的獨家供應商。緯創(chuàng)表示,今年AI相關營收增長幅度將達到三位數(shù)百分比。
在中國大陸,AI服務器出貨量也在快速增長。中商產(chǎn)業(yè)研究院發(fā)布的《2022-2027年中國服務器行業(yè)需求預測及發(fā)展趨勢前瞻報告》顯示,2022年,AI服務器市場出貨量約28.4萬臺,同比增長25.66%,2023年約為35.4萬臺。中商產(chǎn)業(yè)研究院分析師預測,2024年,中國大陸AI服務器出貨量將達到42.1萬臺。
從全球市場來看,AI服務器TOP10廠商中,中國大陸廠商占據(jù)4席,其中,浪潮信息是本土最大AI服務器廠商。在中國大陸市場,AI服務器市場集中度較高,排名前三的廠商為浪潮信息、寧暢和華為,這三家的市占率總和達70.40%。另外,新華三的產(chǎn)品也值得關注。
浪潮的代表產(chǎn)品是NF5688M6,它是為超大規(guī)模數(shù)據(jù)中心研發(fā)的NVLink AI服務器,支持2個英特爾Ice Lake CPU和8個英偉達A800 GPU,單機可提供5PFlops的AI計算性能。對比核心硬件來看,NF5688M6采用英偉達中國特供版芯片A800,在浮點計算能力、顯存帶寬、顯存容量等性能指標上,與先進算力芯片A100基本一致,主要差異在于芯片的數(shù)據(jù)傳輸速度,約為A100的三分之二。
華為的AI服務器融合了自研加速卡和英特爾CPU,代表產(chǎn)品是Atlas 800推理服務器系列,旗下有型號3000、3010、9000和9010,其中,3000基于昇騰310芯片,3010基于英特爾CPU,9000基于華為鯤鵬920+昇騰910處理器,9010基于英特爾CPU+華為昇騰910芯片。產(chǎn)品最高擁有2.24 PFLOPS FP16的算力。
新華三的AI服務器可覆蓋各種訓練負載要求,代表產(chǎn)品包括R4900 G5、R5300 G5、R5500 G5等,可分別針對不同訓練負載要求,滿足大小規(guī)模的推理/訓練任務。軟件層面,該公司通過新華三傲飛AI/HPC融合管理平臺,提升AI作業(yè)效率約32%。
結(jié)語
2024年,無論是AI芯片提供商,還是AI服務器生產(chǎn)和代工廠商,都將迎來更廣闊的商機。
芯片方面,英偉達憑借AI用GPU的火爆,已經(jīng)賺得盆滿缽滿。在制造方面,以臺積電為代表的晶圓代工廠和封測廠大力擴增先進封裝產(chǎn)能,將在2024年得到回報。
在AI服務器生產(chǎn)和代工方面,相關廠商更是商機無限。一般來說,通用服務器的價格是幾千美金/臺,AI服務器的價格則達到10-15萬美金/臺,價格提升了將近20倍,在供不應求的當下,這么高的售價還不一定能拿到貨。
高端AI服務器的價格就更夸張了,據(jù)悉,搭載英偉達A800的AI服務器價格已經(jīng)從120萬元/臺漲到了140多萬元/臺,搭載8個H800的AI服務器價格已經(jīng)漲到了280萬元/臺。