加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • CoWoS封裝產(chǎn)能是關鍵
    • 競爭對手雪上加霜
    • 中國市場緊迫感增加
    • AI服務器生產(chǎn)和代工的商機
    • 結(jié)語
  • 推薦器件
  • 相關推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

英偉達GPU交貨周期大幅縮短,連鎖反應一觸即發(fā)

02/22 10:30
2677
閱讀需 16 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者:暢秋

從2023上半年開始,英偉達AI服務器用GPU(特別是H100)就供不應求了,這種狀況一直持續(xù)到今天。之所以如此,問題出在生產(chǎn)環(huán)節(jié),主要涉及臺積電先進制程封裝產(chǎn)能,特別是CoWoS封裝,市場上具備這種先進封裝量產(chǎn)能力的廠商并不多,而臺積電沒有預料到市場對英偉達GPU的需求增長爆發(fā)力如此之強,在2023年第二季度才開始大規(guī)模擴增CoWoS產(chǎn)能。

近期,市場傳來了一個好消息,瑞銀(UBS)的最新報告顯示,英偉達大幅縮短了AI GPU的交貨周期,從2023年底的8~11個月縮短到了現(xiàn)在的3-4個月。這對英偉達客戶來說是非常利好的。

CoWoS封裝產(chǎn)能是關鍵

交貨時間縮短,表明臺積電擴增的CoWoS封裝產(chǎn)能開始釋放。據(jù)悉,臺積電要在2024年底前將相關產(chǎn)能從2023年中的水平增加一倍,從目前的情況來看,臺積電及其合作伙伴的CoWoS產(chǎn)能擴增進展快于預期,使得以H100為代表的高性能GPU交貨時間大幅縮短。

產(chǎn)業(yè)人士分析,從2023年7月到年底,臺積電積極調(diào)整CoWoS封裝產(chǎn)能,已逐步擴充并穩(wěn)定量產(chǎn),去年12月,臺積電CoWoS月產(chǎn)能增加到1.4萬~1.5萬片。

雖然臺積電在積極擴產(chǎn),但只這一家的產(chǎn)能還是無法滿足市場需求,因此,英偉達已經(jīng)在2023年向臺積電以外的專業(yè)封測代工廠(OSAT)尋求幫助,主要包括日月光和安靠(Amkor),其中,安靠在2023年第四季度已開始提供相關產(chǎn)能,日月光投控旗下矽品也于2024年第一季度開始供應CoWoS封裝產(chǎn)能。

2024年,AI芯片用先進封裝產(chǎn)能依然會供不應求,包括臺積電、日月光、安靠、力成、京元電在內(nèi)的專業(yè)封測代工廠,將會在今年擴大資本支出,以布局先進封裝產(chǎn)能。

根據(jù)臺積電的擴產(chǎn)節(jié)奏,預計到今年第四季度,該晶圓代工龍頭的CoWoS月產(chǎn)能將大幅擴充到3.3萬~3.5萬片。

今年,日月光的資本支出規(guī)模將同比增長40%~50%,其中,65%的投資用于封裝,特別是先進封裝項目。日月光投控營運長吳田玉表示,今年的先進封裝與測試營收占比會更高,AI相關先進封裝收入將翻倍,今年相關營收至少增加2.5億美元。力成也在擴大先進封裝產(chǎn)能,該公司董事長蔡篤恭表示,下半年將積極擴大資本支出,規(guī)模有望達到100億元新臺幣。力成主要布局扇出型基板封裝(fan out on substrate)技術,整合ASIC和HBM先進封裝,在AI用HBM內(nèi)存方面,力成有望在今年第四季度量產(chǎn)相關產(chǎn)品。為滿足CoWoS封裝后的晶圓測試需求,今年,京元電相關晶圓測試產(chǎn)能將擴充兩倍。

競爭對手雪上加霜

近些年,全球AI核心處理器市場幾乎被英偉達GPU壟斷,此次,該公司供貨能力進一步提升,對于各家競爭對手來說,真是雪上加霜,有些廠商的日子更難過了,特別是一些對標英偉達產(chǎn)品的創(chuàng)業(yè)公司,有的已經(jīng)接近倒閉。

據(jù)The Information統(tǒng)計,在北美地區(qū),至少有12家AI芯片創(chuàng)業(yè)公司想從英偉達獨享的生成式AI算力紅利中分一杯羹。在這些創(chuàng)業(yè)公司中,創(chuàng)辦時間最長的不超過8年,有5家都是2022年創(chuàng)辦的,有4家創(chuàng)始成員有谷歌背景。

這12家AI芯片創(chuàng)業(yè)公司,有的定位做訓練,有的主攻推理,有些則更進一步,將其產(chǎn)品定位瞄準特定類型的AI模型。推理一直是更受歡迎的選擇,因為很多客戶使用或微調(diào)已經(jīng)被訓練過的模型,而不是從頭開始構(gòu)建一個新模型。AI芯片創(chuàng)業(yè)公司d-Matrix、Etched.ai、Extropic、SiMa.ai、Groq正在構(gòu)建專門用于某些模型架構(gòu)的芯片,如為OpenAI和Anthropic的大語言模型提供動力的Transformer。這些公司認為,專用芯片比英偉達、Cerebras、Lightmatter、Rain AI、Tenstorrent等的通用芯片更快、效率更高。

還有幾家創(chuàng)業(yè)公司正在開發(fā)新GPU技術和產(chǎn)品,包括專用的AI加速器和針對特定應用優(yōu)化的定制芯片。如果這些創(chuàng)業(yè)公司的技術被證明優(yōu)于老牌企業(yè),他們可能會成為顛覆者,但是,從過去幾年的技術和產(chǎn)品發(fā)展情況來看,短時間內(nèi),要想顛覆英偉達的產(chǎn)品和生態(tài)系統(tǒng),難度非常大,已經(jīng)有幾家公司支撐不住了,由于它們開發(fā)的新技術和產(chǎn)品很難在市場上銷售出去,導致資金鏈非常緊張。

以英國的Graphcore為例,該公司正在考慮出售給外國買家,據(jù)媒報道,Graphcore一直在與主要科技公司進行談判,因為它正在尋求資金來彌補日益增長的虧空。2023年,Graphcore就曾表示,在銷售額下降46%且虧損增加后,它需要新的資金。

中國市場緊迫感增加

目前,全球AI市場用到的GPU,先進且用量最大的是H100,但該產(chǎn)品在巨大的中國大陸市場難以實現(xiàn)大規(guī)模銷售。對于英偉達來說,產(chǎn)能問題的解決,可以實現(xiàn)更多訂單,對于中國大陸市場來說,全球市場GPU供應量的增加,會進一步增加本土AI服務器和應用企業(yè)的緊迫感,因為全球AI應用水平會隨GPU供應量的大幅增加而提升進步速度,在類似于H100這樣的主芯片供應受限的情況下,中國市場必須另謀出路,才能保證本土市場AI服務器系統(tǒng)和應用水平不掉隊。

在A800和H800芯片被禁售以后,英偉達又為中國大陸市場提供了新的方案——H20、L20和L2。但是,在目前這種情況下,中國客戶是否愿意大規(guī)模采用英偉達這些降級版本AI芯片呢?

據(jù)報道,自2023年11月以來,阿里巴巴騰訊互聯(lián)網(wǎng)大廠一直在測試英偉達降級版本芯片,這些中國企業(yè)已經(jīng)向英偉達表示,他們計劃在2024年訂購的芯片數(shù)量將大大低于他們最初的計劃。測試人員強調(diào),與英偉達常規(guī)GPU相比,需要更多的H20芯片來抵消性能差異,從而導致費用大幅增加?;诖耍袊就猎O計制造的相關芯片對買家更具吸引力,阿里巴巴和騰訊等企業(yè)正在將更多訂單轉(zhuǎn)移到本土芯片供應商。

這種采購行為的轉(zhuǎn)變在包括百度和字節(jié)跳動在內(nèi)的其它主要芯片買家中也很明顯。據(jù)TrendForce統(tǒng)計,中國云計算公司使用的高端AI芯片中,約有80%來自英偉達,但這一比例在未來5年內(nèi)可能會下降至50%~60%。

與此同時,百度和阿里巴巴等中國CSP也在積極投資自研AI芯片。

百度于2020年推出了首款自研的AI芯片昆侖芯,并在2021年推出第二代,計劃在2024年推出第三代。在收購中天微并成立T-Head Semiconductor(平頭哥)后,阿里巴巴也開始設計AI芯片,代表產(chǎn)品是含光800。雖然T-Head最初與外部公司合作進行ASIC芯片設計,但從2023年開始,阿里巴巴將主要依賴內(nèi)部資源來加強其下一代ASIC芯片設計,特別是阿里云的AI基礎設施。

近些年,華為、寒武紀、天數(shù)智芯等中國本土企業(yè)也在潛心研究高性能AI芯片,產(chǎn)品力不斷升級。以華為昇騰910為例,該款芯片采用7nm制程,集成了超496億個晶體管,可以提供320TFLOPS的FP16計算速度或640TOPS的INT8算力,略高于英偉達A100的FP16計算速度(312TFLOPS,不采用英偉達稀疏技術)。

AI服務器生產(chǎn)和代工的商機

從目前的發(fā)展情況來看,2024年,AI服務器和相關系統(tǒng)將會加快組裝、生產(chǎn)和應用節(jié)奏,TrendForce認為,2024年,全球AI服務器數(shù)量將超過160萬臺(包含采用高端GPU的AI訓練服務器,以及采用中低端GPU、FPGA、ASIC的AI推理服務器),同比增長40%,這將為相關芯片和電子制造代工業(yè)務(EMS)帶來更多商機,特別是中國臺灣和中國大陸相關廠商,有更多可以挖掘的市場空間。

目前,各大云服務提供商正在競相布局LLM與生成式AI應用,如Google的Gemini,Amazon也在訓練新的LLM。預計中小語言模型會是2024年新興競爭領域,許多更為定制化、符合運算效率的模型將陸續(xù)出現(xiàn),例如Llama-2、Microsoft Phi-2、Google Gemini Nano 2等。而隨著英偉達GPU供應能力的提升,這些AI應用面市的速度會加快,對相關服務器生產(chǎn)和代工的需求也會提升。

近期,中國臺灣AI服務器供應鏈高度關注AI芯片供應狀況的變化。供應鏈人士表示,鴻海是英偉達板卡主要供應商,也是HGX、DGX等服務器平臺供應商,市占率超過70%,許多產(chǎn)品甚至獨家供應。鴻海董事長劉揚偉先前公開表示,鴻海AI服務器業(yè)務接單狀況相當好。

廣達同樣看好今年AI服務器出貨,該公司預期,如果AI芯片供貨緩解,最快5月起,AI服務器出貨量將明顯提升,下半年將進入出貨爆發(fā)期,今年AI服務器營收增長幅度將達到兩位數(shù)百分比。

據(jù)悉,緯創(chuàng)手握英偉達CoWoS AI芯片基板85%訂單,也是AMD英特爾AI芯片模組、基板的獨家供應商。緯創(chuàng)表示,今年AI相關營收增長幅度將達到三位數(shù)百分比。

在中國大陸,AI服務器出貨量也在快速增長。中商產(chǎn)業(yè)研究院發(fā)布的《2022-2027年中國服務器行業(yè)需求預測及發(fā)展趨勢前瞻報告》顯示,2022年,AI服務器市場出貨量約28.4萬臺,同比增長25.66%,2023年約為35.4萬臺。中商產(chǎn)業(yè)研究院分析師預測,2024年,中國大陸AI服務器出貨量將達到42.1萬臺。

從全球市場來看,AI服務器TOP10廠商中,中國大陸廠商占據(jù)4席,其中,浪潮信息是本土最大AI服務器廠商。在中國大陸市場,AI服務器市場集中度較高,排名前三的廠商為浪潮信息、寧暢和華為,這三家的市占率總和達70.40%。另外,新華三的產(chǎn)品也值得關注。

浪潮的代表產(chǎn)品是NF5688M6,它是為超大規(guī)模數(shù)據(jù)中心研發(fā)的NVLink AI服務器,支持2個英特爾Ice Lake CPU和8個英偉達A800 GPU,單機可提供5PFlops的AI計算性能。對比核心硬件來看,NF5688M6采用英偉達中國特供版芯片A800,在浮點計算能力、顯存帶寬、顯存容量等性能指標上,與先進算力芯片A100基本一致,主要差異在于芯片的數(shù)據(jù)傳輸速度,約為A100的三分之二。

華為的AI服務器融合了自研加速卡和英特爾CPU,代表產(chǎn)品是Atlas 800推理服務器系列,旗下有型號3000、3010、9000和9010,其中,3000基于昇騰310芯片,3010基于英特爾CPU,9000基于華為鯤鵬920+昇騰910處理器,9010基于英特爾CPU+華為昇騰910芯片。產(chǎn)品最高擁有2.24 PFLOPS FP16的算力。

新華三的AI服務器可覆蓋各種訓練負載要求,代表產(chǎn)品包括R4900 G5、R5300 G5、R5500 G5等,可分別針對不同訓練負載要求,滿足大小規(guī)模的推理/訓練任務。軟件層面,該公司通過新華三傲飛AI/HPC融合管理平臺,提升AI作業(yè)效率約32%。

結(jié)語

2024年,無論是AI芯片提供商,還是AI服務器生產(chǎn)和代工廠商,都將迎來更廣闊的商機。

芯片方面,英偉達憑借AI用GPU的火爆,已經(jīng)賺得盆滿缽滿。在制造方面,以臺積電為代表的晶圓代工廠和封測廠大力擴增先進封裝產(chǎn)能,將在2024年得到回報。

在AI服務器生產(chǎn)和代工方面,相關廠商更是商機無限。一般來說,通用服務器的價格是幾千美金/臺,AI服務器的價格則達到10-15萬美金/臺,價格提升了將近20倍,在供不應求的當下,這么高的售價還不一定能拿到貨。

高端AI服務器的價格就更夸張了,據(jù)悉,搭載英偉達A800的AI服務器價格已經(jīng)從120萬元/臺漲到了140多萬元/臺,搭載8個H800的AI服務器價格已經(jīng)漲到了280萬元/臺。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
DSPIC30F6014A-30I/PT 1 Microchip Technology Inc 16-BIT, FLASH, 30 MHz, RISC MICROCONTROLLER, PQFP80, 12 X 12 MM, 1 MM HEIGHT, PLASTIC, MS-026, TQFP-80

ECAD模型

下載ECAD模型
$12 查看
STM32F429VIT6 1 STMicroelectronics High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator, FSMC, TFT

ECAD模型

下載ECAD模型
$34.08 查看
STM32H750VBT6 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 128 Kbytes of Flash memory, 1MB RAM, 480 MHz CPU, L1 cache, external memory interface, JPEG codec, HW crypto, large set of peripherals

ECAD模型

下載ECAD模型
$27.62 查看
英偉達

英偉達

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。收起

查看更多

相關推薦

電子產(chǎn)業(yè)圖譜

公眾號:半導體產(chǎn)業(yè)縱橫。立足產(chǎn)業(yè)視角,提供及時、專業(yè)、深度的前沿洞見、技術速遞、趨勢解析,鏈接產(chǎn)業(yè)資源,構(gòu)建IC生態(tài)圈,賦能中國半導體產(chǎn)業(yè),我們一直在路上。