作者:豐寧
在數(shù)字化浪潮的推動下,服務(wù)器市場持續(xù)蓬勃發(fā)展,各大廠商紛紛加大投入,力求在這場激烈的競爭中占據(jù)一席之地。
01、服務(wù)器市場,強勁增長
AI的到來,引爆了服務(wù)器市場。TechInsights最新數(shù)據(jù)顯示,到2028年,服務(wù)器市場規(guī)模將達到2730億美元,年復(fù)合增長率為18%。要知道,在2022年,全球服務(wù)器市場規(guī)模為1215.8億美元,這一數(shù)值在當(dāng)下時點已不容小覷,然而這僅僅是2028年的一半。到2028年,專為AI應(yīng)用設(shè)計的服務(wù)器將占市場份額的59%,復(fù)合年增長率為49%。
再看中國市場。中國正成為全球最主要的服務(wù)器增長市場。2021年中國服務(wù)器市場規(guī)模達到250.9億美元;2022年中國服務(wù)器市場規(guī)模為273.4億美元。根據(jù)IDC、浪潮信息、清華大學(xué)全球產(chǎn)業(yè)研究院聯(lián)合編制的《2022—2023全球計算力指數(shù)評估報告》顯示,2022年,中國整體服務(wù)器市場規(guī)模保持6.9%的正增長,占全球市場比重達25%,2017年至2022年的復(fù)合增長率達48.8%。AI服務(wù)器方面,IDC預(yù)計2023年中國AI服務(wù)器市場規(guī)模將達到91億美元,同比增長82.5%;2027年將達到134億美元,年均復(fù)合增長率為21.8%。在服務(wù)器市場持續(xù)繁榮的當(dāng)下,CPU的地位愈發(fā)凸顯。CPU作為其核心部件,其性能和功耗直接影響著服務(wù)器的整體表現(xiàn),也因此成為市場關(guān)注的焦點。
02、服務(wù)器CPU架構(gòu)之爭
與GPU不同,CPU主要完成的是通用計算和邏輯控制的工作,打個比方,如果GPU是一個高效的執(zhí)行者,那么CPU可以看做一個能力全面的調(diào)度者。CPU作為計算機系統(tǒng)運算和控制的核心,是信息處理、程序運行的最終執(zhí)行單元。目前CPU行業(yè)主要由三大生態(tài)體系主導(dǎo):一是基于x86指令系統(tǒng)和Windows操作系統(tǒng)的Wintel體系,主要用于服務(wù)器與電腦等;在Wintel體系中,CPU廠商生產(chǎn)芯片,操作系統(tǒng)廠商提供操作系統(tǒng)。
二是基于Arm指令系統(tǒng)和Android操作系統(tǒng)的AA體系,主要用于低功耗和高度節(jié)能的應(yīng)用,例如云計算服務(wù)器和邊緣計算設(shè)備。在AA體系中,CPU廠商對芯片或系統(tǒng)廠商進行指令系統(tǒng)或IP核授權(quán),操作系統(tǒng)廠商提供基礎(chǔ)版操作系統(tǒng),由整機廠商定制專用芯片和發(fā)行版操作系統(tǒng)。在算力多元化的新時代,盡管x86架構(gòu)依然占據(jù)著服務(wù)器CPU市場超九成的份額,穩(wěn)坐行業(yè)巨頭之位,但競爭從未停止。
近年來,ARM也正加速進入服務(wù)器領(lǐng)域,這一表現(xiàn)在中國市場尤為明顯。按照Gartner的數(shù)據(jù),2023年一季度全球Arm服務(wù)器出貨量占比是7%,如果以全球出貨量330.5萬臺來估算,那么Arm服務(wù)器出貨量大約在23.135萬臺左右,其中約40%即9.254萬臺是出口到了中國市場,在中國服務(wù)器市場整體出貨量達89.7萬臺的背景下,占到了10.32%。除了我們熟知的x86和Arm,RISC-V這一新興架構(gòu)正以其開放、靈活的特性,為服務(wù)器芯片提供更加廣闊的發(fā)展機遇。RISC-V以其模塊化、可擴展的設(shè)計,允許開發(fā)者根據(jù)具體需求定制指令集,從而打造出高效、節(jié)能且高度適配特定應(yīng)用場景的服務(wù)器芯片。一起看看不同賽道的競爭格局。?
03、服務(wù)器CPU芯片,激戰(zhàn)打響x86架構(gòu)
首先看x86架構(gòu)?;趚86架構(gòu)的服務(wù)器CPU市場中的主要玩家有英特爾、AMD以及中國大陸的海光、兆芯等。AMD在最近幾年的表現(xiàn)極為強勁。根據(jù)MercuryResearch最新發(fā)布的x86處理器市場份額數(shù)據(jù)顯示,2024年第一季度AMD在服務(wù)器、桌面和移動端均獲得了更高的市場份額,分別達23.6%、23.9%、19.3%。值得注意的是,在2021年第一季度AMD服務(wù)器市場份額只有8.9%。英特爾是x86服務(wù)器CPU領(lǐng)域毫無爭議的霸主,不過,即便是有著多年深厚積累的英特爾,也不得不面對來自AMD的市場侵蝕。國產(chǎn)廠商海光主攻服務(wù)器芯片,而兆芯則個人PC、服務(wù)器都有涉及。海光信息是國產(chǎn)高端CPU的領(lǐng)軍者。海光CPU主要面向復(fù)雜邏輯計算、多任務(wù)調(diào)度等通用處理器應(yīng)用場景需求,兼容國際主流x86處理器架構(gòu)和技術(shù)路線。海光CPU已經(jīng)有海光一號、海光二號、海光三號實現(xiàn)商業(yè)化,公司目前在售的海光CPU產(chǎn)品主要為海光三號。
從應(yīng)用場景角度看,公司將海光CPU產(chǎn)品分為7000、5000和3000三個系列,不同系列具有不同的性能。7000系列主要應(yīng)用于高端服務(wù)器,主要面向數(shù)據(jù)中心、云計算等復(fù)雜應(yīng)用領(lǐng)域。5000系列主要面向政務(wù)、企業(yè)和教育領(lǐng)域的信息化建設(shè)中的中低端服務(wù)器需求。3000系列主要應(yīng)用于工作站和邊緣計算服務(wù)器,面向入門級計算領(lǐng)域。
其中7000系列CPU是海光收入的主要構(gòu)成。兆芯也是x86服務(wù)器CPU市場的參與者,目前兆芯已經(jīng)形成了開先系列桌面處理器和開勝系列服務(wù)器處理器兩大產(chǎn)品線。服務(wù)器處理器的產(chǎn)品系列有開勝KH-40000系列處理器、開勝KH-30000系列處理器、開勝KH-20000系列處理器、開勝ZX-C+FC-1080/1081系列處理器。
開勝 KH-40000系列服務(wù)器處理器,采用“永豐”自主內(nèi)核微架構(gòu),支持自主互連技術(shù)ZPI3.0,單顆處理器集成最高32核心,具備64MB高速緩存,支持8通道DDR4內(nèi)存,適用于云計算、大數(shù)據(jù)分析、視頻處理、數(shù)據(jù)庫備份、高性能存儲,以及超融合一體機等解決方案的搭建和部署?;趚86架構(gòu)和生態(tài)優(yōu)勢,兆芯在黨政和商用領(lǐng)域應(yīng)用廣泛,尤其在PC產(chǎn)業(yè)上使用Wintel生態(tài),優(yōu)勢明顯。
不過由于架構(gòu)版權(quán)問題,導(dǎo)致兆芯過去的產(chǎn)品性能相較同期競品仍有所差距;在后續(xù)的推進中,兆芯不僅著眼于性能優(yōu)化,還堅定地致力于提升自主可控能力,奮力追趕行業(yè)步伐。今年年初,基于兆芯自研處理器開勝KH-40000/32的雙路通用超云服務(wù)器正式落地,型號為R3210Z11。隨著中國政府對半導(dǎo)體產(chǎn)業(yè)的持續(xù)支持,以及國內(nèi)外市場需求的增長,兆芯CPU有望在全球CPU市場中占據(jù)一席之地。
Arm架構(gòu)入局者愈來愈多
再看Arm架構(gòu)。基于Arm架構(gòu)的服務(wù)器CPU市場中的主要玩家有華為鯤鵬、飛騰等。在通用計算處理器領(lǐng)域,華為鯤鵬在2014年發(fā)布鯤鵬912處理器,2016年發(fā)布鯤鵬916處理器。2019年1月華為正式發(fā)布鯤鵬920芯片。鯤鵬920是目前業(yè)界領(lǐng)先的ARM-based處理器。
該處理器采用7nm制造工藝,由華為公司自主設(shè)計完成。通過優(yōu)化分支預(yù)測算法、提升運算單元數(shù)量、改進內(nèi)存子系統(tǒng)架構(gòu)等一系列微架構(gòu)設(shè)計,大幅提高處理器性能。典型主頻下,SPECintBenchmark評分超過930,超出業(yè)界標(biāo)桿25%。同時,能效比優(yōu)于業(yè)界標(biāo)桿30%。鯤鵬920以更低功耗為數(shù)據(jù)中心提供更強性能。得益于強大的計算能力、高并發(fā)處理能力和優(yōu)秀的能效比,鯤鵬服務(wù)器主要應(yīng)用于云計算、大數(shù)據(jù)分析、數(shù)據(jù)庫、AI訓(xùn)練與推理等多種場景,并構(gòu)建了從底層芯片到操作系統(tǒng)、再到上層應(yīng)用軟件的全棧國產(chǎn)化解決方案。
中國移動2021-2022年P(guān)C服務(wù)器集采項目中,采用海光芯片的服務(wù)器達59982臺,占比20.90%,采用鯤鵬芯片的服務(wù)器達58901臺,占比20.53%,鯤鵬與海光服務(wù)器招標(biāo)數(shù)量接近1:1,整體國產(chǎn)服務(wù)器占比高達41.43%。不僅是中國移動,在中國電信AI算力服務(wù)器(2023-2024年)集采項目中,國產(chǎn)服務(wù)器的采購數(shù)量占比亦達47.5%。從金額來看,超80億元的采購總額中,鯤鵬服務(wù)器約占28億元。今年3月,中國移動2024年P(guān)C服務(wù)器集采中標(biāo)公告顯示,華為鯤鵬再次占據(jù)較大份額。飛騰是PKS(飛騰P、麒麟K、安全S)生態(tài)體系主導(dǎo)者,其黨政市場占有率高。飛騰芯片產(chǎn)品具有譜系全、性能高、生態(tài)完善、自主化程度高等特點,目前主要包括高性能服務(wù)器CPU(飛騰騰云S系列)、高效能桌面CPU(飛騰騰銳D系列)、高端嵌入式CPU(飛騰騰瓏E系列)和飛騰套片四大系列,為從端到云的各型設(shè)備提供核心算力支撐?;陲w騰CPU的產(chǎn)品在國內(nèi)政務(wù)辦公、金融、電信、電力、能源、軌交、教育和醫(yī)療等行業(yè)信息系統(tǒng)領(lǐng)域已實現(xiàn)批量應(yīng)用。
同時,飛騰聯(lián)合5000家生態(tài)伙伴,打造3200余種硬件方案,適配近30000款軟件,兼容200萬級移動APP,構(gòu)建了國內(nèi)最龐大的信息產(chǎn)業(yè)生態(tài),有力支撐了中國自主信息體系的發(fā)展。飛騰在全國政府信創(chuàng)中標(biāo)超過300萬片,市占率超過50%,有力支撐了國家信創(chuàng)工程推進,并逐步向更復(fù)雜的電子政務(wù)、智慧政府領(lǐng)域延伸。在電信行業(yè),搭載飛騰CPU的服務(wù)器在三大運營商的云資源池中得到廣泛部署,服務(wù)了大量國產(chǎn)化項目。
近年來,ARM架構(gòu)的興起下,許多巨頭紛紛開始自研ARM架構(gòu)的服務(wù)器芯片,包括國外的亞馬遜、谷歌甚至微軟,國內(nèi)的騰訊、阿里巴巴等。ARM能夠擠進服務(wù)器市場的核心優(yōu)勢在于,基于ARM的服務(wù)器可以支持多樣化和快速變化的工作負載,并且更具可擴展性和成本效益;
其次,對于不同的利基型市場能夠提供更高的定制化,生態(tài)系統(tǒng)也更靈活;
另外,ARM架構(gòu)服務(wù)器體積相對較小,符合現(xiàn)今微型數(shù)據(jù)中心的需求。技術(shù)變化帶來的機會是全球性的,不限于地域,不限于公司規(guī)模,除了這些龍頭企業(yè)還有諸多初創(chuàng)公司邁進ARM CPU的圈子,包括啟靈芯、鴻鈞微、遇賢微等。
然而,Arm在服務(wù)器CPU這條道路上還有很多困難需要面對,在這之中自然也有不少初創(chuàng)公司倒在這波熱潮中,比如前面提到的啟靈芯。這些公司需要克服技術(shù)、市場、生態(tài)等多方面的挑戰(zhàn),才能在競爭激烈的服務(wù)器市場中立足。
自研指令集的龍芯和申威
除了以上兩大架構(gòu),中國芯片市場還有一些廠商通過其他架構(gòu)不斷研發(fā)與創(chuàng)新并取得了不錯的成績,比如分別走MIPS、Alpha路線的龍芯中科和申威,他們不僅通過獨特的架構(gòu)設(shè)計推出了高性能的芯片產(chǎn)品,而且在自主可控方面也取得了較高的水平。龍芯中科是中國科學(xué)院計算所自主研發(fā)的通用CPU,采用自主LoongISA指令系統(tǒng),兼容MIPS指令,所有IP模塊皆為自主設(shè)計,擁有片內(nèi)安全機制,可信性高。龍芯處理器以32位核64位單核及多核CPU/SOC為主,主要面向高端嵌入式、個人電腦、服務(wù)器和高性能機等應(yīng)用。龍芯產(chǎn)品體系分為三大系列,龍芯1號系列為低功耗、低成本的專用嵌入式SoC或MCU處理器,主要面向嵌入式專用應(yīng)用領(lǐng)域,如物聯(lián)終端、儀器設(shè)備、數(shù)據(jù)采集等,主要根據(jù)需求定制;龍芯2號系列為低功耗通用處理器,采用單芯片SoC設(shè)計,應(yīng)用場景面向工業(yè)控制與終端等領(lǐng)域,如網(wǎng)絡(luò)設(shè)備、行業(yè)終端、智能制造等,定位于Intel的凌動系列;龍芯3號系列為高性能通用處理器,通常集成4個及以上64位高性能處理器核,與橋片配套使用,應(yīng)用場景面向桌面和服務(wù)器等信息化領(lǐng)域,對標(biāo)Intel的酷睿/至強系列。申威處理器以Alpha指令集為基礎(chǔ)進行拓展,高度自主可控。申威在研發(fā)出第一代基于Alpha指令集的CPU后,將指令集替換為自研的自主可控申威64位指令集,完全區(qū)別于原有Alpha指令集。申威處理器專注于高性能計算,尤其是在服務(wù)器領(lǐng)域,浮點運算算力與同期外國處理器相當(dāng)。申威SW26010是中國首個采用國產(chǎn)自研架構(gòu)且性能強大的計算機芯片。申威在服務(wù)器領(lǐng)域向上至超算領(lǐng)域的應(yīng)用場景中性能強大,優(yōu)勢較為明顯。2016年6月20日,搭載了40960顆申威SW26010并運行國產(chǎn)操作系統(tǒng)神威睿思的神威太湖之光獲得全球超級計算機第一名,神威太湖之光峰值計算速度達每秒12.54億億次,是全球首臺峰值計算速度超過十億億次的超級計算機,持續(xù)性能為每秒9.3億億次,軟件硬件并行,均為申威自主設(shè)計。?
04、越來越多廠商擁抱RISC-V
RISC-V架構(gòu)在最近兩年異?;馃?。一位三年前重點關(guān)注ArmCPU創(chuàng)業(yè)公司的投資人表示:“我很久沒看ArmCPU的創(chuàng)業(yè)公司了,現(xiàn)在CPU的創(chuàng)業(yè)方向是RISC-V?!盧ISC-V如何成為一眾廠商的追捧呢?中國工程院院士倪光南在達摩院玄鐵RISC-V生態(tài)大會上提到,對比x86,RISC-V可能從以下兩個方面實現(xiàn)超越:
其一,今天x86架構(gòu)仍壟斷著服務(wù)器和桌面領(lǐng)域,這是因為過去幾十年里,x86架構(gòu)在這些領(lǐng)域形成了強大的生態(tài),以至于其他架構(gòu)因生態(tài)較為薄弱而不能取代它,假以時日這種情況會發(fā)生變化。另一方面,現(xiàn)在的x86架構(gòu)也已經(jīng)不是純粹的CISC了,實際上在它內(nèi)部也用硬件將某些CISC指令轉(zhuǎn)化為它內(nèi)部的RISC指令再予以執(zhí)行。
其二,?在后PC時代,CPU架構(gòu)的競爭力不僅要體現(xiàn)在性能上,還需在芯片面積、能耗、價格、研發(fā)周期、生態(tài)支持等等方面全方位地體現(xiàn)出來。以此衡量,x86架構(gòu)不但在新興領(lǐng)域沒有優(yōu)勢,而且在傳統(tǒng)領(lǐng)域市場總量也不會有多大增長,甚至其份額也可能被RISC-V所蠶食。從市場的視角審視,RISC-V不僅契合了中國對于芯片自主研發(fā)與掌控的戰(zhàn)略需求,同時也為專用服務(wù)器市場帶來了前所未有的定制化機遇。隨著技術(shù)發(fā)展的深入,當(dāng)傳統(tǒng)CPU的性能提升遭遇瓶頸時,市場將逐漸轉(zhuǎn)向更為精細化和專業(yè)化的定制化需求,這將成為RISC-V服務(wù)器進一步拓展其應(yīng)用領(lǐng)域的契機。
目前國內(nèi)外已有不少公司進入了RISC-V服務(wù)器賽道,不過其中部分公司主要涉及服務(wù)器中的AI加速芯片。IP公司包括阿里達摩院、SiFive、Ventana、Tenstorrent等;芯片公司包括算能、進迭時空、希姆計算、藍芯算力、微核芯、超??萍嫉?。2019年7月,阿里達摩院面向高性能市場發(fā)布了RISC-V處理器核—玄鐵C910,后來基于玄鐵C910設(shè)計了曳影1520SoC。2021年12月,SiFive發(fā)布了IP核P650,據(jù)了解,該產(chǎn)品配有128KB一級緩存、2MB二級緩存、16MB三級緩存(16核)等配置,性能指標(biāo)為11.xSPECInt/GHz,對標(biāo)ARMCortex-A77,可用于數(shù)據(jù)中心等場景。去年3月,北京算能科技發(fā)布了首款國產(chǎn)64核RISC-V服務(wù)器處理器SOPHONSG2042,隨后在8月的第三屆滴水湖中國RISC-V產(chǎn)業(yè)論壇上又首次披露了其新一代的RISC-V服務(wù)器芯片——SOPHONSG2044的相關(guān)信息。
VentanaMicroSystems成立于2018年,總部位于美國庫比蒂諾。2022年12月,Ventana公司就曾發(fā)布了全球首款基于RISC-V架構(gòu)的服務(wù)器CPU——VeyronV1。而在2023RISC-V峰會上,Ventana又發(fā)布了其第二代服務(wù)器CPU——VeyronV2,在指令擴展、內(nèi)核設(shè)計、互聯(lián)標(biāo)準(zhǔn)、制程工藝等眾多方面進行了全面升級,官方宣稱其性能超越了AMD的高端服務(wù)器芯片Epyc9754,堪稱最強RISC-V服務(wù)器CPU。
目前,開源RISC-V在中國具有超大規(guī)模的市場、豐富的應(yīng)用場景和龐大的工程師群體推動下,已成為中國最受歡迎的CPU芯片架構(gòu)之一。然而RISC-V和x86、ARM生態(tài)上還是有一些差距,無論從軟件規(guī)模上還是性能優(yōu)化程度上,都還沒有達到x86和ARM的水平。因此,RISC-V進入服務(wù)器市場還存在諸多挑戰(zhàn)。從創(chuàng)新性、成本乃至性能等角度來看,其實Arm以及未來的RISC-V都會是極具競爭力的服務(wù)器CPU架構(gòu),可現(xiàn)今的服務(wù)器仍是一個固執(zhí)且切入周期較長的市場,x86目前尚未觸及設(shè)計和工藝的瓶頸,即便有了AI加速器、DPU等組件的加入,服務(wù)器架構(gòu)并沒有發(fā)生劇變,所以x86在未來的十年內(nèi)依然將占據(jù)主導(dǎo)地位。
只不過隨著設(shè)計方法、制造工藝的同步,Arm已經(jīng)在該領(lǐng)域開啟了較為成熟的商業(yè)化進程,隨著時間的推移,市場份額會逐漸升高。倪光南曾多次表示,中國在芯片產(chǎn)業(yè)發(fā)展過程中應(yīng)當(dāng)重視RISC-V架構(gòu)。至于何時RISC-V能真正有望來到“三分天下”,業(yè)內(nèi)人士表示如果Arm授權(quán)體系出現(xiàn)一些變數(shù),同時RISC-V的高性能進展更順利、核性能提升很快,生態(tài)進展也很順利的前提下,很快Arm就會與RISC-V正面交鋒。當(dāng)然,RISC-V作為后來者,面臨的挑戰(zhàn)還有很多。除了生態(tài)構(gòu)建依然在完善進程中,這種開源架構(gòu)也要避免類似此前MIPS架構(gòu)所帶來的分散化、碎片化難題。?
05、國產(chǎn)CPU迎來窗口期
中信證券表示,未來三年可能是國產(chǎn)算力芯片發(fā)展關(guān)鍵窗口期,目前國產(chǎn)算力硬件理論性能可接近國際主流,“生態(tài)優(yōu)勢有望形成正反饋循環(huán),進而支撐市場地位持續(xù)領(lǐng)先”。在2023年11月28日舉行的2023龍芯產(chǎn)品發(fā)布暨用戶大會上,新一代通用處理器龍芯3A6000發(fā)布。北京市經(jīng)信局副局長顧瑾栩表示,龍芯此次發(fā)布的自主通用處理器3A6000性能追平國際先進水平,作為北京市技術(shù)創(chuàng)新企業(yè)的代表,其全面發(fā)力加速實現(xiàn)自主信息技術(shù)的重大跨越,為實現(xiàn)科技自立自強提供堅實支撐。
工業(yè)和信息化部電子信息司副司長史惠康表示,3A6000處理器的推出說明國產(chǎn)CPU在自主可控程度和產(chǎn)品性能上已雙雙達到新高度,也證明了國內(nèi)有能力在自研CPU架構(gòu)上做出一流的產(chǎn)品。并希望能加快先進封裝、內(nèi)存一體化集成等相關(guān)的技術(shù)攻關(guān),不斷推出具有國際競爭力的產(chǎn)品。