隨著第五代英特爾至強(qiáng)可擴(kuò)展處理器(以下簡稱“第五代至強(qiáng)”)的問世,其也成為了多年來競爭最激烈的CPU市場的一員“大將”。
面對不斷變化的市場需求,芯片制造商憑借能夠為邊緣、云、AI和科學(xué)計算等應(yīng)用場景打造根據(jù)工作負(fù)載優(yōu)化的組件,也因此迎來了巨大的發(fā)展機(jī)遇。除了AMD、Ampere Computing和英偉達(dá)以外,主流云服務(wù)提供商對定制芯片的依賴性在增強(qiáng),例如亞馬遜的Graviton和微軟的Cobalt等芯片。
在接受The Register采訪時,英特爾至強(qiáng)產(chǎn)品和解決方案事業(yè)部總經(jīng)理Lisa Spelman不僅展示了英特爾數(shù)據(jù)中心正在以強(qiáng)大的執(zhí)行力穩(wěn)步前行,同時也分析了市場環(huán)境的變化,以及數(shù)據(jù)中心處理器產(chǎn)品路線圖的發(fā)展變化。
持續(xù)探索“完美”
第五代至強(qiáng)能夠?qū)崿F(xiàn)平均20%的性能提升,這在很大程度上要?dú)w功于增大三倍的三級緩存和簡化的芯粒(chiplet)架構(gòu),該架構(gòu)使用兩個die而不是上一代的四個。得益于上述變化,第五代至強(qiáng)的核心數(shù)提升至64個,這相比于主流第四代至強(qiáng)平臺的56個核心,有了顯著的改進(jìn)。
而這也源于英特爾獨(dú)特的策略,長期以來英特爾始終優(yōu)先考慮每個核心的性能而非核心數(shù)量,因此與AMD也有所不同。但從當(dāng)下的市場變化來看,尤其是以云端使用場景為例,客戶對于高核心數(shù)處理器的需求正愈發(fā)強(qiáng)烈。
Spelman表示,“客戶幾乎不會因為只考慮核心數(shù)量而不選擇英特爾的產(chǎn)品。但在面臨科學(xué)計算等對核心數(shù)量要求較高的工作負(fù)載時,具體還是要取決于客戶的實(shí)際工作負(fù)載和應(yīng)用程序運(yùn)行需求,并考慮處理器能否更好地融入現(xiàn)有系統(tǒng)。而且有很多至強(qiáng)處理器的優(yōu)勢是參數(shù)規(guī)格表無法直接體現(xiàn)的?!?/p>
現(xiàn)階段,英特爾也對多核處理器有所布局。Spelman指出,“我也正在推動至強(qiáng)產(chǎn)品路線圖朝著更高核心數(shù)量的方向發(fā)展,因為我確實(shí)希望能夠滿足那些客戶的需求。而且,如果一切進(jìn)展順利,英特爾的首款真正多核CPU(不包括至強(qiáng)融核處理器)將在核心數(shù)量和性能上都極具競爭力。”
代號為Sierra Forest的至強(qiáng)處理器計劃將在2024年上半年推出,其最多將具備288個能效核(E-core),比Ampere One的192核多50%。性能核(P-core)處理器Granite Rapids 也將緊隨其后發(fā)布,盡管現(xiàn)階段已知信息優(yōu)先,但可以預(yù)見的是,其也將擁有更高的核心數(shù)量、改進(jìn)的性能、以及在內(nèi)存和IO吞吐量上的大幅提升。
“我們正在推出性能核和能效核產(chǎn)品,也是源于我們對于市場發(fā)展的持續(xù)關(guān)注?!盨pelman說。
加碼云計算領(lǐng)域
隨著越來越多的云服務(wù)提供商轉(zhuǎn)向定制芯片,以及ARM推進(jìn)其稱為計算子系統(tǒng)(CSS)的shake-'n-bake CPU設(shè)計,英特爾也在持續(xù)加碼云計算市場。
作為定制芯片的代表,亞馬遜云科技擁有Graviton GPU,Trainium和Inferentia AI加速器,以及Nitro SmartNICs,但他們絕非唯一構(gòu)建自有芯片的公司。在業(yè)界討論了多年之后,微軟終于推出了其Cobalt 100 CPU,該CPU的部分基于ARM的CSS構(gòu)建模塊,并擁有128個處理器核心。
值得關(guān)注的是微軟對Arm CSS的使用,這是迄今為止Arm架構(gòu)在CPU設(shè)計中最趨于完整的體現(xiàn)。而對于Arm來說,其目標(biāo)顯然是吸引更多超大規(guī)?;A(chǔ)設(shè)施運(yùn)營商和云服務(wù)供應(yīng)商以CSS作為基礎(chǔ),進(jìn)而開發(fā)自己的定制化Arm CPU。
亞馬遜云科技和微軟并不是唯一選擇采用ARM核心的公司。據(jù)傳谷歌正在開發(fā)自己的芯片,代號為Maple,報道稱其將使用Marvell開發(fā)的設(shè)計。而甲骨文雖然并未構(gòu)建自己的定制CPU,但它在Ampere Computing的ARM兼容處理器上投入了大量資金。
Spelman表示,“盡管亞馬遜云科技的Graviton芯片在ARM生態(tài)系統(tǒng)擁有“不俗表現(xiàn)”,但我們在云計算領(lǐng)域的前景也無需過于擔(dān)憂。云服務(wù)提供商專注于以最有效的方式解決客戶問題,這意味著即使他們有自己的產(chǎn)品,我們的芯片也有可能會被采用?!?/p>
英特爾的前瞻規(guī)劃
盡管如期推進(jìn)至強(qiáng)產(chǎn)品路線圖面臨挑戰(zhàn),但Spelman表示,一些前瞻性規(guī)劃,特別是英特爾將AI加速功能適配到其CPU中的決定,已經(jīng)初顯成效。
Spelman指的是去年1月隨著第四代至強(qiáng)共同推出的高級矩陣擴(kuò)展(AMX)。AMX旨在加速常見的AI和機(jī)器學(xué)習(xí)推理工作負(fù)載,并減少對獨(dú)立加速器的需求。這也是英特爾最新發(fā)布的第五代至強(qiáng)的一大特色。第五代至強(qiáng)也對AMX加速引擎進(jìn)行了改進(jìn),并擁有更快的內(nèi)存和更大的緩存。得益于此,第五代至強(qiáng)現(xiàn)在可以以更低的延遲運(yùn)行更大的模型。
Spelman指出,“在異構(gòu)計算時代,市場對于CPU、GPU、AI加速期等的需求都同時存在,因此我們也采用‘多條腿走路’的計劃?!闭\如此前披露的信息,第五代至強(qiáng)能夠在可接受的延遲水平下承載參數(shù)量多達(dá)200億的大語言模型。而對于參數(shù)量更大的模型來說,專門的AI加速器更為理想。
回顧過往,Spelman表示對至強(qiáng)團(tuán)隊取得的進(jìn)展感到滿意?!皬念I(lǐng)導(dǎo)者的角度來看,我現(xiàn)在最大的目標(biāo)就是保持警惕?!?/p>