加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 25%在售至強被用于AI負載
    • 第五代至強焦點:AI、每瓦性能、安全性、可部署性……
    • 2024年推出第六代至強:P-core和E-core全面覆蓋數(shù)據(jù)中心所需
    • 揭秘全新架構(gòu)設(shè)計過程
    • 至強已可運行200億參數(shù)AI大模型
    • 在加速計算的世界,CPU落伍了嗎?
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

訪英特爾:2024年是數(shù)據(jù)中心x86 CPU發(fā)展拐點

2023/09/27
3968
閱讀需 18 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

數(shù)據(jù)中心等應(yīng)用場景,英特爾至強可擴展處理器依然占據(jù)主導(dǎo)地位,該產(chǎn)品進展也被業(yè)界所關(guān)注。日前,在美國圣何塞舉行的“2023英特爾on技術(shù)創(chuàng)新大會”上,英特爾副總裁、至強產(chǎn)品和解決方案事業(yè)部總經(jīng)理Lisa Spelman,和英特爾資深院士、至強首席架構(gòu)師Ronak Singhal,接受了<與非網(wǎng)>和全球其他少數(shù)媒體的專訪,就未來至強的架構(gòu)細節(jié)、在AI時代的創(chuàng)新思路等進行了深入分析。

25%在售至強被用于AI負載

目前,英特爾至強可擴展處理器已經(jīng)進化到第四代,第五代至強將于今年12月14日(美國時間)發(fā)布。據(jù)Lisa Spelman透露,截止目前,英特爾已經(jīng)與所有領(lǐng)先的云服務(wù)提供商展開合作,打造多元化實例,并保障其基礎(chǔ)設(shè)施的可用性。并且,與英特爾合作的原始設(shè)備制造商也都在大批量出貨。由此可見,英特爾正在大規(guī)模推動第四代英特爾至強可擴展處理器的廣泛應(yīng)用。

在第三代至強時,很多性能都是針對多元化工作負載的,而在此基礎(chǔ)上,英特爾正在持續(xù)創(chuàng)新,特別是增強在人工智能領(lǐng)域的應(yīng)用?!拔覀兪冀K認為至強是適用于任何邊緣網(wǎng)絡(luò)、數(shù)據(jù)中心、云等工作負載的強有力產(chǎn)品,但同時,至強也具備諸多加速器和專業(yè)功能,以滿足人工智能工作負載的需求,這也日漸成為我們業(yè)務(wù)中越來越重要的一部分”,Lisa Spelman表示。

她透露,根據(jù)與客戶對一些工作負載、市場需求等分析發(fā)現(xiàn),25%在售的至強被用于人工智能工作負載。其中,很大一部分是用于推理,一小部分用于訓練。此外,許多至強產(chǎn)品還用于在訓練或推理之前的一些工作,如數(shù)據(jù)準備(包括為至強和GPU提供數(shù)據(jù))。未來,英特爾將持續(xù)推動至強系列的創(chuàng)新,以進一步增強在人工智能CPU市場的領(lǐng)先性。

第五代至強焦點:AI、每瓦性能、安全性、可部署性……

在至強處理器中引入AI加速器不僅意味著成本的變化,更會對產(chǎn)品的空間布局等帶來影響,這并非一件小事。

Lisa Spelman分享,團隊內(nèi)部確實對此有過激烈的討論,但最終,大家一致認為這個舉措將產(chǎn)生積極的影響,因此也將堅定不移地持續(xù)推進。在推動硬件革新的同時,英特爾也將更多精力投入到軟件更新中,以期實現(xiàn)更多指數(shù)級的變革。

關(guān)于即將發(fā)布的第五代至強(代號為Emerald Rapids)進展,Lisa Spelman介紹說,現(xiàn)階段正與客戶緊密合作完成測試、并為廣泛的系統(tǒng)應(yīng)用做準備。值得注意的是,它與上一代Sapphire Rapids使用同一平臺,是英特爾整個產(chǎn)品線歷史上最無縫的升級之一。

在海量數(shù)據(jù)、復(fù)雜數(shù)據(jù)處理等需求下,能源效率已成為現(xiàn)代云計算和數(shù)據(jù)中心高性能服務(wù)器處理器轉(zhuǎn)變設(shè)計的關(guān)鍵因素,也成為衡量處理器性能的重要指標,這顯然也是至強未來處理器的聚焦方向。

與前代產(chǎn)品相比,第五代至強將會在每瓦性能方面實現(xiàn)很大提升。Lisa Spelman解釋說,人們在談?wù)撔阅軙r,真正關(guān)注的其實是最大利用率,許多數(shù)據(jù)中心并沒有在任何硬件上真正以最大利用率每時每刻去運行。英特爾一直致力于提高不同工作負載或不同利用率水平下的性能、效率和功耗,這對于大型企業(yè)客戶以及流量變化很大的云服務(wù)提供商客戶來說至關(guān)重要,在多元化場景中的實際數(shù)據(jù)比產(chǎn)品的書面峰值數(shù)據(jù)更有價值。

此外,第五代至強還將進一步推進安全功能,比如持續(xù)擴大可信執(zhí)行環(huán)境的覆蓋范圍。作為機密計算的服務(wù)基礎(chǔ),這將更有助于增強硬件的安全性。該功能在第四代至強中面向一些頂級云服務(wù)商提供,第五代產(chǎn)品中則將推向整個市場。

下一代至強的關(guān)注重點還有可部署性。英特爾致力于讓所有數(shù)據(jù)中心客戶都能快速部署該產(chǎn)品,同時適用于上一代平臺的通用軟件堆棧。在具備這一優(yōu)勢的基礎(chǔ)上,升級將非常便捷。再從技術(shù)的角度來看,客戶將擁有更快的傳輸、更大的緩存等,所有這些改進都將為廣泛的工作負載帶來良好的性能提升。例如針對人工智能工作負載非常注重的內(nèi)存帶寬,第五代至強Emerald Rapids將通過支持DDR 5以滿足其需求。

2024年推出第六代至強:P-core和E-core全面覆蓋數(shù)據(jù)中心所需

在最近的Hot Chips上,我們注意到至強處理器引入了新的體系結(jié)構(gòu):Granite Rapids(性能核/P-core產(chǎn)品)和Sierra Forest(能效核/E-core產(chǎn)品)或?qū)⑹堑诹翉娮钪匾母隆?/p>

隨著客戶用例和應(yīng)用程序的日益多元化,對硬件基礎(chǔ)設(shè)施也提出了不同需求,至強正是致力于通過核心數(shù)量、功率、能耗等變化,來滿足市場和客戶實際工作負載需求。英特爾將引入下一代代號為“Birch Stream”的創(chuàng)新平臺,該平臺支持兩種不同類型的至強處理器:其一是Granite Rapids,也就是第四代至強(Sapphire Rapids)、第五代至強(Emerald Rapids)再向后的產(chǎn)品迭代,Granite Rapids會作為典型的至強產(chǎn)品演進,誕生出下一代P-core性能核處理器,將繼續(xù)主要圍繞內(nèi)存、核數(shù)、I/O等進行產(chǎn)品升級。

值得注意的是,關(guān)于Granite Rapids的產(chǎn)品升級有兩個要點:一是如何增強算力。其中最重要的是在第四代至強基礎(chǔ)上增加了核數(shù),以及繼續(xù)提高能效。因為進行大量AI矩陣計算時,耗電量會大幅提升,提升產(chǎn)品能效會直接改善性能底線。將AMX集成至處理器進一步加強了的產(chǎn)品競爭力。二是內(nèi)存帶寬。部分AI工作負載以計算為核心,因此將受到核數(shù)和能效的影響。還有部分大語言模型,需要處理包括計算、存儲等AI工作負載,因此對內(nèi)存帶寬亦提出了要求。

其二是明年將推出的第一款基于E-core能效核的產(chǎn)品,與Granite Rapids相比,Sierra Forest的核心更節(jié)能,且面積較小,因此,可以在相同功耗下進行擴展、并增加核數(shù),最高可達288核。

也就是說,針對數(shù)據(jù)中心日益豐富的工作負載和用例類型,英特爾將通過性能核(P-core)對計算密集型和AI工作負載進行優(yōu)化,能效核(E-core)則將針對高密度和橫向擴展工作負載的能效進行優(yōu)化。

揭秘全新架構(gòu)設(shè)計過程

打磨一款好產(chǎn)品需要足夠的時間周期,那么,英特爾是如何預(yù)判人工智能對數(shù)據(jù)中心處理器帶來的挑戰(zhàn)?在設(shè)計至強產(chǎn)品路線圖時,又有哪些主要的考慮因素?

據(jù)透露,英特爾幾年前就決定將加速人工智能計算的能力嵌入到至強的每個核心中。Ronak Singhal表示,這樣做的好處就是,之前的幾代產(chǎn)品和競爭對手相比,性能均得到顯著提升,并且英特爾將在此基礎(chǔ)上持續(xù)創(chuàng)新,這是至強產(chǎn)品路線圖的核心考慮因素。也正是如此,第四代至強(Sapphire Rapids)在工作負載的廣度和深度方面都得到了極大拓展。

Ronak Singhal分享,在長期傾聽客戶反饋的過程中,英特爾發(fā)現(xiàn)有一個相同的疑問,即:為什么x86與Arm相比,效率如此低下?他解釋說,事實并非如此,因為指令集架構(gòu)并不是決定效率的因素,而是構(gòu)建產(chǎn)品的方式。當Sierra Forest推出后,相信業(yè)界會看到它領(lǐng)先的性能和密度。

以核心數(shù)為例,誰最需要超大量的核心數(shù)?云服務(wù)提供商們正在嘗試將盡可能多的用戶整合到一個系統(tǒng)上,因為這能幫助他們減少所需的系統(tǒng)數(shù)量,從而降低TCO,大核數(shù)的CPU(Sierra Forest)正好可以幫助他們;如果他們需要每個核心擁有最佳性能,他們則可以選擇Granite Rapids。這兩者是相輔相成的。

再從部署能力來看,如果客戶需要投資構(gòu)建平臺,但遲遲無法決定是50%的Granite Rapids加50%的Sierra Forest?還是一方為0,一方為100%?亦或是完全混合?他指出,一切最終由具體的工作負載或最終客戶來決定,未來的至強可以提供足夠的靈活性,不僅平臺相同,核心之外的其他SoC也相同,這將帶來非常高的靈活度。

打造未來的數(shù)據(jù)中心處理器本身就是一項艱巨而復(fù)雜的任務(wù),而英特爾還打算明年推出兩款CPU,看似是一件挑戰(zhàn)加倍的事。

談及新產(chǎn)品的構(gòu)建過程,Ronak Singhal表示一是基于 chiplet(芯粒)的方式,二是讓兩款處理器盡量共享更多的設(shè)計。從下圖可知,頂部和底部的chiplet,就是我們所說的I/O chiplet,包括 PCIe、CXL 等。這些功能在 Sierra Forest 和 Granite Rapids 之中都很常見。英特爾不會對這些功能以及安全性或可靠性進行區(qū)分和更改,不同產(chǎn)品的區(qū)別在于所使用的核心,以及根據(jù)密度和每核性能所擁有的擴展能力。


產(chǎn)品的核數(shù)實際上就是集合多少個chiplet,可以根據(jù)實際需求,采用更多或更少的chiplet,來擴大或減少核心數(shù)量。顯然,chiplet的方式既實現(xiàn)了構(gòu)建芯片的靈活性,同時也有助于提升制造能力,可以是組合不同類型或是不同尺寸大小的chiplet。

此外,EmiB封裝(英特爾的2.5D先進封裝技術(shù))也發(fā)揮了重大作用。通過EmiB封裝,多個獨立的計算chiplet和I/O chiplet,在單一芯片中進行了集成,使得芯片結(jié)構(gòu)更為靈活,實現(xiàn)了通用IP、固件、操作系統(tǒng)、平臺的有機整體。

內(nèi)存方面,英特爾優(yōu)化了DDR5內(nèi)存速度,并將首次支持名為MCR的新內(nèi)存技術(shù),能以與DDR5相同的形態(tài)和互連方式,支持更高的內(nèi)存帶寬,并在HPC和AI等領(lǐng)域發(fā)揮價值。

“這一切功能都將在Sierra Forest和Granite Rapids上共同實現(xiàn)。因此,我認為明年將是基于該產(chǎn)品組合的數(shù)據(jù)中心發(fā)展拐點”,Ronak Singhal表示。

至強已可運行200億參數(shù)AI大模型

最新的關(guān)于第四代至強與競品的實測數(shù)據(jù)顯示,至強性能比第四代至強發(fā)布時得到了進一步提高。Lisa Spelman表示,這主要是得益于在軟件方面的努力,軟硬結(jié)合可以更好地解鎖性能。

大約6個月前,英特爾開始在至強上分析和研究生成式AI,當時可以在50億或70億參數(shù)的大模型上實現(xiàn)較好的TCO和效率,通過采用一些框架、對軟件進行調(diào)整和優(yōu)化后,這個數(shù)字提升到了100億。而現(xiàn)在,至強的能力已經(jīng)接近200億參數(shù)的AI大模型,據(jù)透露,當前英特爾實驗室正在研究300億參數(shù)AI大模型的運行。

“我們努力在2024年想要實現(xiàn)的目標,包括提供針對計算密集型工作負載的產(chǎn)品,以及針對生成式AI的卓越性能,從而抓住市場機遇,滿足客戶的真實需求”, Lisa Spelman強調(diào)。

在加速計算的世界,CPU落伍了嗎?

在AI的風口之下,特別是隨著生成式AI迅速占據(jù)業(yè)界頭條,采用加速計算顛覆傳統(tǒng)數(shù)據(jù)中心的呼聲越來越高。<與非網(wǎng)>在采訪中提出:以英偉達為例,就在大力倡導(dǎo)并率先進軍加速計算數(shù)據(jù)中心。英特爾是如何看待加速計算的?對CPU層面又有哪些影響?

Ronak Singhal表示,AI的發(fā)生不僅在各類加速器上,更在我們“老生常談”的CPU上。實際上,眼下大部分的推理工作都是在CPU上運行的,也可以說是每個工作負載都將嵌入一部分AI工作負載,這意味著每次運行任何工作時,幾乎都需要CPU進行處理。

“我們始終相信CPU上的推理是非常有價值的,也是極其普遍的。為了讓其在CPU上運行,我們需要繼續(xù)討論‘加速’。我們一直在探索,如何去提高CPU的能力,使它始終是運行這些推理工作負載的最佳載體。當然這并不意味著沒有加速器施展拳腳的空間。對于那些需要專門加速器的任務(wù),還是會由加速器來運行”,他補充,“根據(jù)我們眼下所觀察到的一切,包括算法的發(fā)展方向以及實際案例來看,在CPU上運行AI工作負載擁有顯著優(yōu)勢,包括更低的延遲以及更高的能效。想象一下,來回在CPU和加速器之間移動數(shù)據(jù)造成的能耗,我認為避免這種數(shù)據(jù)傳輸可以極大地降低能源消耗,這也是CPU的一個顯著優(yōu)勢?!?/p>

Lisa Spelman則強調(diào),英特爾對目前所擁有的針對AI的CPU硬件產(chǎn)品路線圖感到非常滿意,根據(jù)眾多客戶反饋來看,他們正朝著一個正確的方向去挖掘產(chǎn)品特性和定位產(chǎn)品。

此外,她強調(diào)了AI時代軟件的重要性。顯然,英特爾正在把越來越多的精力轉(zhuǎn)向軟件,這是因為硬件固然非常重要,但也需要在軟件方面努力,以便讓整個市場更容易、更便捷地獲取、利用CPU的能力。例如Oracle數(shù)據(jù)庫之類的標準應(yīng)用,也是花了數(shù)年時間來構(gòu)建生態(tài)系統(tǒng),以確保每一代產(chǎn)品用戶都能充分利用到產(chǎn)品性能。

此外,可部署性也是未來構(gòu)建AI生態(tài)的關(guān)鍵。對于云服務(wù)商、高性能計算中心來說,他們往往擁有足夠的人才和技術(shù),可以很好地解決問題并部署AI。但是對于一些對大模型有巨大需求的企業(yè)或網(wǎng)絡(luò)運營商來說,整合更多消費級的軟件對他們來說非常重要,不論他們是用于構(gòu)建自己的數(shù)據(jù)中心,還是將其作為基礎(chǔ)設(shè)施的一部分去提供服務(wù)。

基于上述原因,Lisa Spelman表示,英特爾在軟件方面投入了大量精力,這對于至強以及英特爾來說可以算是“標準操作”了。英特爾希望通過構(gòu)建強大的生態(tài)系統(tǒng),讓下一代技術(shù)更好地服務(wù)產(chǎn)業(yè)。

此外,英特爾正在擴大組織規(guī)模,以及通過各種不同的方式與客戶進行合作,這使其夠進行一些很有意義的客戶對話,譬如探討大家是如何看待市場的、英特爾可以在哪方面匹配他們的基礎(chǔ)設(shè)施,以及了解一些大客戶如何調(diào)整他們的基礎(chǔ)設(shè)施等等,來更好地匹配英特爾的未來產(chǎn)品。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
MPC5554MZP132 1 Freescale Semiconductor 32-BIT, FLASH, 132MHz, MICROCONTROLLER, PBGA416, 27 X 27 MM, 1 MM PITCH, PLASTIC, MS-034AAL-1, TEBGA-416
$80.8 查看
ATMEGA64A-AU 1 Atmel Corporation RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM HEIGHT, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64

ECAD模型

下載ECAD模型
$4.99 查看
MCF5282CVM66J 1 Freescale Semiconductor IC,MICROCONTROLLER,32-BIT,COLDFIRE CPU,CMOS,BGA,256PIN,PLASTIC
暫無數(shù)據(jù) 查看
英特爾

英特爾

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~