AI正在顛覆傳統(tǒng)算力市場。面向高性能、低能耗、多樣負載的數據中心新需求,如何打造一個高度通用的平臺,同時最大限度提高計算性能、降低功耗,成為英特爾鞏固數據中心CPU王者地位的關鍵。
一年一度的芯片頂會Hot Chips期間,英特爾揭秘了下一代數據中心CPU,可以看到,英特爾至強可擴展至強處理器正通過逐代升級,堅守AI時代的最佳CPU寶座。從英特爾官方釋出的信息來看,下一代至強引入了新的體系結構,在內存和I/O方面都進行了設計改進。
如何應對數據中心用戶新需求?
AI時代的數據中心用戶需求主要體現在以下四方面:對高性能單核CPU的需求持續(xù)增加;對提供更高密度和每瓦性能的CPU核需求不斷增長;新的工作負載,要求CPU核在性能、效率和密度之間進行權衡;擴展的模型部署需求,帶來功耗、I/O、帶寬和內存的增長。
這給數據中心CPU帶來哪些挑戰(zhàn)?最突出的問題就是,數據中心工作負載用例類型被極大地拓展了,既有計算密集型&AI工作負載,也有高密度和橫向擴展的工作負載,以及一般用途的工作負載。針對這些需求,英特爾在通用的平臺基礎和共享的軟件堆?;A之上,通過性能核(P-core)針對計算密集型和AI工作負載的性能進行了優(yōu)化,能效核(E-core)針對高密度和橫向擴展工作負載的能效進行了優(yōu)化。也就是說,將于2024年推出的下一代服務器平臺引入了全新的E-core,與已有P-core架構并存,共同為關鍵工作負載提供更好的性能和能效。
可擴展性、靈活性是下一代CPU關鍵
在新的架構體系下,“靈活性”被貫徹得很徹底,chiplet技術和EmiB封裝在其中發(fā)揮了重大作用。從下面框圖可以看出,多個獨立的計算chiplet和I/O chiplet,通過EmiB封裝(英特爾的2.5D先進封裝技術)在單一芯片中進行了集成,這種方式使得芯片結構更為靈活,實現了通用IP、固件、操作系統(tǒng)、平臺的有機整體,也再一次顯現了英特爾在計算架構和封裝技術上的累積效應。
未來的至強處理器(代號為Granite Rapids)引入了一種新的體系結構,包括在內存子系統(tǒng)、I/O等方面的創(chuàng)新。與之前的產品相比,該體系結構的邏輯單片計算集群提供了更好的每瓦性能和每線程性能,提供了必要的可擴展性、能效、性能和多功能性。
Granite Rapids專為多核性能敏感型工作負載和通用計算工作負載提供更好的TCO而優(yōu)化。并且在AI性能方面,Granite Rapids通過內置的加速器能夠為目標工作負載提供顯著的性能和效率提升。具體表現如下:
混合AI工作負載性能提高2-3倍(基于截至2023年8月21日的架構預測,與第四代英特爾至強可擴展處理器相比);
增強的英特爾AMX支持新的FP16指令;
針對計算密集型工作負載提供更高的內存帶寬、核心數和緩存;
插槽可擴展性,支持從一個插槽擴展至八個插槽。
代號為Sierra Forest的E-core至強處理器,是英特爾的首款E-core處理器,也將是首款采用Intel 3制程工藝的CPU。它在新的架構下,能夠提供密度優(yōu)化的計算性能達到節(jié)能目的,這對云原生和超大規(guī)模工作負載尤為關鍵。具體表現如下:
機架密度提升2.5倍,每瓦特性能提高2.4倍;
支持1路和2路服務器,每個CPU最多可達144核,TDP低至200瓦;
領先的指令集,具備強大的安全性、虛擬化和AI擴展的AVX;
每個至強可擴展處理器均標配的基本內存RAS功能,如機器檢查、數據緩存ECC。
據介紹,Sierra Forest計劃于2024年上半年交付,Granite Rapids也將緊隨其后。
此外,根據官方消息,代號為Emerald Rapids的第五代英特爾至強可擴展處理器已向客戶提供樣品,并計劃于2023年第四季度發(fā)布。從披露的信息來看,這一系統(tǒng)級芯片具備增強的可擴展性和靈活性。其創(chuàng)新架構提供兩種不同的插槽兼容處理器,使客戶能夠便捷處理大多數工作負載,且可互換使用,從而實現更高性價比。主要的技術特點包括:
性能核和能效核基于共享IP、固件和操作系統(tǒng)軟件堆棧;
高速DDR和全新高帶寬MCR DIMMs;
全新英特爾Flat Memory技術支持在DDR5和CXL內存之間進行硬件管理的數據傳輸,使總內存容量對軟件可見;
CXL 2.0支持所有設備類型,并兼容CXL 1.1;
領先的I/O,最多可達136條PCIe 5.0/CXL 2.0通道和最多六個UPI鏈路。
未來CPU需要多維創(chuàng)新
作為英特爾的王牌產品,英特爾至強可擴展處理器實現了一個又一個里程碑。據英特爾公司副總裁兼至強產品和解決方案事業(yè)部總經理Lisa Spelman介紹,英特爾近期出貨了第一百萬片第四代英特爾至強可擴展處理器,數據中心產品路線圖和產品也都在按計劃如期推進。
在今年3月的一場投資者會議上,英特爾執(zhí)行副總裁兼數據中心與人工智能事業(yè)部總經理Sandra Rivera表示,五年后,數據中心芯片市場的規(guī)模將達到1100億美元,是去年英特爾投資者大會上所預期市場規(guī)模的兩倍左右。
究其原因,實際上是不斷變化的數據中心市場格局擴大了針對CPU的需求,或者說,數據中心對計算的需求正在刷新。以往,業(yè)界常常通過CPU的出貨量來衡量市場規(guī)模。而現在,插槽數量并不能完全反映芯片創(chuàng)新為市場帶來的價值。如今,創(chuàng)新涉及多個維度,包括提高CPU內核的密度、使用芯片中的內置加速器,以及使用獨立加速器等,這些都一一在英特爾的至強處理器中得到了體現,也成為未來創(chuàng)新的關鍵驅動力。