加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

英特爾重磅發(fā)布全新數據中心處理器,為數字經濟發(fā)展增添新動力

2023/01/12
1223
閱讀需 29 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

今日,以“芯加速 行至遠”為主題的第四代英特爾?至強?新品發(fā)布會在北京正大中心盛大舉行。會上,英特爾正式推出第四代英特爾?至強?可擴展處理器(代號“Sapphire Rapids”)、英特爾?至強?CPU Max系列(代號“Sapphire Rapids HBM”)以及英特爾?數據中心GPU Max系列(代號“Ponte Vecchio”),在實現數據中心性能、能效和安全性大幅躍升的同時,為AI、云、網絡、邊緣和全球領先的超級計算機帶來全新功能。

基于第四代英特爾至強可擴展平臺,英特爾攜手客戶及產業(yè)伙伴密切合作,大規(guī)模提供差異化解決方案和系統(tǒng)以助力其解決算力挑戰(zhàn)。英特爾致力于通過其獨特的以結果為導向、工作負載至上的策略,及針對特定工作負載高度優(yōu)化的軟件,為不同工作負載和需求匹配對應的功耗和性能,并實現理想的總體擁有成本。會上,來自騰訊云、天翼云、京東云、阿里云、火山引擎、吉利汽車、浪潮信息與亞信科技的伙伴亦分享了其如何基于全新英特爾數據中心產品推動產品、技術創(chuàng)新,及在諸多領域落地的成功實踐。

此外,值得注意的是,作為英特爾迄今為止最具可持續(xù)性的數據中心處理器,第四代英特爾至強可擴展處理器為客戶提供一系列功能,以優(yōu)化產品功率和性能,旨在通過充分利用CPU資源助力其實現可持續(xù)發(fā)展的目標。

英特爾執(zhí)行副總裁兼數據中心與人工智能事業(yè)部總經理Sandra Rivera表示:“第四代英特爾至強可擴展處理器和Max系列產品的發(fā)布,對于推動英特爾在數據中心領域闊步前行,增強數據中心領域的領導地位,以及進一步探索新領域的發(fā)展機會極具意義。第四代英特爾至強可擴展處理器和Max系列產品能夠滿足客戶真實所需,即在安全的環(huán)境中兼具領先的性能和可靠性,不僅能夠滿足客戶的實際應用需求,亦有助于其加速實現業(yè)務價值及創(chuàng)新。”

發(fā)布會上,英特爾市場營銷集團副總裁兼中國區(qū)總經理王稚聰與英特爾市場營銷集團副總裁、中國區(qū)數據中心銷售總經理兼中國區(qū)運營商銷售總經理莊秉翰亦分別進行分享。王稚聰在致辭中指出:“數字經濟已成為經濟高質量發(fā)展的重要支撐,值此經濟發(fā)展回穩(wěn)走強之際,半導體行業(yè)的新增長機會亦接踵而至。籍此,英特爾將在‘五大超級技術力量’的驅動下,推動產品和技術創(chuàng)新,為生態(tài)伙伴持續(xù)賦能,助力產業(yè)向縱深發(fā)展,進而為我國經濟發(fā)展再添新動力。”


英特爾市場營銷集團副總裁兼中國區(qū)總經理王稚聰現場致辭

不同于目前市場上的其它數據中心處理器,第四代至強家族充分體現了英特爾以結果為導向、工作負載至上的策略。


英特爾市場營銷集團副總裁、中國區(qū)數據中心銷售總經理兼中國區(qū)運營商銷售總經理莊秉翰
展示第四代英特爾至強可擴展處理器晶圓

豐富的內置加速器帶來領先的性能和可持續(xù)發(fā)展優(yōu)勢

目前,至強處理器的安裝量已超過一億——從運行IT服務的本地服務器,其中包括全新的即服務商業(yè)模式,到管理互聯網流量的網絡設備,再到進行邊緣計算的無線基站云服務等。

基于數十年來在數據中心、網絡和智能邊緣領域的創(chuàng)新和領導地位,全新第四代英特爾至強可擴展處理器通過豐富的內置加速器提供領先的性能,解決客戶在AI、分析、網絡、安全、存儲和科學計算領域面臨的重大計算挑戰(zhàn)。

與前一代相比,第四代英特爾至強可擴展處理器通過內置加速器將目標工作負載的平均每瓦性能提升了2.9倍1,在優(yōu)化電源模式下每個CPU節(jié)能高達70瓦2并對性能只產生極低的影響,同時將總體擁有成本降低52%到66%3。

可持續(xù)性

第四代英特爾至強可擴展處理器擁有豐富的內置加速器,意味著英特爾能夠提供平臺級的功率節(jié)省,并緩解對額外獨立加速方面的需求,幫助客戶實現可持續(xù)發(fā)展目標。此外,新的優(yōu)化電源模式可以為某些工作負載帶來高達20%的插槽節(jié)能,而對性能的影響僅有不到5%11。風冷和液冷的創(chuàng)新進一步降低了數據中心的總能耗,且第四代至強可擴展處理器在英特爾工廠制造時,運用了超過90%的可再生電力,并同時配備了一流的水資源回收設施。

人工智能

在AI方面,與前一代相比,通過內置英特爾?高級矩陣擴展(英特爾?AMX)加速器,第四代英特爾至強可擴展處理器將PyTorch實時推理和訓練性能提升了10倍5,6。第四代英特爾至強還將廣泛的AI工作負載的推理和訓練性能提升到新的高度。英特爾至強CPU Max系列在這些功能的基礎上針對自然語言處理進行了擴展,將大型語言模型的處理速度提升多達20倍12。借助英特爾的AI軟件套件,開發(fā)者可以使用自己選擇的AI工具,提高生產力并加快AI開發(fā)速度。該套件可以從工作站進行移植,使其可以在云中擴展,并一直擴展到邊緣。同時,該套件已經針對400多個機器學習深度學習AI模型進行了驗證,涵蓋所有商業(yè)細分領域最常見的AI應用場景。

網絡

第四代英特爾至強包含一系列針對高性能、低時延網絡和邊緣工作負載進行了特別優(yōu)化的處理器產品。對于如今電信、零售、制造和智慧城市等行業(yè)正在推動更加軟件定義的未來,這些處理器將發(fā)揮關鍵性基石作用。對于5G核心工作負載,內置加速器有助于提高吞吐量和降低時延,而電源管理的升級則提高了平臺的響應能力和能效。此外,與前幾代相比,第四代英特爾至強在不增加功耗的情況下提供多達兩倍的虛擬無線接入網(vRAN)容量。這使通信服務提供商能夠將每瓦性能提高一倍,滿足其關鍵的性能、擴展和能效需求。

科學計算

第四代英特爾至強可擴展處理器和英特爾Max系列產品具備可擴展、平衡的架構,其中整合了CPU、GPU和oneAPI的開放軟件生態(tài)系統(tǒng),適用于科學計算和AI等領域要求嚴苛的計算工作負載,旨在幫助解決全球最具挑戰(zhàn)性的問題。

英特爾至強CPU Max系列是集成高帶寬內存的x86處理器,能夠在無需變更代碼的情況下為科學計算工作負載加速。英特爾數據中心GPU Max系列提供極高的計算密度,且具有多種產品規(guī)格以滿足不同的客戶需求。

英特爾至強CPU Max系列可提供64GB的高帶寬內存(HBM2e),為科學計算和AI工作負載大幅提高了數據吞吐量。與第三代英特爾?至強?可擴展處理器的高端SKU相比,英特爾至強CPU Max系列可為如能源、地球系統(tǒng)建模等一系列實際應用提供高達3.7倍10的性能提升。

此外,英特爾數據中心GPU Max系列在單個產品上整合47個小芯片,集成了超過1000億個晶體管,為諸如物理、金融服務和生命科學等極具挑戰(zhàn)性的工作負載帶來更高的吞吐量。相較上一代產品,英特爾數據中心GPU Max系列和至強CPU Max系列的結合,可以使生命與材料科學領域LAMMPS處理性能提升12.8倍13。

兼具強勁性能和安全性的至強平臺

作為英特爾重要的平臺轉型體現,第四代英特爾至強不僅具備卓越的加速性能,亦體現了重大的制造進展。其能夠在一個封裝上集成多達4個采用Intel 7制程工藝制造的單元,這些區(qū)塊通過英特爾嵌入式多芯片互連橋接(EMIB)封裝技術連接。第四代英特爾至強可擴展處理器還具備新特性,包括通過DDR5增加了內存帶寬、通過PCIe5.0和Compute Express Link (CXL) 1.1互連增加了I/O帶寬。

安全是一切的基礎。通過第四代英特爾至強可擴展處理器,英特爾提供數據中心芯片行業(yè)廣泛的機密計算產品組合,同時保護敏感數據和受到法律法規(guī)嚴格保護的數據。作為為數據中心計算提供應用隔離的芯片廠商,英特爾憑借英特爾?軟件防護擴展(英特爾?SGX),在私有云、公有云和從云到端的環(huán)境中,為使用中的數據提供硬件加密,以實現當前機密計算領域更小的攻擊面。此外,作為英特爾全新的虛擬機隔離技術,英特爾?Trust Domain Extensions(英特爾?TDX)非常適合把現有應用移植到機密環(huán)境,該特性將在微軟Azure、阿里云、谷歌云和IBM云中首發(fā)。

最后,第四代英特爾至強的模塊化架構讓英特爾能夠提供廣泛的處理器,針對客戶的使用場景或應用提供接近50個有針對性的SKU,其中包括從主流通用SKU到面向云、數據庫和分析、網絡、存儲和單插槽邊緣使用場景的專用SKU。第四代英特爾至強處理器家族支持英特爾On Demand,能夠針對不同使用場景和外形規(guī)格提供不同的核心數、頻率、加速器組合、功率和內存吞吐量,從而滿足客戶的實際應用需求。

數字化浪潮奔涌向前,加速數字化發(fā)展已成為關乎長遠發(fā)展的“必修課”?;诖耍鳛閿底纸洕ㄔO和數字產業(yè)向前發(fā)展的重要參與者和關鍵推動者,英特爾將在“五大超級技術力量”的驅動下,秉承以結果為導向、工作負載至上的策略,以穩(wěn)健的執(zhí)行力、卓越的產品技術領導力,及強大的生態(tài)影響力,持續(xù)助力本地生態(tài)伙伴全方位、深層次創(chuàng)新,為中國數字經濟的高質量發(fā)展夯實基礎。

1 如下工作負載的幾何平均值:RocksDB(IAA vs ZTD)、ClickHouse(IAA vs ZTD)、SPDK大型媒介與數據請求代理(DSA vs 開箱即用)、圖像分類ResNet-50(AMX vs VNNI)、物體識別SSD-ResNet-34(AMX vs VNNI)、QATzip(QAT vs?zlib)

2 1-節(jié)點,英特爾參考驗證平臺,2個英特爾? 至強8480+ (56C,?2GHz, 350W TDP),啟用超線程,啟用睿頻,總內存: 1?TB(16個插槽/ 64GB/ 4800 MHz),1個P4510 3.84TB?NVMe?PCIe Gen4驅動器,BIOS:0091.D05,(ucode:0x2b0000c0),CentOS Stream 8, 5.15.0-spr.bkc.pc.10.4.11.x86_64,Java Perf/Watt?w/?openjdk-11+28_linux-x64_bin,112個實例,1550MB 初始堆/最大堆大小,英特爾截至2022年1月的測試。?

3 ResNet50圖像分類?

新配置:1-節(jié)點,2個預生產的第四代英特爾?至強?可擴展處理器8490H(60核),含英特爾? 高級矩陣擴展(英特爾AMX),預生產超微SYS-221H-TNR,1024GB DDR5內存(16x64 GB),微代碼0x2b0000c0,啟用超線程,啟用睿頻,關閉SNC,CentOS Stream 8, 5.19.16-301.fc37.x86_64,1x3.84TB P5510 NVMe,10GbE x540-AT2,英特爾TF 2.10,AI Model=Resnet 50 v1_5,最高得分:BS1 AMX 1 核/實例(最高15ms SLA),使用物理內核,英特爾在2022年11月進行的測試?;鶞剩?-節(jié)點,2個第三代英特爾?至強?可擴展處理器8380(40核),超微SYS-220U-TNR,1024GB DDR4內存(16x64 GB),微代碼0xd000375,啟用超線程,啟用睿頻,關閉SNC,CentOS Stream 8, 5.19.16-301.fc37.x86_64,1x3.84TB P5510 NVMe,10GbE x540-AT2,英特爾 TF 2.10,AI Model=Resnet 50 v1_5,最高得分:BS1 INT8 2 核/實例(最高15ms SLA),使用物理內核,英特爾在2022年11月進行的測試。?

包含50臺配備第三代英特爾至強處理器8380的服務器編隊(RN50 w/DLBoost),截至2022年11月的估計:?

資本成本:164萬美元?

運營成本(4年,包括電力和散熱成本,基礎設施和硬件維護成本):73.99萬美元?

能耗kWh(4年,每臺服務器):44627,PUE 1.6?

其它假設:電價$0.1/kWh,kWh對應千克CO2 系數為0.42394??
?
包含17臺配備第四代英特爾至強處理器8490H 的服務器編隊(RN50 w/AMX),截至2022年11月的估計:

資本成本:79.94萬美元?

運營成本(4年,包括電力和散熱成本,基礎設施和硬件維護成本):27.53萬美元?

能耗kWh(4年,每臺服務器):58581,PUE 1.6

人工智能——通過部署更少的基于第四代英特爾至強處理器的服務器,在實現相同性能要求的情況下,TCO降低達55%。 請參閱 intel.com/processorclaims 上的 [E7]:第四代英特爾至強可擴展處理器。結果可能會有所不同。

數據庫——通過部署更少的基于第四代英特爾至強處理器的服務器,在實現相同性能要求的情況下,TCO降低達52%。 請參閱 intel.com/processorclaims 上的 [E8]:第四代英特爾至強可擴展處理器。結果可能會有所不同。

HPC——通過部署更少的基于英特爾至強CPU Max系列處理器的服務器,在實現相同的性能要求的情況下,TCO降低達66%。 請參閱 intel.com/processorclaims 上的 [E9]:第四代英特爾至強可擴展處理器。 結果可能會有所不同。

4 HP?Linpack、Stream Triad、SPECrate2017_fp_base?est、SPECrate2017_int_base est的幾何平均值。 [G2, G4, G6] 參見intel.com/processorclaims:第四代英特爾至強可擴展處理器。

5 與前一代(FP32)相比,通過內置英特爾?高級矩陣擴展(英特爾? AMX)(BF16),PyTorch實時推理性能提升至高可達10倍
ResNet50、Bert-Large、MaskRCNN、SSD-ResNet34、RNN-T、Resnext101的PyTorch幾何平均值。?

6 與前一代(FP32)相比,通過內置英特爾?高級矩陣擴展(英特爾? AMX)(BF16),PyTorch訓練性能提升至高可達10倍
ResNet50、Bert-Large、DLRM、MaskRCNN、SSD-ResNet34、RNN-T的PyTorch幾何平均值。?
?
?7 截至2022年8月30日的估計,使用FlexRAN?軟件測試,對比了第四代英特爾? 至強? 可擴展處理器和第三代英特爾? 至強? 可擴展處理器的架構提升,擁有類似的內核數量、插槽功率和頻率。結果可能不同。

?8 內核數量可少95%和2倍的一級壓縮吞吐量,對比了包含集成英特爾QAT的第四代英特爾至強白金8490H和前一代。
8490H:1-節(jié)點,配備2個集成了英特爾? 數據保護與壓縮加速技術(英特爾QAT)的第四代英特爾?至強?可擴展處理器(60核)的預生產平臺,利用的QAT設備=8(2個活躍插槽),總計1024GB (16x64 GB) DDR5內存,微代碼 0xf000380,啟用超線程,關閉睿頻,關閉SNC,Ubuntu 22.04.1 LTS,5.15.0-47-generic,1x 1.92TB Intel? SSDSC2KG01,QAT v20.l.0.9.1,QATzip v1.0.9,ISA-L v2.3.0,截至英特爾2022年9月的測試。

8380: 1-節(jié)點,2個第三代英特爾?至強?可擴展處理器(40核),Coyote Pass平臺,DDR4內存1024GB (16x64 GB),微代碼 0xd000375,啟用超線程,關閉睿頻,關閉SNC,Ubuntu 22.04.1 LTS,5.15.0-47-generic,1x 1.92TB?Intel SSDSC2KG01,QAT v1.7.l.4.16,QATzip?v1.0.9,ISA-L v2.3.0,截至英特爾2022年10月的測試。

9 至高可達3倍的RocksDB性能,對比了集成英特爾IAA的第四代英特爾至強白金8490H和前一代。
8490H:1-節(jié)點,配備2個集成了英特爾?內存分析加速器(英特爾IAA)的第四代英特爾?至強?可擴展處理器(60核)的預生產英特爾平臺,啟用超線程,啟用睿頻,總內存1024GB (16x64GB DDR5 4800),微代碼 0xf000380,1x 1.92TB INTEL SSDSC2KG01,Ubuntu 22.04.1 LTS,5.18.12-051812-generic,QPL v0.1.21,accel-config-v3.4.6.4,ZSTD v1.5.2,RocksDB v6.4.6 (db_bench),截至英特爾2022年9月的測試。

8380:1-節(jié)點,2個第三代英特爾?至強?可擴展處理器(40核),Coyote Pass平臺,啟用超線程,啟用睿頻,關閉 SNC,總內存 1024GB (16x64GB DDR4 3200),微代碼 0xd000375,1x 1.92TB INTEL SSDSC2KG01,Ubuntu?22.04.1 LTS,5.18.12-051812-generic,ZSTD v1.5.2,RocksDB?v6.4.6 (db_bench),截至英特爾2022年10月的測試。

10 英特爾? 至強? 8380:截至英特爾2022年10月7日的測試。1-節(jié)點,2個英特爾? 至強? 可擴展處理器8380,啟用超線程,啟用睿頻,總內存 256 GB (16x16GB 3200MT/s DDR4),BIOS版本 SE5C620.86B.01.01.0006.2207150335,ucode?版本=0xd000375,Rocky Linux 8.6,Linux 版本4.18.0-372.26.1.el8_?6.crt1.x86_?64,YASK v3.05.07?
英特爾? 至強? CPU Max系列:截至英特爾2022年第36周的測試。1-節(jié)點,2x 英特爾? 至強? CPU Max系列,啟用超線程,啟用睿頻,SNC4,總內存 128 GB (8x16GB HBM2 3200MT/s),BIOS 版本 SE5C7411.86B.8424.D03.2208100444,ucode 版本=0x2c000020,CentOS Stream 8,Linux 版本 5.19.0-rc6.0712.intel_?next.1.x86_?64+server,YASK v3.05.07。

11 第四代英特爾?至強?可擴展處理器優(yōu)化電源模式開啟時比關閉時系統(tǒng)節(jié)能可高達20%,包括SpecJBB、PECINT 和 NIGNX key handshake等特定工作負載。?

12英特爾? 至強? 8480+:Numenta 截至2022年11月28日的測試。1-節(jié)點,2個英特爾? 至強? 8480+,512 GB DDR5-4800,Ubuntu 22.04 Kernel 5.17,OpenVINO 2022.3,Numenta-Optimized BERT-Large,Sequence Length 512,Batch Size 1?

英特爾? 至強? Max 9468:Numenta 截至2022年11月30日的測試。1-節(jié)點,2x 英特爾? 至強? Max 9468,128 GB HBM2e 3200 MT/s,Ubuntu 22.04 Kernel 5.15,OpenVINO 2022.3,Numenta-Optimized BERT-Large,Sequence Length 512,Batch Size 1

13 英特爾? 至強? 8380:英特爾截至2022年10月28日的測試。1-節(jié)點,2x 英特爾? 至強? 8380 CPU,啟用超線程,啟用睿頻,總內存 256 GB (16x16GB 3200MT/s,Dual-Rank),BIOS 版本 SE5C6200.86B.0020.P23.2103261309,ucode 版本=0xd000270,Rocky Linux 8.6,Linux 版本 4.18.0-372.19.1.el8_6.crt1.x86_64?
集成HBM的英特爾? 至強? CPU Max系列: 英特爾截至2022年10月28日的測試。1-節(jié)點,2x 英特爾? 至強? Max 9480,啟用超線程,啟用睿頻,總內存 128 GB HBM2e,BIOS EGSDCRB1.DWR.0085.D12.2207281916,ucode 0xac000040,SUSE Linux Enterprise Server 15 SP3,Kernel 5.3.18,oneAPI 2022.3.0?

含DDR的英特爾? 數據中心 GPU Max系列主機:英特爾截至2022年10月28日的測試。1-節(jié)點,2個英特爾? 至強? Max 9480,啟用超線程,啟用睿頻,總內存 1024 GB DDR5-4800 + 128 GB HBM2e,內存模式:扁平,HBM2e未使用,6個英特爾? 數據中心 GPU Max系列,BIOS EGSDCRB1.DWR.0085.D12.2207281916,ucode 0xac000040,Agama pvc-prq-54,SUSE Linux Enterprise Server 15 SP3,Kernel 5.3.18,oneAPI 2022.3.0?

含HBM的英特爾?數據中心 GPU Max 系列主機:英特爾截至2022年10月28日的測試。1-節(jié)點,2x 英特爾? 至強? Max 9480,啟用超線程,啟用睿頻,總內存 128 GB HBM2e,6x 英特爾? 數據中心 GPU Max 系列,BIOS EGSDCRB1.DWR.0085.D12.2207281916,ucode 0xac000040,Agama pvc-prq-54,SUSE Linux Enterprise Server 15 SP3,Kernel 5.3.18,oneAPI 2022.3.0?

英特爾

英特爾

英特爾在云計算、數據中心、物聯網和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數字世界提供支持。

英特爾在云計算、數據中心、物聯網和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數字世界提供支持。收起

查看更多

相關推薦

電子產業(yè)圖譜