加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 處理性能大幅升級(jí),滿足更廣泛需求
    • 存力升級(jí),多項(xiàng)新技術(shù)賦能
    • 釋放通用CPU在AI邊緣推理中的價(jià)值
    • 推動(dòng)液冷產(chǎn)業(yè)加速發(fā)展
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

奪回?cái)?shù)據(jù)中心主導(dǎo)權(quán),英特爾新一代CPU“跨越式”升級(jí)

09/30 18:23
1773
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

日前,英特爾正式發(fā)布至強(qiáng)6性能核處理器(代號(hào)Granite Rapids),旨在針對(duì)AI、數(shù)據(jù)分析、科學(xué)計(jì)算等計(jì)算密集型業(yè)務(wù)提供更佳性能。

在AI迅速席卷市場(chǎng)的前幾年,CPU在適應(yīng)變革方面可能未能完全滿足市場(chǎng)期待。新一代處理器將給市場(chǎng)帶來哪些改變?<與非網(wǎng)>采訪了英特爾的多位生態(tài)合作伙伴,所獲評(píng)價(jià)都非常積極,包括:“讓英特爾重回巔峰”、“給合作注入更大信心”、“改變部分用戶的觀望心態(tài)”……本文就來看看至強(qiáng)6性能核處理器的強(qiáng)大之處,以及它給AI、數(shù)據(jù)中心產(chǎn)業(yè)帶來的影響。

處理性能大幅升級(jí),滿足更廣泛需求

已宣布上市的至強(qiáng)6900P系列處理器(代號(hào)Granite Rapids-AP),具備三個(gè)計(jì)算單元和兩個(gè)I/O單元,最高可配備128個(gè)內(nèi)核,支持每秒6400MT的DDR5內(nèi)存、每秒8800MT的MRDIMM內(nèi)存、6條UPI 2.0鏈路(速率高達(dá)每秒24 GT),96條PCIe5.0或64條CXL 2.0通道、504MB的L3緩存,支持FP16數(shù)據(jù)格式的英特爾高級(jí)矩陣擴(kuò)展(英特爾AMX),可為AI和科學(xué)計(jì)算等內(nèi)存帶寬敏感型工作負(fù)載提供MRDIMM選擇,且新增對(duì)CXL 2.0的支持。

約在2年前,市場(chǎng)上一個(gè)主流服務(wù)器所搭配的至強(qiáng)處理器約為24-48核,與之相比,至強(qiáng)6900P最高128個(gè)內(nèi)核的配備,大幅提升了CPU內(nèi)核數(shù)量以及整體性能,可以說是“跨越式”的表現(xiàn)。根據(jù)已透露的測(cè)試,至強(qiáng)6900P平臺(tái)在數(shù)據(jù)庫、科學(xué)計(jì)算等關(guān)鍵應(yīng)用負(fù)載的表現(xiàn)是上一代產(chǎn)品的2.31倍-2.5倍,AI應(yīng)用性能是其1.83倍-2.4倍。

芯片架構(gòu)是至強(qiáng)6性能核處理器的獨(dú)特之處,它采用了計(jì)算芯片單元與I/O芯片單元解耦的分離式模塊化設(shè)計(jì),以Chiplet的形式封裝在一起。計(jì)算單元中包含了x86內(nèi)核、內(nèi)存控制器和緩存。I/O單元中包含了PCle、CXL、UPI等通用協(xié)議,也包括了英特爾獨(dú)有的加速器。通過不同的排列組合,使得它可以靈活組合不同數(shù)量的計(jì)算單元,實(shí)現(xiàn)核心數(shù)量的擴(kuò)展及內(nèi)存和I/O的同步強(qiáng)化,保證更優(yōu)的整體性能和能效。

在AI加速方面,從第四代至強(qiáng)處理器開始,英特爾就為AI加速推出了專屬指令集——高級(jí)矩陣擴(kuò)展(英特爾AMX)。通過這個(gè)指令集,CPU能夠更好地支持大模型推理計(jì)算。在最新一代的至強(qiáng)處理器中,該指令集也進(jìn)行了升級(jí)。AI工作負(fù)載方面,至強(qiáng)6性能核處理器可運(yùn)行12種工作負(fù)載,覆蓋通用計(jì)算、數(shù)據(jù)庫、科學(xué)計(jì)算等,其中包括Llama2、Llama3 大模型等。

與第五代至強(qiáng)可擴(kuò)展處理器相比,至強(qiáng)6處理器從64核升級(jí)到128核,平均單核性能提升高達(dá)1.2倍,平均每瓦性能提升高達(dá)1.6倍,同等性能水平下平均節(jié)省30%的TCO。在運(yùn)行70億參數(shù)Llama2 大模型推理時(shí),在AMX加速的情況下,實(shí)現(xiàn)了3.08倍的性能提升。

存力升級(jí),多項(xiàng)新技術(shù)賦能

算力需要平衡的升級(jí),至強(qiáng)6性能核處理器除了核數(shù)多、計(jì)算性能提升,在內(nèi)存方面也進(jìn)行了較大的改進(jìn),主要亮點(diǎn)有:

更快的內(nèi)存——MRDIMM。英特爾兩年前就開始和業(yè)界領(lǐng)先廠商就MRDIMM展開合作,目標(biāo)就是能夠率先在服務(wù)器領(lǐng)域推出支持MRDIMM技術(shù)的服務(wù)器。MRDIMM利用數(shù)據(jù)緩沖區(qū),實(shí)現(xiàn)了兩個(gè)列的同步操作,從而允許一次向 CPU 傳輸 128 字節(jié)的數(shù)據(jù);而傳統(tǒng)DRAM 模塊一次只能傳輸 64 字節(jié)。英特爾至強(qiáng)6性能核處理器,通過使用標(biāo)配6400MT/s和更快的MRDIMM內(nèi)存結(jié)合的方式,可以處理對(duì)內(nèi)存非常敏感的工作負(fù)載,包括科學(xué)計(jì)算、AI等。

更大的內(nèi)存——CXL。至強(qiáng)6在CXL方面的演進(jìn)同樣值得關(guān)注,第五代至強(qiáng)正式引入CXL 2.0,用以擴(kuò)展內(nèi)存容量和帶寬。至強(qiáng)6已經(jīng)可以支持3種CXL內(nèi)存擴(kuò)展模式:CXL Numa Node、CXL Hetero Interleaved、Flat Memory。

從一系列性能規(guī)格就可以看出,新一代至強(qiáng)6性能核處理器在核心數(shù)量、內(nèi)存帶寬、AI加速功能方面明顯升級(jí),這對(duì)計(jì)算密集型工作負(fù)載非常關(guān)鍵,可以覆蓋從邊緣到數(shù)據(jù)中心再到云環(huán)境中的各種AI挑戰(zhàn)。通過采用模塊化SoC架構(gòu)設(shè)計(jì),至強(qiáng)6性能核處理器能夠以豐富的產(chǎn)品系列,為云服務(wù)提供商、OEM、ODM、ISV等提供靈活性和可擴(kuò)展性。

釋放通用CPU在AI邊緣推理中的價(jià)值

作為算力的載體,數(shù)據(jù)中心在過去近20年中,通過不斷的演進(jìn)與重構(gòu)見證和推動(dòng)了科技的發(fā)展。如今,在算力需求日益飆升且多樣化的當(dāng)下,至強(qiáng)6性能核處理器將給數(shù)據(jù)中心帶來哪些獨(dú)到價(jià)值?又將如何進(jìn)一步釋放算力價(jià)值?

英特爾數(shù)據(jù)中心與人工智能集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理陳葆立認(rèn)為,通用CPU進(jìn)行AI推理是一個(gè)較大的機(jī)遇。盡管大模型規(guī)模在不斷增長(zhǎng),但是行業(yè)專用模型可能并不需要如此龐大的模型,對(duì)于許多行業(yè)用戶來說,他們實(shí)際上更傾向于使用10B以下的行業(yè)專用模型,并在這些模型中構(gòu)建專屬的知識(shí)和數(shù)據(jù)庫。根據(jù)一些客戶反饋,至強(qiáng)6性能核處理器進(jìn)行Llama2、Llama3推理,性能已足夠應(yīng)對(duì)。此外,在一些搭載加速器或GPU的AI服務(wù)器中,絕大部分機(jī)頭選用的也都是英特爾CPU處理器,英特爾與主流的GPU廠商、AI生態(tài)合作伙伴都建立了良好的合作關(guān)系,共同定義至強(qiáng)規(guī)格以提供最佳的機(jī)頭體驗(yàn)。

新華三集團(tuán)計(jì)算存儲(chǔ)產(chǎn)品線副總裁劉宏程認(rèn)為,至強(qiáng)6性能核處理器相較于上一代的性能提升并非細(xì)微改進(jìn),而是翻天覆地的變化,這可能會(huì)改變用戶以往“再等等”的觀望心態(tài),這種顯著的性能增長(zhǎng)有望加速整個(gè)行業(yè)向新一代技術(shù)切換的進(jìn)程。

他指出,過去業(yè)界常常用 “通用服務(wù)器”和“GPU服務(wù)器” 來進(jìn)行區(qū)分,但在這一代服務(wù)器上,實(shí)現(xiàn)了融合的基礎(chǔ)設(shè)施,即能夠同時(shí)兼顧通用計(jì)算和GPU加速的需求。這種融合將加速各行業(yè)對(duì)新技術(shù)應(yīng)用的推動(dòng),因?yàn)橛脩舨辉傩枰诓煌愋偷姆?wù)器之間做出選擇,而是可以更加靈活地應(yīng)對(duì)多樣化的計(jì)算需求。

由于大模型應(yīng)用到具體行業(yè),往往需要結(jié)合企業(yè)的私有數(shù)據(jù)進(jìn)行微調(diào)與推理。他認(rèn)為融合架構(gòu)比單一GPU服務(wù)器更適合這類需求,因?yàn)閷?duì)于私域小規(guī)模的訓(xùn)練和推理任務(wù)來說,融合架構(gòu)的投資回報(bào)率更高,能夠更有效地利用資源。當(dāng)推理需求成為主要應(yīng)用場(chǎng)景時(shí),至強(qiáng)6性能核處理器憑借出色的推理性能,可能成為一個(gè)更加經(jīng)濟(jì)高效的選擇。

超聚變服務(wù)器產(chǎn)品總經(jīng)理朱勇談到,面對(duì)千行百業(yè)的應(yīng)用,該處理器可以做到“一芯多用”,既可以進(jìn)行通用計(jì)算、又可以做邊緣推理,目前已經(jīng)可以應(yīng)用在10B大模型的推理場(chǎng)景,這給客戶帶來的優(yōu)勢(shì)是能夠降低TCO。他強(qiáng)調(diào),“百模大戰(zhàn)”的終極挑戰(zhàn)就是商業(yè)變現(xiàn)問題,一個(gè)AI應(yīng)用的成熟落地離不開模型推理,而基于通用場(chǎng)景的CPU推理,能夠給客戶帶來較大的商業(yè)價(jià)值。

寧暢副總裁兼首席技術(shù)官趙雷評(píng)價(jià),新一代至強(qiáng)6性能核處理器是英特爾“重回巔峰”之作,讓他覺得英特爾又重新占領(lǐng)、并且拿到了市場(chǎng)的主導(dǎo)權(quán),給他注入了更大信心。

英特爾市場(chǎng)營(yíng)銷集團(tuán)副總裁、中國(guó)區(qū)云與行業(yè)解決方案和數(shù)據(jù)中心銷售部總經(jīng)理梁雅莉補(bǔ)充,大模型的投資熱潮仍在持續(xù),接下來,整個(gè)行業(yè)將會(huì)關(guān)注如何基于通用大模型發(fā)展行業(yè)特定的大模型,這也意味著AI大模型第二場(chǎng)發(fā)展機(jī)遇剛剛開始,且潛力無限。她強(qiáng)調(diào),對(duì)于具體的行業(yè)應(yīng)用來說,推理場(chǎng)景不僅與行業(yè)相關(guān),而且與每個(gè)行業(yè)的具體場(chǎng)景密切相關(guān)。因此,未來算力的需求不僅被極大地放大,而且呈現(xiàn)出多樣化的特點(diǎn)。在這樣的趨勢(shì)下,“性能”和“成本”必須是一個(gè)平衡考慮,而至強(qiáng)6性能核處理器正是基于對(duì)未來趨勢(shì)的洞察而誕生的。

推動(dòng)液冷產(chǎn)業(yè)加速發(fā)展

更強(qiáng)算力也讓數(shù)據(jù)中心面臨能耗和散熱挑戰(zhàn)。立足于此,英特爾發(fā)起了英特爾中國(guó)數(shù)據(jù)中心液冷創(chuàng)新加速計(jì)劃,希望攜手行業(yè)伙伴突破油類單相浸沒散熱能力有限的技術(shù)難題,進(jìn)一步推動(dòng)冷板式液冷整體解決方案驗(yàn)證,同時(shí)還聯(lián)合生態(tài)力量推動(dòng)UQD互換驗(yàn)證測(cè)試,從技術(shù)創(chuàng)新、構(gòu)建統(tǒng)一行業(yè)標(biāo)準(zhǔn)兩方面“雙管齊下”,降低數(shù)據(jù)中心液冷使用成本、增強(qiáng)可靠性,為液冷技術(shù)的規(guī)?;瘧?yīng)用保駕護(hù)航。

聯(lián)想基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器產(chǎn)品部總經(jīng)理周韜分享,基于至強(qiáng)6性能核的聯(lián)想ThinkSystem SC750 V4服務(wù)器,是支持至強(qiáng)性能核的高密度服務(wù)器,主要是采用了聯(lián)想海神的溫水水冷技術(shù),可以做到100%散熱都可以通過水冷去覆蓋,測(cè)試結(jié)果顯示在生物化學(xué)、氣象這些應(yīng)用方面都有出色性能。

趙雷談到,隨著CPU算力越來越強(qiáng),核數(shù)從上一代64核升級(jí)到現(xiàn)在128核,它的能耗也相應(yīng)從300瓦增加到500瓦,這也客觀推動(dòng)了液冷的發(fā)展和快速落地。以往350瓦以下的CPU可以通過風(fēng)冷解決散熱問題,但新一代CPU則需要更高效的散熱方案,如液冷。這一轉(zhuǎn)變不僅推動(dòng)了液冷技術(shù)的進(jìn)步,包括冷板、浸沒式冷卻等,還帶動(dòng)了整個(gè)液冷基礎(chǔ)設(shè)施的發(fā)展。

趙雷強(qiáng)調(diào),液冷技術(shù)的普及將對(duì)電力基礎(chǔ)設(shè)施提出新的要求,因?yàn)殡S著散熱系統(tǒng)的升級(jí),供電能力可能成為新的瓶頸。因此,電力系統(tǒng)的改進(jìn)也將成為必要??偟膩碚f,CPU技術(shù)的進(jìn)步不僅促進(jìn)了液冷技術(shù)的快速發(fā)展,還將拉動(dòng)整體基礎(chǔ)設(shè)施的升級(jí)優(yōu)化。

英特爾

英特爾

英特爾在云計(jì)算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計(jì)算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費(fèi)電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢(shì)。歡迎交流~