囯产成人免费一二三四区,无码AV喷白浆在线直播,国产96在线视频播放

一直以來，CPU 處理器被看作是保障計算機出色運行的“大腦”。但不能忽略的是，系統(tǒng)內(nèi)存（DRAM）在提升整體性能方面也扮演著重要角色。隨著數(shù)據(jù)密集型工作負載的需求不斷增加，現(xiàn)代服務器面臨著將計算能力與內(nèi)存帶寬相匹配的巨大壓力。由于服務器處理器核心數(shù)量的增長速度超過了內(nèi)存帶寬的提升，這其實意味著，每個核心實際可用的內(nèi)存帶寬相應減少了。

處理器核心與內(nèi)存帶寬失衡會帶來什么后果？像AI推理、高性能計算和實時分析等行業(yè)，通常需要運行大量的工作負載，內(nèi)存帶寬如果跟不上處理器的提升速度，往往可能會導致計算瓶頸，影響工作負載執(zhí)行的效率和效果。

在這些挑戰(zhàn)下，MRDIMM（多路復用雙列直插式內(nèi)存模塊）技術受到推崇。今年9月，英特爾發(fā)布的至強6性能核的高端產(chǎn)品6900P系列，就率先應用了8800MT/s的MRDIMM內(nèi)存，它能夠以即插即用的方式大幅提升性能。

引入系統(tǒng)并行性， MRDIMM實現(xiàn)高效算力

在數(shù)據(jù)中心，最常用的內(nèi)存模塊（稱為RDIMM）就像現(xiàn)代處理器一樣，具有板載并行資源，只是兩者的使用方式不同。

事實上，MRDIMM從原型設計到如今正式發(fā)布已經(jīng)有很多年了。最早被定義為專門針對科學計算和AI場景，針對這些場景，MRDIMM可以帶來非常杰出的表現(xiàn)，為數(shù)據(jù)中心“錦上添花”。

據(jù)英特爾一位技術專家介紹，之所以在至強6這一代支持MRDIMM，首先要結合收益，8800MT/s的規(guī)格可以與英特爾至強6性能核處理器的性能相匹配，可以說MRDIMM的推出“正當其時”。

同時，要和現(xiàn)有DDR5實現(xiàn)兼容。英特爾在產(chǎn)品原型、定義和推出等各個階段都和業(yè)內(nèi)很多RDIMM廠商進行了深度合作，目前三星、SK海力士、美光都推出了相應產(chǎn)品。從性能來講，與DDR5最高端的6400MT/s、主流的4400MT/s或4800MT/s相比，該方案在帶寬、延時等方面都有了顯著提升。

可以通俗理解該方案的形成：RDIMM通常有一個或兩個Rank（陣列），在兩個Rank的情況下，普通DRAM會分開訪問。也就是說，一個讀寫的Cycle，只有一個陣列是活躍的，另外一個陣列在閑置。而MRDIMM會讓兩個陣列同時活躍起來，利用片上的數(shù)據(jù)緩沖區(qū)實現(xiàn)128字節(jié)在兩個陣列的同步操作。

這個原理聽起來似乎并不復雜，不過英特爾技術專家解釋說，在工程實現(xiàn)時需要克服很多障礙。比如，片上的數(shù)據(jù)緩沖區(qū)就帶來了一定挑戰(zhàn)，DRAM顆粒已經(jīng)非?？炝耍诖嘶A之上還增加了數(shù)據(jù)緩沖區(qū)來處理128字節(jié)的數(shù)據(jù)傳輸，并且需要聯(lián)動控制器，以及滿足RAS的需求、保證數(shù)據(jù)的完整性和一致性等。這并不只是簡單地把數(shù)據(jù)分發(fā)到兩個Rank，而是需要在整個工程實現(xiàn)過程中進行大量創(chuàng)新和協(xié)作。

英特爾數(shù)據(jù)中心與人工智能（DCAI）事業(yè)部內(nèi)存開發(fā)資深首席工程師George Vergis，回想起靈感閃現(xiàn)的一瞬間時說道，“當時我們想到，既然并行資源沒被使用，那為什么不把它們集中起來呢？”于是，George Vergis便提出一個創(chuàng)新方案，即在DRAM模塊上放置一個小型接口芯片——多路復用器（Mux），從而讓數(shù)據(jù)可以在同一個時刻跨兩個內(nèi)存陣列進行傳輸。

正是通過多路復用緩沖器整合了每個MRDIMM的電力負載，讓接口能夠運行得比RDIMM更快。由于能夠同時并行訪問兩個內(nèi)存陣列，帶寬也翻倍了。

由此就誕生了英特爾有史以來最快的系統(tǒng)內(nèi)存，峰值帶寬提高近40%，從每秒6400MT躍升至每秒8800MT，而過去則需經(jīng)過多次迭代才能實現(xiàn)。

目前，MRDIMM已經(jīng)納入JEDEC標準，按照當前的路線圖，預計未來將在8800MT/s的基礎上翻倍，以更好地滿足下一代處理器的卓越性能。隨著核數(shù)的增多、處理能力和主頻的提升，相應地需要打破“內(nèi)存墻”、突破內(nèi)存的容量和性能問題，也需要有不同的技術來滿足未來數(shù)據(jù)中心建設的需求。

內(nèi)存領域三大當紅技術：MRDIMM、HBM、CXL

當前，內(nèi)存領域相關的前沿技術以MRDIMM和HBM為主要代表。英特爾技術專家表示，MRDIMM的目標是性能提升，覆蓋了32GB、48GB、64GB、96GB、128GB和256GB這些常見的內(nèi)存容量。與市場上已經(jīng)實現(xiàn)512GB甚至更大容量的DDR5相比，MRDIMM更注重提高內(nèi)存帶寬和降低延遲，以滿足高性能需求。此外，MRDIMM的優(yōu)勢在于它兼容DDR5插槽，有更好的通用性。對于服務器整機設計，包括散熱設計等，都可以統(tǒng)一進行考慮，并采用統(tǒng)一的處理方式。

“至于HBM，通常是通過封裝工藝集成在CPU、GPU或ASIC芯片中，相對來說通用性沒有那么強，成本也會比較高，且容量基本上都會在96GB以內(nèi)，這是目前主流的情況”，該技術專家表示，“不過考慮到AI需求，當前一些廠商在HBM的投入非常大，顯示出該技術在特定領域的重要性，包括英特爾至強Max系列CPU、以及Gaudi都采用了HBM?！?/p>

將MRDIMM與HBM進行對比，該技術專家認為，前者單條可以達到256GB，意味著相對HBM，它容量更大、成本更低。在AI推理或是調優(yōu)等需要更大內(nèi)存容量的場景下，比如RAG，采用MRDIMM既有高性能表現(xiàn)（容量更大），同時也可以處理更加通用的場景，針對AI或者科學計算的場景更適用，目前MRDIMM主要還是用于服務器端對內(nèi)存帶寬要求較高的場景。

除了MRDIMM和HBM之外，CXL作為內(nèi)存領域一種兼具靈活性和高性價比的解決方案，正逐漸受到市場的青睞。在遠端，CXL的內(nèi)存池技術允許使用成本較低的技術，如DDR4，來支撐業(yè)務系統(tǒng)；在近端，則可以通過CXL memory expander實現(xiàn)本機擴展，進一步增強了系統(tǒng)的擴展性和成本效益。

據(jù)介紹，實際客戶測試顯示，在經(jīng)過優(yōu)化的場景下，CXL技術能夠達到90%-95%的性能指標。近期的OCP China（開放計算中國峰會）上，英特爾和阿里的聯(lián)合發(fā)布就展示了阿里是如何有效應用了CXL技術。該技術專家認為，這表明CXL的生態(tài)系統(tǒng)正在逐步完善，英特爾和產(chǎn)業(yè)伙伴的核心目標是在滿足性能服務水平協(xié)議（SLA）的基礎上，提供更具性價比的方案。

他強調，相較于MRDIMM和HBM，CXL的最大優(yōu)勢在于提供高性價比的方案，連接相對廉價的內(nèi)存，而非追求極致的帶寬和性能。這使得CXL在多種應用場景中，尤其是在需要大容量內(nèi)存和成本效益比的AI推理或科學計算場景中，更具吸引力。隨著生態(tài)系統(tǒng)的不斷完善，CXL有望成為內(nèi)存技術領域的主流選擇之一。

談及數(shù)據(jù)中心面臨的內(nèi)存瓶頸，該技術專家表示目前可以從兩方面來解決：一是內(nèi)存帶寬，MRDIMM目前的路線圖非常明確，未來帶寬會再次翻倍，容量方面隨著介質本身的演進也會增加；二是內(nèi)存容量，這是一個與應用場景相關的問題。對于內(nèi)存容量擴展的場景，在不考慮極致性能的情況下，CXL可能是更好的選擇。

總之，MRDIMM定位于并非針對計算密集型或存儲密集型的應用，而是專為內(nèi)存帶寬敏感型的應用而設計。對于那些對內(nèi)存帶寬不敏感，主要依賴計算得出結果的應用，MRDIMM可能不會發(fā)揮關鍵作用。然而，在內(nèi)存帶寬敏感型的應用場景中，如內(nèi)存數(shù)據(jù)庫、科學計算和AI等，MRDIMM將扮演至關重要的角色?！癕RDIMM的價值在于其對內(nèi)存帶寬的優(yōu)化，而非單純的計算或存儲能力”，該技術專家強調。

AI推理內(nèi)存革命：突破瓶頸，CPU性能飛躍

引入系統(tǒng)并行性， MRDIMM實現(xiàn)高效算力

內(nèi)存領域三大當紅技術：MRDIMM、HBM、CXL

相關推薦

AI推理內(nèi)存革命：突破瓶頸，CPU性能飛躍

引入系統(tǒng)并行性， MRDIMM實現(xiàn)高效算力

內(nèi)存領域三大當紅技術：MRDIMM、HBM、CXL

相關推薦

AI推理內(nèi)存革命：突破瓶頸，CPU性能飛躍

引入系統(tǒng)并行性， MRDIMM實現(xiàn)高效算力

內(nèi)存領域三大當紅技術：MRDIMM、HBM、CXL