加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 臺積電工藝加持,Lunar Lake 不只性能更強
    • NPU 性能大漲,整體 AI 算力沖上 120TOPS
    • 把內(nèi)存焊上芯片,英特爾也要「統(tǒng)一內(nèi)存」
    • 寫在最后
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

英特爾新處理器暴力升級:性能爆發(fā),「統(tǒng)一內(nèi)存」

06/08 14:00
1553
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

來源:雷科技AI硬件組?|

編輯:冬日果醬 |

僅僅半年之后,AI PC 就要迎來了一輪大幅度的升級。在之前關(guān)于 AMD 銳龍 AI 300 系列的報道中,雷科技就提到了 AMD 新款 AI PC 芯片在 NPU 算力的飛躍,以及高通、AMD 和英特爾之間的全新競爭。而在高通、AMD 之后,英特爾終于也帶來了下一代筆記本電腦芯片。6 月 4 日,英特爾在臺北電腦展上展示了最新一代的 Lunar Lake 處理器,并計劃在秋 季正式出貨。坦白講,這個發(fā)布節(jié)奏對比 AMD 和高通顯然要「慢」上不少,首批搭載驍龍 X 系列芯片的 Windows 11 AI PC 很快就將在 618 上市,搭載 AMD 銳龍 AI 300 系列的 Windows 11 AI PC 也將從 7 月起陸續(xù)上市。俗話說「好飯不怕晚」。但問題是,英特爾的 Lunar Lake 會是一碗「好飯」嗎?英特爾已經(jīng)放言,Lunar Lake「絕對」超越高通同類產(chǎn)品(其實就是驍龍 X 系列芯片),然而就現(xiàn)在來說,我們肯定不會得到一個明確的答案。

但從目前公開和流出的信息來看,Lunar Lake 至少是值得期待的,不僅因為全面提升的 CPU、GPU、NPU 性能,也因為用上了臺積電的先進制造工藝以及自己的先進封裝工藝。

甚至在 Lunar Lake 上,英特爾第一次將 LPDDR5X 內(nèi)存封裝在芯片之中,就像蘋果的統(tǒng)一內(nèi)存架構(gòu)一般。但這種設(shè)計能給 Lunar Lake 帶來什么變化和升級?Lunar Lake 又能給下一代 AI PC 帶來什么?這些都是英特爾要在幾個月后要正式回答的。

臺積電工藝加持,Lunar Lake 不只性能更強

去年,英特爾宣稱酷睿 Ultra(Meteor Lake)處理器代表了該公司 40 年來最大的一次架構(gòu)轉(zhuǎn)變,但面對 Arm 芯片的持續(xù)挑戰(zhàn),這種轉(zhuǎn)變顯然不會是一次性的。在 Lunar Lake 上,英特爾繼續(xù)采用了 SoC 的設(shè)計,在一塊芯片中集成了 CPU、GPU、NPU 計算模塊。不同的是,Lunar Lake 沒有采用英特爾自己的芯片制造工藝,而是用上了臺積電 N3B 和臺積電 N6 兩種工藝來打造。在一定程度上,這是一種升級,畢竟是用上了目前最先進的臺積電 3nm 工藝。要指出的是,N3B 作為臺積電 3nm 的第一代工藝,在蘋果 A17 Pro 上并沒有帶來大幅的能效提升。不過對比英特爾的先進工藝就另說了,按照英特爾自己的說法,Lunar Lake 的能效提升了約 30%。而在性能方面,Lunar lake 配備了全新的 CPU 和 GPU 架構(gòu),CPU 性能提升了約 20%,GPU 性能更是提升了 50%,尤其在 3DMark Time Spy 等基準(zhǔn)測試中提升更為明顯。

具體來說,新的 CPU 設(shè)計增強了分支預(yù)測、指令并行度和緩存帶寬,使得處理器在處理多任務(wù)和計算密集型任務(wù)時有更好的表現(xiàn)。原來酷睿 Ultra 采用的 3D 性能混合架構(gòu)也改了,英特爾在 Lunar Lake 上砍掉了 LP-E 核設(shè)計,用上了新的 4x4 設(shè)計,也就是說,Lunar Lake 現(xiàn)在配備了 4 個 P 核、4 個 E 核。同時 Lunar Lake 上不支持超線程,意味著 Lunar Lake 的線程數(shù)量和核心數(shù)量一樣都是 8。按照英特爾的說法,與之前的 LP-E 核相比,Lunar Lake 的 E 核(Skymont)在同性能下的功耗只有前者的三分之一,同功耗下的單線程和多線程性能則有前者 2 倍和 4 倍。另一邊,P 核(Lion Cove)的 IPC 提高了 14%。

此外,在 Windows 11「containment zones」的基礎(chǔ)上,Lunar Lake 可以通過線程指令使用異構(gòu)調(diào)度策略,將工作負(fù)載(比如 Copilot 助手等應(yīng)用)導(dǎo)向功耗更低的 E 核,來實現(xiàn)節(jié)省電量的目的;或者是導(dǎo)向性能更高的 P 核,實現(xiàn)更流暢地運行。簡單來說,現(xiàn)在 Lunar Lake 可以將特定任務(wù)細化到分配給不同策略的核心,做到更高匹配度和更高效率的運行。GPU 方面,Lunar Lake 采用了下一代 Xe2 架構(gòu),不僅性能有了平均 50%的提升,而且和 Xe 架構(gòu)一樣具有高度的可擴展性,即可以集成在低功耗的移動 SoC 上,也將用在稍晚即將推出的 Arc 顯卡上。同時,GPU 還能提供高達 67TOPS 的 AI 算力。

NPU 性能大漲,整體 AI 算力沖上 120TOPS

AI PC 這個概念,可以說最初就是英特爾主導(dǎo)的,隨后也被整個 PC 行業(yè)所共同介紹。但公允地講,英特爾現(xiàn)售的 AI PC 芯片酷睿 Ultra 在很多方面難以支撐「AI PC」的概念,除了 Windows 系統(tǒng)沒有跟上之外,AI 算力也是基礎(chǔ)因素之一。好在,Lunar Lake 也迎來了一波 AI 性能大升級。英特爾宣稱,Lunar Lake 處理器的 NPU 達到了 48TOPS 的 AI 性能,相比酷睿 Ultra 上的 NPU 算力提升了四倍不止。作為對比,新一代筆記本電腦芯片中,驍龍 X 系列的 NPU 算力是 45TOPS,銳龍 AI 300 系列的 NPU 算力是 50TOPS。

爾此外,在異構(gòu)計算下,NPU 加上 CPU 的 5TOPS、GPU 的 67TOPS,Lunar Lake 處理器整體能夠提供高達 120TOPS 的算力。不過在小雷看來,筆記本電腦受限于續(xù)航,異構(gòu)計算更多承擔(dān)的是臨時性的重負(fù)載 AI 任務(wù)。而要將生成式 AI 技術(shù)應(yīng)用到 PC 的基礎(chǔ)體驗之中,則必須充分利用起低功耗高 AI 性能的 NPU。這其實也是微軟在下一代 Windows 11 AI PC 的標(biāo)準(zhǔn)中著重強調(diào) 40TOPS 以上算力的關(guān)鍵原因。所以從這個角度來看,就算是 NPU 我們也不能只看最高算力,還要看功耗表現(xiàn)。不過,這一點還是要以后續(xù)的實際測試為準(zhǔn)。而除了算力,影響 AI 實際運行表現(xiàn)的其實還有內(nèi)存。我們都知道,現(xiàn)在很多時候限制 AI 實際運行表現(xiàn)的并非計算,而是傳輸,更直接地說是內(nèi)存帶寬和延遲。當(dāng)然,往大了說,內(nèi)存的改進也會影響 CPU 以及 GPU 的實際表現(xiàn),從而影響設(shè)備的整體性能。這可能也是為什么,英特爾選擇在 Lunar Lake 中直接封裝了內(nèi)存。

把內(nèi)存焊上芯片,英特爾也要「統(tǒng)一內(nèi)存」

在主題演講上,當(dāng)英特爾 CEO 帕特·基辛格(Pat Gelsinger)手持展示 Lunar Lake 的時候,所有人都注意到了:Lunar Lake 還封裝了兩顆內(nèi)存。

作為英特爾首款采用封裝內(nèi)存的芯片,Lunar Lake 有 16GB 和 32GB(雙通道)LPDDR5X 兩種配置,單芯片運行速度高達 8533MT/s。該內(nèi)存支持 16bx4 通道,與傳統(tǒng)的 PCB 嵌入式設(shè)計相比,PHY 功耗降低了 40%,面積節(jié)省了 250 平方毫米。在當(dāng)下,這種設(shè)計我們已經(jīng)不陌生了,比如消費級中蘋果 M 系列芯片就采用了統(tǒng)一內(nèi)存架構(gòu),此外,英偉達的高端加速卡如 H100、B200 都是直接將內(nèi)存(包括 HBM)焊在 GPU 和 CPU 旁邊,封裝成一個芯片。這樣做的好處也非常明顯,首先是可以顯著提升數(shù)據(jù)傳輸速度和系統(tǒng)響應(yīng)時間。內(nèi)存與處理器之間的距離縮短,大大減少了數(shù)據(jù)傳輸?shù)难舆t,提升整體系統(tǒng)性能。這對于需要高帶寬和低延遲的應(yīng)用,例如圖形處理、AI 計算和高性能計算任務(wù),尤為重要。

其次是有助于降低功耗。同樣因為傳輸距離縮短,也減少了數(shù)據(jù)傳輸過程中的能量損耗,同時配合更先進的制造工藝,有助于延長設(shè)備的續(xù)航,特別適用于移動設(shè)備和筆記本電腦 。再有,在芯片里封裝內(nèi)存也可以簡化主板布局,減少主板上的元件和連接。這不僅減少了生產(chǎn)成本,還提高了系統(tǒng)的可靠性。更緊湊的設(shè)計使得設(shè)備在重量和體積上有所減少,進一步提升了便攜性。這對于超薄筆記本和移動設(shè)備來說,同樣是一個重要的優(yōu)勢。

但封裝內(nèi)存也有不可回避的問題,首先就是可擴展性和可維修性的降低。這很好理解,畢竟已經(jīng)焊在芯片里,你不可能對內(nèi)存進行后續(xù)的升級,同時如果內(nèi)存壞了也基本不存在修理的可能,也只能更換整個芯片甚至電腦。事實上,PC 供應(yīng)鏈之前就對此表達了不滿。由于 Lunar Lake 處理器的內(nèi)存與 CPU 的捆綁封裝策略,OEM 廠商將無法單獨采購內(nèi)存模組,只能采購不同內(nèi)存規(guī)格的 Lunar Lake 處理器,很大程度上限制操作空間,并可能導(dǎo)致相關(guān)廠商失去內(nèi)存業(yè)務(wù)。從更大的層面來說,考慮到英特爾在移動處理器市場的統(tǒng)治,Lunar Lake 處理器的內(nèi)存與 CPU 的捆綁封裝策略,可能徹底影響 OEM 廠商提供多樣組合的能力,減少了 CPU、內(nèi)存、固態(tài)硬盤的豐富規(guī)格選擇,失去 Windows 陣營原有靈活性。如果說蘋果在封閉生態(tài)還能完全壓制反對者的聲音,那英特爾能做到嗎?恐怕也有待時間的驗證。

寫在最后

「與 Jensen(英偉達 CEO 黃仁勛)不同的是,我們相信摩爾定律依然活著,而且還活得很好。」基辛格在演講開始就強調(diào),在一塊芯片上封裝十億個晶體管后,希望未來能封裝一萬億個晶體管。雖然依舊是 PC 行業(yè)的絕對巨頭,但藍色巨人面對的挑戰(zhàn)依然很多、很大,在摩爾定律之外,數(shù)據(jù)中心業(yè)務(wù)面臨英偉達的強勢進攻,代工業(yè)務(wù)則還在積蓄力量的階段,最強勢的 PC 客戶端業(yè)務(wù)則也面臨著 Arm 陣營前所未有的挑戰(zhàn)。但最終,一切還是要靠產(chǎn)品說話,Lunar Lake 做了很多的改變,這些改變是否能幫助英特爾準(zhǔn)備應(yīng)對 PC 領(lǐng)域的挑戰(zhàn),我相信會是接下來很多人關(guān)注的重點之一。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
ATMEGA128A-MUR 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 64QFN
$7.34 查看
DSPIC33EP512MU810-I/PT 1 Microchip Technology Inc 16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100
$10.04 查看
STM32F401VET6 1 STMicroelectronics High-performance access line, Arm Cortex-M4 core with DSP and FPU, 512 Kbytes of Flash memory, 84 MHz CPU, ART Accelerator

ECAD模型

下載ECAD模型
$10.53 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜