業(yè)界很多人都認(rèn)為,摩爾定律已死,但是英特爾是摩爾定律的提出者,也是其踐行者,只有英特爾用實(shí)際行動(dòng)證明摩爾定律依然有效,才最有說(shuō)服力。近期,在英特爾的媒體“紛享會(huì)”上,英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)表示,“英特爾在持續(xù)推動(dòng)摩爾定律的演進(jìn),目前,英特爾已經(jīng)讓制程回歸兩年的更新周期。新一輪 10nm 的創(chuàng)新產(chǎn)品已經(jīng)陸續(xù)問(wèn)世,良品率大幅度提升,產(chǎn)能也大幅提升。在 10nm 上,產(chǎn)品可以獲得大規(guī)模的算力,同時(shí)大幅降低功耗。未來(lái),英特爾還將以極快的速度過(guò)渡到更先進(jìn)的 7nm 工藝,2021 年會(huì)有產(chǎn)品首發(fā)?!?/p>
另外,為了加速推動(dòng)計(jì)算架構(gòu)的創(chuàng)新,英特爾推出了全新的 Xe架構(gòu)。宋繼強(qiáng)介紹,“這是一個(gè)靈活且擴(kuò)展性很強(qiáng)的統(tǒng)一架構(gòu),還可以分成多種微架構(gòu)。應(yīng)用領(lǐng)域包括百億億次高性能計(jì)算、人工智能深度學(xué)習(xí)與訓(xùn)練、云服務(wù)、多媒體編輯、工作站、游戲、輕薄筆記本、便攜設(shè)備等。2019 年,我們展示了一款全新類別、兼具高性能和高靈活性的獨(dú)立通用型 GPU,研發(fā)代號(hào)為‘Ponte Vecchio’,這是首款基于 Xe架構(gòu)的通用 GPU,它采用了 7nm 制程工藝、最新的 Foveros 封裝技術(shù),以及基于 CXL 這一最新的芯片之間連接的標(biāo)準(zhǔn)。Ponte Vecchio 專為 HPC 高性能計(jì)算建模、模擬工作負(fù)載、人工智能訓(xùn)練而設(shè)計(jì)。另外,DG1 是首款基于 Xe架構(gòu)的獨(dú)立圖形顯卡。它具有極高的能效,針對(duì)游戲和內(nèi)容創(chuàng)作內(nèi)容部分能實(shí)現(xiàn)更好的優(yōu)化?!?/p>
英特爾可以在一個(gè)架構(gòu)上,從向上、向下分別延展,支持多種不同領(lǐng)域的應(yīng)用。有了先進(jìn)的制程和架構(gòu),就可以生產(chǎn)出低功耗、高性能的 CPU 和 GPU 產(chǎn)品。但是,當(dāng)用戶要將這些產(chǎn)品與其它 I/O 模塊、通訊模塊、電源管理模塊整合在一起時(shí),如何能夠達(dá)到更好的面積、能效比?這就需要依靠先進(jìn)封裝技術(shù)。
英特爾有兩種先進(jìn)封裝技術(shù) EMIB 和 Foveros。Foveros 3D 堆疊封裝技術(shù),可以通過(guò)在水平布置的芯片之上垂直安置更多面積更小、功能更簡(jiǎn)單的小芯片來(lái)讓方案整體具備更完整的功能。除了功能性的提升,F(xiàn)overos 技術(shù)還可以將過(guò)去漫長(zhǎng)的重新設(shè)計(jì)、測(cè)試、流片過(guò)程都省去,直接將不同 IP、不同工藝的各種成熟方案封裝在一起,從而大幅降低成本,并提升產(chǎn)品上市速度。
同時(shí),英特爾還推出了將 EMIB 和 Foveros 技術(shù)相結(jié)合的創(chuàng)新應(yīng)用技術(shù)——Co-EMIB。Co-EMIB 技術(shù)是 EMIB 和 Foveros 兩項(xiàng)技術(shù)的結(jié)合,在水平同物理層互連和垂直互連同時(shí),實(shí)現(xiàn) Foveros 3D 堆疊之間的水平互連。這樣不管是 2D 水平互連還是 3D 堆疊互連,單片與單片之間都可以實(shí)現(xiàn)近乎于 SoC 級(jí)高度整合的低功耗、高帶寬、高性能表現(xiàn),為芯片封裝帶來(lái)絕佳的靈活性。如果將一塊 Foveros 堆疊的芯片看作是一個(gè)堆疊樓層的“摩天大樓”,那么,Co-EMIB 就可以看作兩個(gè)不同 Foveros 堆棧之間的“天橋”。
此外,英特爾還在推動(dòng)超異構(gòu)計(jì)算實(shí)現(xiàn)。通過(guò) XPU 的異構(gòu)整合和 oneAPI 實(shí)現(xiàn)軟硬協(xié)同,加速實(shí)現(xiàn)超異構(gòu)計(jì)算。XPU 可以包含 CPU、GPU、FPGA 等多種不同的架構(gòu),oneAPI 則是通過(guò)一套軟件接口、一套功能庫(kù)為開(kāi)發(fā)者提供不同架構(gòu)上的編程便利性,同時(shí)保護(hù)已經(jīng)開(kāi)發(fā)過(guò)的程序在架構(gòu)演進(jìn)過(guò)程中不需要重新開(kāi)發(fā),從而輕易地遷移到未來(lái)的架構(gòu)上。這種軟硬結(jié)合在推動(dòng)超異構(gòu)計(jì)算愿景的實(shí)現(xiàn)。
宋繼強(qiáng)舉了“極光”(Aurora)超算架構(gòu)的例子,這是超異構(gòu)計(jì)算愿景的完美呈現(xiàn)。它采用了兩個(gè) 10nm 的至強(qiáng)可擴(kuò)展處理器和 6 個(gè) Xe架構(gòu)的 Ponte Vecchio GPU,同時(shí)內(nèi)存也采用了幾個(gè)不同層級(jí)的內(nèi)存技術(shù),并通過(guò) oneAPI 將底下不同的架構(gòu)能力展現(xiàn)出來(lái),在不同的處理器之間通過(guò) CXL 這種技術(shù)互相連接,在每個(gè)構(gòu)成超算體系大的模塊之間,英特爾用另外一種模塊之間連接的技術(shù)把它互相連接起來(lái),這個(gè)超算架構(gòu)會(huì)應(yīng)用于能源領(lǐng)域的高性能計(jì)算中。