高性能計算(HPC)代表了當(dāng)今技術(shù)的頂峰,現(xiàn)代一些最重要的發(fā)現(xiàn)都借助了這些先進(jìn)的機(jī)器?,F(xiàn)在,我們正站在新一代高性能計算的入口處,其技術(shù)的可擴(kuò)展性和普遍性能夠為我們的生活帶來翻天覆地的變化。
這一點在抗擊新冠肺炎疫情中表現(xiàn)得最為明顯。疫情爆發(fā)之初,科研機(jī)構(gòu)就在研究實驗室以及“高性能計算即服務(wù)”的云環(huán)境中利用這些先進(jìn)的超級計算機(jī),來監(jiān)測、研究、治療新冠病毒,并運用此項技術(shù)開發(fā)了用于治療新冠肺炎的藥物。人們正以驚人的速度逐步實現(xiàn)這些目標(biāo),這離不開高性能計算技術(shù)的廣泛應(yīng)用。
其實在迎來E級運算時代之際,我們才剛剛起步。現(xiàn)階段,超級計算已經(jīng)推動了科學(xué)探索的發(fā)展,并能夠幫助解決氣候變化和慢性病治療等關(guān)鍵問題。未來,它將有助于解決我們尚未遇到、甚至無法想象的問題和危機(jī)。
英特爾的目標(biāo)是普及高性能計算并實現(xiàn)高性能計算普及化。為此,我們必須擁抱各種技術(shù),以實現(xiàn)數(shù)量級的性能提升、轉(zhuǎn)變高性能計算的可訪問性并重新思考我們?nèi)绾螛?gòu)建為這些系統(tǒng)提供動力的組件?;诖耍覀円孕阅?、開放性和規(guī)模作為策略基礎(chǔ)。
性能:從無所不在的計算架構(gòu)開始
x86架構(gòu)是當(dāng)今高性能計算的發(fā)動機(jī),為絕大多數(shù)系統(tǒng)提供動力。龐大的安裝量使開發(fā)人員和客戶能夠訪問世界上最大的生態(tài)系統(tǒng)以支持和部署高性能計算工作負(fù)載。x86 架構(gòu)還提供了始終如一的代際性能提升。
現(xiàn)有的這一代英特爾®至強(qiáng)®可擴(kuò)展處理器已被我們的高性能計算生態(tài)系統(tǒng)合作伙伴廣泛采用,而下一代英特爾至強(qiáng)可擴(kuò)展處理器Sapphire Rapids也增加了新功能,目前也作為樣品正提供給客戶進(jìn)行測試。Sapphire Rapids為高性能計算生態(tài)系統(tǒng)提供多種功能,首次封裝了能夠充分利用Sapphire Rapids多單元架構(gòu)的高帶寬內(nèi)存HBM2e。Sapphire Rapids還帶來了增強(qiáng)的性能、新的加速器、PCIe 5.0和其他針對人工智能、數(shù)據(jù)分析和高性能計算負(fù)載而優(yōu)化的新功能。
高性能計算負(fù)載發(fā)展迅猛。它們變得更加多樣化、專有化,也同時需要混合的異構(gòu)架構(gòu)。盡管x86架構(gòu)仍然是標(biāo)量負(fù)載的動力來源,但如果要想實現(xiàn)數(shù)量級的性能提升并進(jìn)一步超越E級運算時代,就必須以批判性的思維來審視高性能計算負(fù)載在矢量、矩陣和空間架構(gòu)中的運行方式,并且必須確保這些架構(gòu)能夠無縫地協(xié)同配合。
英特爾已經(jīng)采用了“整體工作負(fù)載”策略,即針對特定負(fù)載的加速器和圖形處理器(GPU),無論是硬件還是軟件,都可以與中央處理器(CPU)無縫配合。我們正在通過下一代英特爾至強(qiáng)可擴(kuò)展處理器和Xe HPC GPU(代號“Ponte Vecchio”)來實施該戰(zhàn)略,它們將用于阿貢國家實驗室的2百億億次級*極光(Aurora)超級計算機(jī)。Ponte Vecchio具備最高的單插槽和單節(jié)點計算密度,利用我們先進(jìn)的封裝技術(shù)即嵌入式多芯片互連橋接(EMIB)和Foveros封裝了47個單元。Ponte Vecchio上運行著100多個高性能計算應(yīng)用。我們還與包括ATOS、戴爾、惠普、聯(lián)想、浪潮、Quanta以及超微在內(nèi)的合作伙伴和客戶合作,在他們最新的超級計算機(jī)上安裝部署Ponte Vecchio處理器。
通過開放性實現(xiàn)高性能計算的普及
要想真正普及高性能計算并實現(xiàn)高性能計算普及化,就需要一種開放的協(xié)作方式。英特爾致力于提供基于行業(yè)標(biāo)準(zhǔn)的開放平臺,以此促進(jìn)廣泛的協(xié)作。我們的目標(biāo)是推動標(biāo)準(zhǔn)制定并創(chuàng)建關(guān)鍵硬件平臺,讓整個行業(yè)團(tuán)結(jié)在一起,在此基礎(chǔ)上進(jìn)行開發(fā)。
眾所周知,GPU編程由于缺乏適用標(biāo)準(zhǔn)而發(fā)展受阻。因此自從GPU進(jìn)入高性能計算領(lǐng)域以來,行業(yè)就面臨著CPU和GPU各有一個獨立的軟件堆棧的挑戰(zhàn),而oneAPI編程模式則試圖打破這些孤島。
oneAPI是一種開放、統(tǒng)一的跨架構(gòu)編程模式,適用于CPU、GPU和諸如FPGA等的加速器架構(gòu),能夠允許異構(gòu)計算環(huán)境的編程,所有這些都使用一個代碼庫和軟件堆棧。如此一來,開發(fā)人員只需跨架構(gòu)編程一次,而且客戶也不會受制于某個單獨的供應(yīng)商。
下個月,我們將發(fā)布英特爾® oneAPI 2022工具包。相比于去年12月份發(fā)布的oneAPI 2021版本,該款新的工具包增加了900多項新功能。通過第一個統(tǒng)一的C++/SYCL/Fortran 編譯器和數(shù)據(jù)并行Python,即將發(fā)布的版本增加了面向CPU和GPU的跨架構(gòu)開發(fā)功能。今天,我們還宣布建立另外兩個oneAPI卓越中心,加入由領(lǐng)先的科研學(xué)術(shù)機(jī)構(gòu)組成的蓬勃發(fā)展的全球生態(tài)系統(tǒng),提供開源端口并擴(kuò)展硬件支持、新技術(shù)、服務(wù)和課程,以推動oneAPI在生態(tài)系統(tǒng)內(nèi)部的普及。
我們深知,要想真正普及高性能計算,還有很多工作有待完成?,F(xiàn)階段我們正在做的事將使人們能夠在未來隨時隨地利用最新的高性能計算技術(shù)。
大規(guī)模制造:英特爾的IDM 2.0戰(zhàn)略
高性能計算普及化需要規(guī)模效應(yīng)。英特爾致力于提供推動創(chuàng)新和增長所需的組件和技術(shù)。通過英特爾IDM 2.0戰(zhàn)略的差異化優(yōu)勢,我們能夠帶領(lǐng)高性能計算客戶進(jìn)入創(chuàng)新、制造和產(chǎn)品領(lǐng)先的新時代。
我們正在快速執(zhí)行為期多年的 IDM 2.0戰(zhàn)略,這對我們的高性能計算客戶來說,是個大好消息,因為我們能夠利用行業(yè)領(lǐng)先的制造能力以及我們在封裝技術(shù)方面的領(lǐng)先地位來設(shè)計最好的產(chǎn)品,并使用最好的IP,提供下一個超級計算機(jī)時代所需的產(chǎn)品。
我們堅定不移地致力于實現(xiàn)高性能計算普及化這一承諾,為此我們也持續(xù)投入以推動技術(shù)進(jìn)步來解決最棘手的問題。
當(dāng)我們越來越接近新一代超級計算機(jī)的時候,我們能取得哪些成就?我無比期待答案的揭曉。
Jeff McVeigh是英特爾公司副總裁兼超級計算事業(yè)部總經(jīng)理