近日,NVIDIA和戴爾科技發(fā)布了一則重磅消息:由NVIDIA 提供加速的多款戴爾PowerEdge 系統(tǒng),可助力企業(yè)通過AI高效地實現(xiàn)業(yè)務(wù)轉(zhuǎn)型。
這是雙方有史以來在AI領(lǐng)域最大規(guī)模的合作,NVIDIA的旗艦產(chǎn)品Hopper GPU和BlueField-2 DPU都在戴爾的PowerEdge服務(wù)器得以應(yīng)用。這一合作傳達出的訊息,不僅反映了IT變革當(dāng)下的發(fā)展方向,同時也反映了兩大巨頭對于企業(yè)數(shù)字化轉(zhuǎn)型過程如何導(dǎo)入AI、提升算力、提升效率的長遠布局和思考。
15款戴爾PowerEdge系統(tǒng)可利用 NVIDIA全棧AI解決方案,包括GPU、DPU以及NVIDIA AI Enterprise 軟件套件,為企業(yè)構(gòu)建各類 AI 應(yīng)用程序奠定基礎(chǔ),包括語音識別、網(wǎng)絡(luò)安全、推薦系統(tǒng)、以及越來越多突破性的基于語言的服務(wù)。
NVIDIA GPU+DPU硬核“站臺”戴爾服務(wù)器
最新公布的戴爾PowerEdge系統(tǒng),硬件方面有兩大亮點值得關(guān)注:
首先是采用了NVIDIA BlueField-2 DPU。
對于當(dāng)前市場上每年交付的數(shù)據(jù)中心服務(wù)器,NVIDIA曾經(jīng)算過一筆賬:3000萬臺設(shè)備,有1/3用于運行軟件定義的數(shù)據(jù)中心堆棧,而這種工作負(fù)載的增長速度遠快于摩爾定律,除非卸載并加速這類工作負(fù)載,否則數(shù)據(jù)中心用來運行應(yīng)用程序的CPU算力會越來越少。“新時代的計算機需要新的芯片、新的系統(tǒng)架構(gòu)、新的網(wǎng)絡(luò)、新的軟件和工具”,黃仁勛曾指出。
NVIDIA BlueField DPU (數(shù)據(jù)處理器 )可以卸載、加速和隔離數(shù)據(jù)中心的網(wǎng)絡(luò)和操作系統(tǒng)堆棧,使用 NVIDIA DPU的企業(yè)可以將數(shù)據(jù)中心的能源使用減少近25%,從而有望節(jié)約數(shù)百萬美元的能源費用。同時,配備 NVIDIA BlueField DPU的戴爾 PowerEdge 服務(wù)器優(yōu)化了私有云、混合云和多云部署(包括運行 VMware vSphere 的部署)的性能和效率。
其次,戴爾PowerEdge系統(tǒng)采用了NVIDIA Hopper GPU,這使得系統(tǒng)在處理數(shù)據(jù)的效率方面提升了 25 倍,可將各類 AI 模型部署到生產(chǎn)環(huán)境中。與上一代非加速服務(wù)器相比,全新的PowerEdge 服務(wù)器在參數(shù)規(guī)模超5000億的大型語言模型上的推理能效提高了300倍。
Hopper GPU作為NVIDIA的旗艦級產(chǎn)品,相比前代Ampere GPU,在某些方面實現(xiàn)了成倍的性能提升,例如:Hopper DPX指令集在Dynamic Programing方面帶來了40X的速度提升;NVIDIA在Hopper架構(gòu)中引入新一代流式多處理器的FP8張量核心(Tensor Core),用來加速AI訓(xùn)練和推理;Hopper Transformer引擎能更好實現(xiàn)動態(tài)混合精度的處理(Dynamic Mixed-Precision Processing);Hopper中引入了新的線程塊集群機制,可實現(xiàn)跨單元進行協(xié)同計算……
通過硬件架構(gòu)的升級迭代,NVIDIA大力推動了下一代GPU應(yīng)對巨量化、多樣化的數(shù)據(jù)需求,既能夠幫助企業(yè)削減AI的部署成本,并且在提供相同AI性能的同時,實現(xiàn)更高的能效和更低的總體擁有成本,這應(yīng)該也是促成與戴爾大規(guī)模合作的主要原因。
企業(yè)如何通過AI解決當(dāng)前挑戰(zhàn)?
NVIDIA與戴爾已經(jīng)進行了長達25年的合作,面向新時代企業(yè)經(jīng)營的IT新需求,AI成為幫助企業(yè)構(gòu)筑IT優(yōu)勢、且進一步打造核心業(yè)務(wù)優(yōu)勢的關(guān)鍵之一。
在日前戴爾的PowerEdge.Next 活動上,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛、戴爾技術(shù)創(chuàng)始人兼首席執(zhí)行官Michael Dell,都從AI視角分析了未來的發(fā)展。
黃仁勛表示:“AI 能夠為所有行業(yè)加速自動化進程,進而為所有企業(yè)帶來變革。通過與戴爾科技密切合作,我們能夠觸及全球范圍內(nèi)的機構(gòu),通過強大又節(jié)能的 AI 計算平臺,提高現(xiàn)代企業(yè)的智能化程度?!?/p>
Michael Dell表示:“隨著全球數(shù)據(jù)量的擴大,大部分信息技術(shù)將用于機器智能服務(wù)。如今需要為實現(xiàn)‘AI 優(yōu)先’而構(gòu)建系統(tǒng),這恰為戴爾和NVIDIA的合作創(chuàng)造了巨大的機遇。”
軟件許可助推AI落地“又快又好”
為助力客戶快速啟動和運行 AI 項目,使用 NVIDIA Hopper GPU加速的戴爾PowerEdge服務(wù)器附帶了NVIDIA AI Enterprise 軟件許可。這將為企業(yè)帶來哪些實際的好處呢?
NVIDIA AI Enterprise作為一款端到端、安全、云原生的AI軟件套件,簡化了預(yù)測性AI的開發(fā)和部署,且針對廣泛的領(lǐng)域和行業(yè)特定工作負(fù)載提供了全球性的企業(yè)級支持。如今,NVIDIA AI Enterprise包括50多個框架和預(yù)訓(xùn)練模型以及一套AI工作流,所有這些均可助力機構(gòu)加快部署時間,同時降低生產(chǎn)就緒型AI的成本。
NVIDIA AI Enterprise 3.0 中包含的 NVIDIA AI 框架包括:用于基因組學(xué)的NVIDIA Clara Parabricks、用于醫(yī)學(xué)成像的MONAI、用于網(wǎng)絡(luò)安全的NVIDIA Morpheus、用于智能視頻分析的NVIDIA Metropolis、用于視覺 AI 的NVIDIA DeepStream、用于推薦系統(tǒng)的NVIDIA Merlin等。
一直以來,企業(yè)在部署和管理AI應(yīng)用時,面對不同工作負(fù)載或是大規(guī)模AI模型部署時,開發(fā)周期長、對開發(fā)人員/IT運維人員的技術(shù)能力要求高,是普遍的難題。而NVIDIA AI Enterprise 3.0覆蓋了豐富的AI框架,對不同領(lǐng)域應(yīng)用和部署AI方面進一步降低了門檻。
目前,有意向的企業(yè)可在NVIDIA LaunchPad 上的數(shù)十個實操實驗室中免費體驗 NVIDIA AI Enterprise,全新 AI 工作流實驗室預(yù)計將于下周推出。
寫在最后
算力是IT數(shù)據(jù)中心的動力。如今,IT應(yīng)用對算力提出了更高的需求,只有進行持續(xù)的算力提升,才能更好地支撐新場景的發(fā)展,包括云、5G、人工智能、邊緣計算等。
服務(wù)器的持續(xù)創(chuàng)新,對確保企業(yè)有能力應(yīng)對以數(shù)據(jù)為中心的未來至關(guān)重要。此次在雙方的合作中,NVIDIA通過完善的軟硬件方案賦能了戴爾的下一代服務(wù)器系統(tǒng),有助于企業(yè)用戶在部署AI和其他現(xiàn)代工作負(fù)載時,能夠從數(shù)據(jù)和IT投資中獲取最大價值。