作為專為NVIDIA? BlueField? 網(wǎng)絡(luò)平臺(tái)而設(shè)計(jì)的數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件框架,NVIDIA? DOCA? 使廣大開(kāi)發(fā)者能夠利用其行業(yè)標(biāo)準(zhǔn)API 在 NVIDIA BlueField 網(wǎng)絡(luò)平臺(tái)上快速創(chuàng)建應(yīng)用程序和服務(wù),并啟用 NVIDIA BlueField DPU 和NVIDIA BlueField SuperNIC 的強(qiáng)大功能,提供突破性的網(wǎng)絡(luò)、安全和存儲(chǔ)性能。
近日發(fā)布的 NVIDIA DOCA 2.6 引入了 NVIDIA BlueField 網(wǎng)絡(luò)平臺(tái)的新增功能和增強(qiáng)功能,可實(shí)現(xiàn)高性能和安全的 AI 云,從而大規(guī)模加速數(shù)據(jù)中心工作負(fù)載和 AI 應(yīng)用。借助可編程擁塞控制(PCC)和數(shù)據(jù)路徑加速(DPA),更新的 DOCA SDK 也為開(kāi)發(fā)者提供了廣泛的開(kāi)發(fā)框架,并提供新增功能和增強(qiáng)功能。
專為 AI 云而設(shè)計(jì)的網(wǎng)絡(luò)平臺(tái)
NVIDIA? Spectrum-X? 是適用于 AI 云“東西向”流量的以太網(wǎng)參考架構(gòu),其中主要包括 NVIDIA BlueField-3 SuperNIC 和 Spectrum-4 交換機(jī)。Spectrum-X 通過(guò)創(chuàng)新的高性能網(wǎng)絡(luò)為 AI 云提供峰值性能,從而有效滿足 AI 工作負(fù)載對(duì) AI 云基礎(chǔ)設(shè)施的性能需求。
最新的DOCA 2.6 版本支持 Spectrum-X 參考架構(gòu) 1.0,優(yōu)化了 Spectrum-4 交換機(jī)和 BlueField-3SuperNIC 的性能協(xié)同,不但為 AI 工作負(fù)載提供優(yōu)化的無(wú)損 RoCEv2 和動(dòng)態(tài)路由功能,而且支持零接觸 RoCE擁塞控制(ZTR-CC)和可編程的 DOCA-PCC,從而顯著提高 AI 云的性能,并為租戶提供確定和隔離的性能。
開(kāi)發(fā)硬件加速的網(wǎng)絡(luò)應(yīng)用程序
DOCA Flow 是用于卸載和加速網(wǎng)絡(luò)轉(zhuǎn)向(Network Steering)的開(kāi)發(fā)庫(kù),可以在軟件定義網(wǎng)絡(luò)(SDN)的服務(wù)中提供可編程的快速流水線(Pipeline),并通過(guò)采用 DOCA-CT 管道(Pipe)來(lái)加速連接跟蹤和管理會(huì)話狀態(tài)。
在 DOCA 2.6 版本中,DOCA-CT 通過(guò)簡(jiǎn)化流水線來(lái)提升效率,并支持 NAT64 來(lái)實(shí)現(xiàn) IPv6 和 IPv4 之間的地址轉(zhuǎn)換,從而使連接跟蹤與 NAT 流水線相結(jié)合來(lái)獲得更好的性能。同時(shí),DOCA Flow 可以通過(guò)修改可選字段來(lái)擴(kuò)展 Geneve 隧道,且通過(guò)啟用 Geneve 來(lái)替代如 MPLS 等其他隧道方案。DOCA Flow 還支持將硬件哈希計(jì)算公開(kāi)給軟件,對(duì)于復(fù)雜的流水線可以對(duì)齊軟硬件的哈希結(jié)果。
DOCA 服務(wù)新增功能
基于 BlueField 的分布式路由和 EVPN 服務(wù)
DOCA 基于主機(jī)的網(wǎng)絡(luò)(HBN)服務(wù) 2.1 版本支持 EVPN 增強(qiáng)功能,可為大規(guī)模裸金屬云構(gòu)建無(wú)控制器的虛擬私有云(VPC)網(wǎng)絡(luò)。同時(shí),它支持 L3 EVPN 來(lái)實(shí)現(xiàn)對(duì)稱的 VXLAN 路由,從而實(shí)現(xiàn) L3 的多租戶安全;支持本地 VRF 路由泄露(測(cè)試版),從而隔離租戶以安全訪問(wèn)互聯(lián)網(wǎng)和共享服務(wù);支持多跳 eBGP 對(duì)等互連,從而適用于大規(guī)模 VXLAN EVPN 的部署;支持用于有狀態(tài)訪問(wèn)控制列表(ACL)的 L3 接口綁定,從而實(shí)現(xiàn)對(duì) L3 流量的過(guò)濾;支持其它面向 DPU 的接口,以便與其他服務(wù)進(jìn)行集成。
計(jì)時(shí)即服務(wù)解決方案
DOCA Firefly 服務(wù)利用 BlueField SuperNIC 和 DPU 來(lái)加速時(shí)間同步。在 DOCA 2.6 版本中,它增加了時(shí)鐘跳轉(zhuǎn)時(shí)的時(shí)間檢查功能,從而可以對(duì)伺服計(jì)時(shí)算法進(jìn)行修復(fù)。DOCAFirefly 服務(wù)可以廣泛的應(yīng)用于電信、傳媒娛樂(lè)、金融服務(wù)等行業(yè),比如電信行業(yè)在 5G移動(dòng)通信部署的基于網(wǎng)絡(luò)的時(shí)間同步,傳媒娛樂(lè)行業(yè)基于虛幻引擎(Unreal Engine)的虛擬制作,以及金融服務(wù)行業(yè)滿足 MiFID II合規(guī)性的高頻交易(HFT)。
更多其他更新
BlueField 平臺(tái)增強(qiáng)功能
平臺(tái)安全 – UEFI 密碼策略
平臺(tái)管理 – BMC 健壯性
BlueField 安裝包簡(jiǎn)化升級(jí) – 增加 BMC 和 eROT 固件
結(jié)束語(yǔ)
不同規(guī)模的 AI 工作負(fù)載和不同類型的 AI 應(yīng)用程序需要不同的、復(fù)雜的網(wǎng)絡(luò)。作為 AI 和加速計(jì)算領(lǐng)域的領(lǐng)導(dǎo)者,NVIDIA 提供針對(duì) AI 進(jìn)行優(yōu)化的端到端網(wǎng)絡(luò)平臺(tái)及解決方案,實(shí)現(xiàn)以峰值效率有效運(yùn)行的 AI 網(wǎng)絡(luò),從而提高 AI 云的性能。從加速計(jì)算全棧架構(gòu)的角度,NVIDIA 將 AI 網(wǎng)絡(luò)與 GPU 加速計(jì)算系統(tǒng)相結(jié)合,從硬件和軟件進(jìn)行技術(shù)互補(bǔ)和協(xié)同,提升全棧架構(gòu)各層之間的運(yùn)營(yíng)效率,從而應(yīng)對(duì)企業(yè)將 AI 嵌入現(xiàn)有應(yīng)用和服務(wù)時(shí)所面臨的基礎(chǔ)設(shè)施運(yùn)營(yíng)和部署挑戰(zhàn)。