網絡互聯(lián)芯片提供商云脈芯聯(lián)正式發(fā)布自主研發(fā)的國內首款多場景RDMA智能網卡(DPU)產品——xFusion50。
??
目前,隨著數(shù)字經濟的飛速發(fā)展,數(shù)據中心已成為支撐和釋放CPU算力的重要基礎設施,承載著各類數(shù)字技術的應用。高性能網絡作為數(shù)據中心的算力底座,在數(shù)據中心架構演進過程中扮演著重要角色,隨著摩爾定律放緩,多樣性異構算力的崛起,如何通過降低網絡延遲提升數(shù)據中心集群算力性能指標,滿足Serverless云原生算力需求,面臨著諸多技術挑戰(zhàn),如:
????
TCP/IP網絡協(xié)議棧導致收發(fā)報文時延過大,無法滿足當下HPC、AI計算和分布式存儲的高性能需求,同時TCP協(xié)議棧處理導致CPU負載高居不下;
????
隨著網絡帶寬的倍增和集群規(guī)模的擴大,網絡擁塞問題日益突出,確保網絡無損難度加大,網絡0.1%的丟包率將導致上層應用算力性能只能發(fā)揮50%;
????
RDMA網絡技術已是大勢所趨,但在進一步普及過程中缺乏兼容互通,靈活開放的端到端方案,造成在數(shù)據中心大規(guī)模高效部署RDMA網絡有很高的技術門檻。
??
xFusion50是云脈芯聯(lián)成功自主研發(fā)的第一款產品,也是國內首款實現(xiàn)包括支持端到端擁塞控制完整RDMA功能的DPU產品,xFusion50基于硬件實現(xiàn)的可編程擁塞控制算法能夠有效避免網絡擁塞,充分發(fā)揮RDMA技術的低延遲和高性能,支持云計算、高性能計算、AI、存儲集群全場景部署。
??
云脈芯聯(lián)創(chuàng)始人&總裁吳吉朋表示:“云脈芯聯(lián)自去年5月成立以來,堅持以‘專注用戶,引領創(chuàng)芯’為核心理念,在產品研發(fā)上以用戶需求為導向不斷砥礪創(chuàng)新。xFusion50的成功面市可有效幫助用戶降低部署RDMA網絡的技術門檻,實現(xiàn)高帶寬、低延遲的高性能集群組網,全面提升算力集群整體效能。為不斷滿足用戶對多場景算力卸載和高性能網絡的需求,云脈芯聯(lián)下一代高性能DPU芯片的研發(fā)也在有序進行中,不久即將面世,敬請期待?!?/p>
xFusion50產品核心亮點
支持可編程擁塞控制算法
可編程擁塞控制算法是實現(xiàn)端到端無損網絡的關鍵技術,xFusion50不僅能支持業(yè)界主流的擁塞控制算法,還可以通過開放可編程的底層網絡接口,可根據客戶的組網特點和上層業(yè)務的需求,靈活支持多種擁塞控制算法,最大化業(yè)務的流量吞吐。
????
通過自主研發(fā)HyperDirect技術支持GPU Direct RDMA
為跨計算節(jié)點的GPU實現(xiàn)遠程內存直接訪問,跳過CPU以降低時延、提升帶寬,提升分布式異構算力集群的整體效能。
??
支持網絡/存儲全場景卸載加速
支持vSwitch全卸載,實現(xiàn)云上VPC網絡全功能;支持存儲卸載,對接分布式存儲NVMe-oF(TCP/RDMA),充分釋放宿主機CPU資源。并通過支持VirtIO實現(xiàn)彈性網絡和彈性存儲,滿足云上用戶無縫遷移和快速恢復的業(yè)務訴求。
xFusion50產品適用場景及解決方案
高性能集群場景
AI、HPC、分布式存儲等高性能集群場景中,對節(jié)點間的數(shù)據處理與通信有著低時延和高吞吐的訴求,xFusion50支持基于以太網的RDMA組網和可編程擁塞控制算法,實現(xiàn)高性能場景對低時延和高吞吐的需求,并配合云脈芯聯(lián)提供的xsc-easy-bench可大幅提升業(yè)務上線調試效率。
云計算場景
傳統(tǒng)云計算架構基于CPU的軟件虛擬化技術提供IaaS業(yè)務,大量CPU資源被用于處理與租戶業(yè)務無關的hypervisor層,租戶與云hypervisor共享CPU,租戶業(yè)務容易被管理業(yè)務影響,造成抖動。xFusion50為云計算場景提供了一種基于裸金屬云的基礎設施架構,將hypervisor層卸載到xFusion50上,可滿足虛擬機、裸金屬、容器多種云上資源供給,并提供網絡/存儲加速功能,兼顧靈活性與高性能。