IDC 預(yù)測,到 2025 年,全球?qū)⒂?416 億臺物聯(lián)網(wǎng)設(shè)備,并將產(chǎn)生 79.4 zettabytes(zb)的數(shù)據(jù)。雖然數(shù)據(jù)被看作未來的石油,但是同樣也需要強(qiáng)大的算力將無序的數(shù)據(jù)加以提取,形成有用信息,才能給用戶帶來價(jià)值。由于數(shù)據(jù)在源源不斷產(chǎn)生,只憑借 CPU 進(jìn)行計(jì)算已經(jīng)遠(yuǎn)遠(yuǎn)無法滿足需求,于是設(shè)計(jì)人員開始采用異構(gòu)架構(gòu)為數(shù)據(jù)中心加速,FPGA 發(fā)揮越來越大的作用。
作為 FPGA 領(lǐng)域的獨(dú)角獸,賽靈思非常明白自身優(yōu)勢,去年 3 月,新任 CEO Victor peng 宣布公司從器件到平臺轉(zhuǎn)型的三大策略,其中非常重要的一項(xiàng)就是數(shù)據(jù)中心優(yōu)先策略。去年 10 月,賽靈思推出了 ACAP 系列產(chǎn)品,同時(shí)推出了面向數(shù)據(jù)中心加速的第一款自適應(yīng)計(jì)算加速卡 Alveo 平臺,11 月又快速推出了 Alveo 系列 U280 產(chǎn)品,但是賽靈思的愿景是不僅加速計(jì)算,同時(shí)加速網(wǎng)絡(luò)和存儲,因此近期在原來的基礎(chǔ)上又推出了 Alveo U50,將數(shù)據(jù)中心優(yōu)先策略再次向前推進(jìn)。
據(jù)賽靈思數(shù)據(jù)中心業(yè)務(wù)部產(chǎn)品規(guī)劃和市場營銷總監(jiān) Jamon Bowen 介紹,Alveo U50 卡是業(yè)界首款支持第四代 PCIe ( PCIe Gen 4)的加速卡 ,特別為單個(gè)可重配置的 FPGA 平臺就能大幅加速各種不同的關(guān)鍵計(jì)算、網(wǎng)絡(luò)和存儲工作負(fù)載而設(shè)計(jì)。相對 U280 擅長計(jì)算,U50 在計(jì)算方面較弱,在網(wǎng)絡(luò)和存儲方面更強(qiáng)。
Alveo U50 具有三大特點(diǎn):小尺寸、低功耗、可編程。
由于采用 UltraScale+的架構(gòu),集成了超高帶寬的 HBM2 存儲器技術(shù),率先使用半高半長的外形,Alveo U50 尺寸大幅度縮?。煌ㄟ^支持標(biāo)準(zhǔn)的 PCIe 服務(wù)器插槽和僅相當(dāng)于現(xiàn)有 Alveo 卡 1/3 的功耗,Alveo U50 大幅擴(kuò)展了自適應(yīng)加速技術(shù)可以部署的范圍,從而為要求嚴(yán)苛的計(jì)算、網(wǎng)絡(luò)與存儲工作負(fù)載帶來了前所未有的高吞吐量與低延時(shí)。8GB HBM2 提供了超過 400Gbps 的數(shù)據(jù)傳輸速度, QSFP 端口提供了高達(dá) 100 Gbps 的網(wǎng)絡(luò)連接。此外,高速網(wǎng)絡(luò) I/O 還支持各種前沿應(yīng)用,如 NVMe-oF?解決方案(NVM Express over Fabrics?),解耦計(jì)算存儲和專業(yè)金融服務(wù)應(yīng)用。
Jamon Bowen 強(qiáng)調(diào),U50 采用的是第四代 PCIe 即插即用型卡,這是市面上最前沿的技術(shù),很多服務(wù)器剛剛開始支持這一標(biāo)準(zhǔn),這種卡對于存儲加速非常關(guān)鍵。
U50 的重點(diǎn)是計(jì)算、網(wǎng)絡(luò)和存儲加速。Jamon Bowen 對這一定位的解釋是,現(xiàn)在的總體趨勢是越來越多的應(yīng)用需要專用架構(gòu),要求硬件和算法能夠匹配,從而達(dá)到最佳運(yùn)行效果。每一代網(wǎng)絡(luò)都不盡相同,而且網(wǎng)絡(luò)上的數(shù)據(jù)也不同,數(shù)據(jù)運(yùn)行的要求也不盡相同。這就需要硬件能夠跟上專用架構(gòu)的要求,同時(shí)還要提升性能,硬件能夠發(fā)揮它最優(yōu)的功能。
在數(shù)據(jù)中心客戶經(jīng)常抱怨器件編程非常困難,Alveo 具有開放的平臺和環(huán)境,簡化了硬件編程的程序,能夠通過公共平臺進(jìn)行加速,讓開發(fā)者便捷地使用這一平臺。Jamon Bowen 解釋,隨著越來越多開發(fā)者使用該平臺,我們會加入更多產(chǎn)品,實(shí)現(xiàn)原來只有在軟件部分才有可能的硬件 IP 的靈活應(yīng)變能力。解決包括數(shù)據(jù)分析、視頻與圖象處理、機(jī)器學(xué)習(xí)、生命科學(xué)和金融計(jì)算等領(lǐng)域地問題。
對比 CPU、GPU,性能大幅度提升
加速器性能到底提升多少?對比一下就會一目了然。賽靈思官方和 CPU 以及 GPU 進(jìn)行了對比。
語音翻譯應(yīng)用加速
在語音翻譯應(yīng)用中,CPU 和 GPU 無法實(shí)現(xiàn)高吞吐量與低時(shí)延推斷性能,可以看出 Alveo U50 是英偉達(dá) GPU T4 地 10 倍。
數(shù)據(jù)分析加速應(yīng)用
在數(shù)據(jù)分析應(yīng)用中,數(shù)據(jù)庫查詢加速運(yùn)行 TPC-H Query5 體系,對比英特爾的多核處理器 XEON 系列,加入 Alveo U50 的運(yùn)行速度提升 4 倍,而且其尺寸較小可以加入多張卡,進(jìn)行多倍加速。
金融建模應(yīng)用
對比英特爾的 CPU 和英偉達(dá)的 GPU,可以看出,一塊 Alveo U50 性能是對應(yīng) CPU 和 GPU 的 20 倍,值得強(qiáng)調(diào)的是成本只有 GPU 的一半。Jamon Bowen 解釋,我們一直在開發(fā)計(jì)算庫,尤其是量化的開發(fā)者能夠在 Alveo 當(dāng)中使用這些數(shù)據(jù)函數(shù)進(jìn)行最優(yōu)化的編碼,同時(shí)能夠在我們這個(gè)平臺上完成其他的應(yīng)用設(shè)計(jì),建立這樣一個(gè)模型。這個(gè)對于計(jì)算加速來說是非常重要的擴(kuò)展,尤其能夠把所有的數(shù)學(xué)函數(shù)都吸收進(jìn)來。
電子貿(mào)易業(yè)務(wù)
金融界有一個(gè)從技術(shù)到交易的衡量指標(biāo),就是看你獲得市場數(shù)據(jù)之后下單完成交易之間需要多長時(shí)間。如果用戶使用 U50,時(shí)延低于 500 納秒,且性能穩(wěn)定。相對于 CPU,U50 的性能在時(shí)間上是 CPU 的 20 倍。Jamon Bowen 認(rèn)為,使用 Alveo 進(jìn)行加速,能夠在很多網(wǎng)絡(luò)端口完成應(yīng)用的加速,而所需的時(shí)間往往是 CPU 剛剛開始進(jìn)行對話的時(shí)間。
計(jì)算存儲應(yīng)用
在計(jì)算存儲應(yīng)用中,過去字節(jié)都傳輸?shù)絻?nèi)存才能壓縮、解壓縮等處理,流程非常復(fù)雜,采用 Alveo U50 平臺,壓縮、解壓縮、擦除編碼、加密都在同一個(gè)平臺上繼續(xù)寧加速,是 CPU 性能的 20 倍。
再看 Hadoop 加速應(yīng)用,如果要做高性能的計(jì)算,數(shù)據(jù)無法壓縮,基礎(chǔ)設(shè)施需要擴(kuò)大一倍,而且還需要更多的存儲帶寬。如果采用 U50 既可以保留帶寬也可以進(jìn)行壓縮,而且存儲空間和帶寬只需要原來的一半。因此部署成本只有原來的一半,在壓縮的同時(shí)性能不會受到損失。
對比兩個(gè)雙 CPU 的服務(wù)器和搭載兩個(gè) Alveo U50 的 Alveo 服務(wù)器,可以看出,前者 192TB,每個(gè)節(jié)點(diǎn)壓縮吞吐量 1GB/s,后者 96TB(192TB 有效),每個(gè)節(jié)點(diǎn)壓縮吞吐量 20GB/s。
為什么賽靈思的硬件運(yùn)行速度改善如此之大?Jamon Bowen 的解釋是,要優(yōu)化性能,要有定制的數(shù)據(jù)途徑,還要有定制的進(jìn)度。具備這兩個(gè)條件后,應(yīng)用才能夠非常順利的進(jìn)行處理,而無需不斷地進(jìn)到一些存儲的層級,經(jīng)過非常復(fù)雜的流程就能直接處理。賽靈思在這方面能夠給硬件加速,可以通過再編程的方式來調(diào)整一些設(shè)置。
異構(gòu)計(jì)算是數(shù)據(jù)中心的未來,很多公司在擁抱加速架構(gòu)為核心的解決方案,U50 不僅能夠提供硬件加速,而且還具有靈活應(yīng)變的特性。Jamon Bowen 認(rèn)為,壓縮技術(shù)日新月異,有 ZS、ZT、LZ,還有超大規(guī)模客戶發(fā)布一些新的壓縮算法。我們能夠在硬件層面上進(jìn)行加速,還能夠在硬件層面上實(shí)現(xiàn)可編程。一旦有了新的標(biāo)準(zhǔn)計(jì)算算法迭代之后,賽靈思就能夠充分利用 FPGA 的靈活性,在我們平臺上迅速部署,其它競爭對手很難做到。
與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)允許,不得轉(zhuǎn)載!