作為一種硬件可重構(gòu)的體系結(jié)構(gòu),FPGA經(jīng)常被用作專用芯片(ASIC)的小批量替代品,隨著全球數(shù)據(jù)中心的大規(guī)模部署,以及人工智能應(yīng)用的落地,FPGA憑借強大的計算能力和高度的靈活性有了更多的用武之地。
?
FPGA最大的優(yōu)勢就是處理速度快,因為引腳比較多,而且其邏輯單元可以根據(jù)算法需求重組而產(chǎn)生定制化的數(shù)據(jù)通路,非常適合處理大批量的數(shù)據(jù)流。
?
簡單來說,CPU中有控制取指、譯碼等流程,數(shù)據(jù)處理流程復(fù)雜;而FPGA是可編程的,每個邏輯單元的功能在重編程(燒寫)時就已經(jīng)確定,不需要指令。其實FPGA和GPU內(nèi)都有大量的計算單元,計算能力都很強,但是 GPU在數(shù)據(jù)處理過程中,需要反復(fù)調(diào)取片外存儲器中的數(shù)據(jù),FPGA只要數(shù)據(jù)一次性流入再流出,算法就完成了,因此在批量數(shù)據(jù)處理方面,FPGA完勝。
?
正是因為數(shù)據(jù)處理的優(yōu)勢,F(xiàn)PGA 在數(shù)據(jù)中心加速和 AI 推理中成了香餑餑,銷量大漲,2018 年全球 FPGA 市場達到了 60 億美金,MRFR預(yù)測FPGA在2025年有望達到約125.21億美元,Xilinx也預(yù)估數(shù)據(jù)中心對芯片的需求在未來五年將有67%的年復(fù)合增長率。
?
FPGA是否能夠獨立部署?
雖然FPGA有很強的計算能力,但是在數(shù)據(jù)中心都是和CPU協(xié)同工作,采用“CPU+FPGA”的異構(gòu)架構(gòu)進行加速。隨著FPGA應(yīng)用范圍的增加,業(yè)內(nèi)有人也提出,未來FPGA是否會脫離CPU獨立部署?
?
計算存儲架構(gòu)
?
賽靈思數(shù)據(jù)中心業(yè)務(wù)部產(chǎn)品規(guī)劃和市場營銷總監(jiān)Jamon Bowen在接受與非網(wǎng)記者的采訪中,用一個應(yīng)用案例做了解釋,“這是合作伙伴開發(fā)的一個存儲盒的解決方案,采用了Alveo U50,其前端是以太網(wǎng),后端是固態(tài)硬盤,其中加速IP和存儲幾乎是放在了同一個空間里,有意思的是這個系統(tǒng)沒有CPU,是加速器和外圍直接連到網(wǎng)絡(luò)上,所以未來數(shù)據(jù)中心會被異構(gòu)計算驅(qū)動,沒有必要和這個系統(tǒng)連在同一個地方,也就是因為執(zhí)行的處理器的高性能,深度學(xué)習(xí)、存儲、加速等就沒有必要進行本地連接,可以做異地系統(tǒng)連接,這也預(yù)示著未來數(shù)據(jù)中心一個布局的趨勢。”
?
在終端,有些自動駕駛公司的車上系統(tǒng)中就采用了FPGA?完成一些實時檢測識別任務(wù)。小鵬汽車的副總裁、機器學(xué)習(xí)專家谷俊麗女士曾經(jīng)提到,FPGA?可以憑借信號處理和低能耗方面的優(yōu)勢,成為一個可靠的第二系統(tǒng),在汽車的第一系統(tǒng)出現(xiàn)失誤的時候,作為安全模式介入進來。
?
FPGA 需要克服的難題
面對未來的大好前景,FPGA廠商自然喜笑顏開,但是FPGA想成為主流,也要克服更大的挑戰(zhàn)。
?
針對浮點運算,FPGA的計算速度似乎還難以超越GPU。英偉達的Tesla V100?,在理論上最大運算速度可達15 TFLOPS(萬億次浮點運算/?秒);搭載英特爾Statix 10的Nallatech 520C,理論最大運算速度為9.2 TFLOPS,功耗約為225?瓦特。英偉達曝光的最新Quadro GV100,能夠提供高達每秒7.4萬億次的雙精度浮點運算性能以及每秒14.8萬億次的單精度浮點運算性能和每秒118.5萬億次的深度學(xué)習(xí)浮點運算性能,從這一點來看,FPGA追趕GPU還需要一些時日。
?
另外,FPGA開發(fā)工程師反應(yīng),基于FPGA做設(shè)計的編譯時間很長,幾乎占到整個工程的80%,而且每次只要修改其中一個參數(shù)都需要重新編譯,造成了調(diào)試效率很低,這也成為FPGA走向主流的一大障礙。
?
與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)允許,不得轉(zhuǎn)載!
?