Ambarella推出了CV3系列AV域控制器,可同時處理多達20條圖像數(shù)據(jù)流,這說明了自動駕駛汽車領(lǐng)域控制器的發(fā)展趨勢。這個新的SoC系列基于Ambarella的第三代CVFlow AI引擎IP,專為L2-L4車輛的感知、多傳感器融合和路徑規(guī)劃而定制。
隨著車輛架構(gòu)從每個功能的單一ECU轉(zhuǎn)向zonal和更大的集中式域控制器,以及更多的車輛功能依賴于計算密集型AI處理,車輛處理器正在快速發(fā)展。Ambarella新的CV3系列旗艦SoC包括一個AI加速器,該公司將其評估為500 eTOPS(意味著性能相當于500TOPS的GPU)。還包括一個視覺處理器、16個ARM內(nèi)核、一個GPU和其他硬件。
CV3可以連接和融合多個長距攝像頭、多個環(huán)視短距攝像頭和多個雷達,并還有剩余能力用于其他視覺處理任務(wù)(如DMS)。
Ambarella稱其設(shè)計理念為“算法優(yōu)先”。CTO Les Kohn表示,該公司在設(shè)計最新一代產(chǎn)品時研究了數(shù)百個開源網(wǎng)絡(luò)、自己的內(nèi)部網(wǎng)絡(luò)和使用其早期平臺的客戶的算法。
Kohn說:“我們研究了數(shù)百個跨越所有不同類型架構(gòu)的網(wǎng)絡(luò),通過這樣做,我們確保架構(gòu)有足夠的靈活性來處理所有這些不同的網(wǎng)絡(luò),且仍然非常有效地運行。當然,挑戰(zhàn)在于你如何權(quán)衡靈活性和效率,但我認為關(guān)鍵是要真正詳細研究這些網(wǎng)絡(luò)的工作方式。”
他說,總的來說,客戶的算法足夠相似,可以用同一個引擎進行加速。
Ambarella的CV3-High SoC有一個ISP,能夠在具有挑戰(zhàn)性的照明和駕駛條件下運行。還包括一個用于處理立體攝像頭的立體和密集光流加速器,16個Arm A78AE內(nèi)核,包括一個安全島,以及視頻編解碼器。最后,一個GPU主要用于渲染用于停車輔助的傳感器輸出的視覺表示。
第三代CVFlow加速器引擎在該系列中首次實現(xiàn)。與前幾代CVFlow引擎相比,它由兩個區(qū)塊組成:一個是處理AI工作負載的神經(jīng)矢量處理器(NVP),一個是支持浮點的通用矢量處理器(GVP)。計算機視覺工作負載由NVP、浮點工作負載由Arm CPU來減輕。例如,雷達處理由GVP處理,然后由NVP進行感知。這兩塊都是基于內(nèi)部IP。
在NVP和新的GVP之間拆分工作負載,使前者能夠進一步優(yōu)化卷積和矩陣處理。
Kohn說:“我們已經(jīng)優(yōu)化了內(nèi)部存儲系統(tǒng)和這些系統(tǒng)之間的互連,以消除瓶頸并提高效率。我們還重新優(yōu)化了內(nèi)部所有的數(shù)據(jù)路徑。因此,與其說是架構(gòu)上的根本變化,不如說是在細節(jié)上的重新設(shè)計,以消除瓶頸,優(yōu)化核心網(wǎng)絡(luò)處理。”
NVP版本還增加了先進網(wǎng)絡(luò)中常見的操作,這些操作現(xiàn)在才開始用于實時應(yīng)用,包括圖形網(wǎng)絡(luò)和transformer。
NVP還提供500 eTOPS 8位性能,或1000 eTOPS 4位性能(Kohn說,更現(xiàn)實的場景是不同網(wǎng)絡(luò)層使用的混合精度)。這意味著與Ambarella的第二代SoC相比,性能提升了42倍。
該系列的未來器件將擴大CVFlow引擎、圖像管道編碼和混合外設(shè)的規(guī)模。軟件將可在CV3系列中轉(zhuǎn)移,用于入門級、中檔和高檔汽車。
總體而言,CV3-High的功耗約為50w,即每瓦性能是前幾代的4倍。這些提升部分是通過向5nm工藝技術(shù)的過渡實現(xiàn)的。
Ambarella CV3系列的首批SoC預(yù)計將在2022年上半年出樣。
[參考文章]
Ambarella Targets AV Domain Controllers with Next-Gen AI Engine — Sally Ward-Foxton