作者:翔煜 陳嬌 商瑞 北京華興萬邦管理咨詢有限公司
隨著汽車行業(yè)在“新四化”領域內(nèi)迅猛地進步,汽車電子電氣架構正在發(fā)生顯著的變化。智能化的深入促使汽車計算架構逐步由傳統(tǒng)的以分域來進行風險控制的分布式架構,轉向以強調(diào)高性能計算同時減少冗余硬件和系統(tǒng)復雜性,從而提高系統(tǒng)效率和可靠性的中央計算架構。與此同時,一些新興的功能在新車中的滲透率也在不斷提升,例如在汽車座艙內(nèi)人機界面(HMI)領域,諸如車內(nèi)屏幕顯示交互及后排娛樂屏幕等,其年度增長率大致維持在8%左右;而在高級駕駛輔助系統(tǒng)(ADAS)方面,增長率基本達到10%,部分研究機構所報告的增長率數(shù)據(jù)甚至更高。在此背景下,汽車對GPU算力的需求呈現(xiàn)出爆發(fā)增長的趨勢。
汽車應用需要更高GPU算力和硬件虛擬化
隨著先進駕駛輔助系統(tǒng)(ADAS)和各種級別的自動駕駛(AD)被廣泛引入到汽車應用中,以及新一代汽車更加注重人車互動和車與環(huán)境交互功能,汽車對車載計算單元的算力需求大幅提高。智能化汽車中的各種傳感器在短時間內(nèi)就會生成大量數(shù)據(jù),即使在較低級別的自動駕駛系統(tǒng)中,每小時也能生成 25GB 數(shù)據(jù)。面對如此龐大的數(shù)據(jù)量,市場需要能夠高效處理大量信息的硬件來完成計算任務。由于CPU采用流水線處理架構,因此不能夠高效地完成集中處理這些數(shù)據(jù)的任務。
面對這些巨量的數(shù)據(jù),行業(yè)的解決辦法是采用NPU和GPU 來執(zhí)行不同的并行計算,這是因為這兩類架構都具有大規(guī)模并行處理單元。在某些情況下,相比于以前的GPU,NPU的運算速度可能更高,但是因為NPU是一種基于特定加速器的并行計算單元,因此面對新的應用、功能和算法,其靈活性、適應性和產(chǎn)品生命周期遠不如GPU。因此,在目前ADAS和AD還不是每輛車的標配,以及性能需求不斷演進變化的情況下,市場上完全采用NPU架構的智駕芯片和解決方案提供商很難盈利,這些智駕芯片廠商總是在不斷地開發(fā)新的硬件(特定加速器)和流片,同時也使主機廠和tier-1總是不斷花費巨大的人力物力來適配他們的新芯片。
鑒于性能上的顯著差異, GPU已成為同時支持智能駕駛、開發(fā)新一代座艙和支持AI功能的不二之選。GPU具備眾多計算核心,不僅能夠同時執(zhí)行大量計算任務并展現(xiàn)出卓越的并行計算能力,而且還能夠通過軟件編程的方式,在一顆基于GPU汽車主控芯片上就能完成多樣化的圖形圖像數(shù)據(jù)處理、基于渲染的人車交互和人工智能推理等各種任務,因此比采用NPU架構的智駕芯片具有更高的靈活性和可擴展性。在實際的汽車應用場景中,這種基于GPU的汽車主控芯片可以針對不同主機廠、不同車系和不同車型的需求定制自動駕駛功能、信息娛樂系統(tǒng)和V2X方案,可以通過模組化軟件配置來大大降低主機廠及tier-1的開發(fā)難度和成本。
當然,要完美地實現(xiàn)以上功能和利用GPU架構的靈活性和適應性來幫助整個智駕產(chǎn)業(yè)鏈條上的玩家降難度和減成本,就需要GPU一方面要具有足夠的算力,另一方面還要具有能夠?qū)崿F(xiàn)硬件完全隔離的虛擬化能力和可擴展的多核心能力。除此以外,在日益普及的CPU+GPU+NPU架構中,高算力的GPU還可以支持NPU(AI加速器)發(fā)揮人工智能的推理能力,確保車輛在行駛過程中能夠迅速做出決策,提高了系統(tǒng)的響應速度和安全性,這種架構中GPU的靈活性與AI加速器的高性能相得益彰,可共同推動智能化汽車不斷邁向新的發(fā)展階段。
目前,市場上已經(jīng)出現(xiàn)了能夠同時滿足上述三種要求的GPU IP產(chǎn)品,為新一代基于GPU或者GPU+NPU的智駕芯片的開發(fā)提供了大力支持。Imagination Technologies公司在不久前推出的DXS GPU是業(yè)內(nèi)首款可以同時提供高算力、硬件虛擬化、多核心、支持RISC-V架構的 GPU IP產(chǎn)品,非常適合中國智駕芯片開發(fā)商從純粹的NPU架構轉向開發(fā)基于GPU架構的智駕芯片,除了其DXS GPU的高算力和多核能力,而且還可以提供獨一無二的HyperLane硬件虛擬化技術,幫助主機廠和tier-1用一顆主控芯片實現(xiàn)多樣化的功能及配置。
Imagination 是享譽全球的GPU IP提供商。1992年,該公司推出了創(chuàng)新的PowerVR GPU架構,采用該架構的GPU IP不僅在桌面應用、移動平臺、消費電子和游戲設備等多個領域產(chǎn)生了廣泛影響并持續(xù)至今,而且在汽車領域也被諸多領先的芯片企業(yè)采用,全球已有高達130億臺電子設備和汽車采用了該公司的GPU IP。Imagination 在車載領域擁有超過二十年的技術積累,其GPU IP被用在駕駛、座艙與信息娛樂系統(tǒng)等領域的芯片中;作為汽車GPU IP的領先供應商,具有領先同儕的市場占有率。其DXS GPU的問世,不僅滿足了現(xiàn)代汽車對中央處理單元的高性能需求,還通過創(chuàng)新的分布式安全機制,解決了功能安全與性能、芯片尺寸之間的沖突,為汽車智能化進程注入了強勁動力。
Imagination DXS GPU 的性能優(yōu)勢
相較于上一代GPU產(chǎn)品,Imagination在設計DXS GPU時新增了一個SPU單元,從而使得DXS GPU的整體硬件性能提升了50%。得益于全新的設計,最新發(fā)布的DXS GPU所采用的工藝節(jié)點為5納米,這使得其系統(tǒng)運行頻率相較于上一代產(chǎn)品有了顯著提升。如需進一步拓展,還可將其配置為四核,在主頻達到1.5GHz的條件下,DXS GPU將能夠?qū)崿F(xiàn)9TFLOPS FP32的性能以及32TOPS的int8性能。
Imagination汽車產(chǎn)品總監(jiān)章政表示:“GPU在圖形處理方面具有顯著優(yōu)勢,特別是具有并行處理能力,使得GPU能夠高效地進行大規(guī)模計算,從而提升圖形性能。我們最新推出的DXS GPU解決方案算力可從0.25 TFLOPS拓展到1.5 TFLOPS,這一可擴展、靈活的特性可以滿足汽車中不同等級自動駕駛對圖形處理性能和計算的需求?!?/p>
在以填充率為中心的圖形工作負載上,性能相比競爭對手最高可提升28%,在安全關鍵型工作負載上更是能達到成倍的性能提升。相比IMG BXS GPU,優(yōu)化過硬件架構DXS GPU在結合雙重速率FP16加上額外的SPU,能為FP16工作負載提供3倍性能。DXS GPU還支持FP16/FP32/INT8/DOT8等行業(yè)標準數(shù)字格式,此外,該GPU相比前代提供更大片上內(nèi)存用于加速計算。
DXS GPU提供單、雙、三、四核靈活配置,可作為多個獨立GPU核心運行,也可作為單個大型GPU跨多個核心調(diào)度任務,支持通過低帶寬總線在核心間分配工作,并支持跨Chiplet橋接,進一步增強了核心之間的通信和協(xié)作能力,使得整個系統(tǒng)在處理復雜任務時更加高效和靈活。
此外,Imagination也深知軟硬件協(xié)同優(yōu)化的重要性。因此,在DXS GPU中,Imagination特別增加了片上存儲,以減少帶寬瓶頸,同時增強了算術邏輯單元(ALU)計算能力。這些優(yōu)化措施使得DXS GPU在處理圖形任務時更加高效。同時,Imagination還提供了強大的軟件支持,包括針對特定工作負載優(yōu)化的軟件庫和工具,幫助開發(fā)者充分發(fā)揮GPU的潛力,實現(xiàn)最佳的圖形性能。
車用GPU與移動平臺所用GPU的不同:FuSa
在11月12日,Imagination宣布其DXS GPU IP正式通過SGS-TüV Saar(SGS旗下,世界領先的測試、檢驗和認證機構)的全面審核與評估,獲得了ISO 26262標準的ASIL-B級別認證。這一成就標志著DXS GPU所采用的獨特的分布式功能安全機制(FuSa)已經(jīng)獲得了行業(yè)內(nèi)的認可。特別是在汽車應用領域,GPU對于FuSa有著嚴格的要求,這包括了冗余設計以及在某些功能失效時的應對策略。鑒于汽車電子系統(tǒng)的故障可能引發(fā)嚴重的交通事故,因此功能安全顯得尤為關鍵。
Imagination 的 GPU 采用獲得專利的分布式安全機制(DSM)和其HyperLane硬件虛擬化技術一樣,都是針對汽車等GPU應用開發(fā)的高價值創(chuàng)新,可以以極小的芯片面積代價去滿足汽車應用特定的需求。DSM通過在多個子模塊中分散部署安全檢測邏輯,實現(xiàn)對功能安全的全面覆蓋。具體包括安全對、空閑周期占用、測試向量生成與執(zhí)行、分布式故障檢測與報告等創(chuàng)新點,在僅增加約 10% 的面積開銷的情況下,能有效檢測到超過 90% 的單點故障,符合 ASIL - B 的要求并獲得了認證。
隨著汽車新四化(電動化、智能化、網(wǎng)聯(lián)化、共享化)的不斷推進,汽車中的芯片數(shù)量將快速增加。除了關注這些芯片的算力和連接帶寬等性能之外,同樣重要的是打造和推出全新的功能安全解決方案。Imagination結合GPU這種處理器的架構特點,在提供業(yè)內(nèi)領先的算力之外,還利用GPU的運行特點來打造了創(chuàng)新的分布式功能安全機制,消除了以前的鎖步等其他功能安全方案實現(xiàn)機制帶來的性能降低以及成倍片芯面積,為電子行業(yè)在相關領域內(nèi)的創(chuàng)新提供了一種全新的模式和思路。