越是智能化發(fā)展,越需要調(diào)用大量數(shù)據(jù),對算力的需求也就越大,于是,算力提升成為云、邊、端的共同趨勢。一些觀點認(rèn)為,在云計算占據(jù)計算主導(dǎo)地位的當(dāng)下,邊緣計算會是云計算的延伸和補(bǔ)充。但事實上,無論是延伸還是補(bǔ)充,都不足以反映邊緣計算的巨大潛力。
在傳統(tǒng)產(chǎn)業(yè)如火如荼進(jìn)行數(shù)字化轉(zhuǎn)型的背后,除了5G、IoT之外,邊緣計算是一股不容忽視的重要力量。在規(guī)模和增速方面,CB Insights估算,到2023 年全球邊緣計算行業(yè),整體市場容量有望達(dá)到340億美元。Technavio估計,從2018年到2022年,邊緣計算技術(shù)的應(yīng)用量將以每年近20%的速度增長。Grand View Research更是預(yù)測,2016-2025年期間,亞太區(qū)邊緣計算市場的復(fù)合增長率將高達(dá)46.7%。
不過,在邊緣計算受到越來越多關(guān)注的同時,我們看到,終端設(shè)備的算力也在不斷提升,甚至一些可媲美邊緣設(shè)備。端、邊的界限一定程度上是否在變模糊?邊緣計算的核心能力該如何評定?對算力經(jīng)濟(jì)“虎視眈眈”的國產(chǎn)AI芯片er們,對這一巨大的新興領(lǐng)域,是否準(zhǔn)備好了?
邊緣計算的“邊界”在哪里?
時擎科技總裁于欣認(rèn)為,云、邊、端更多是從應(yīng)用場景來劃分的,而不僅僅是依據(jù)性能。從這個意義來說,云、邊、端的場景還是比較明確的。當(dāng)然,從任務(wù)處理的角度,確實有把更多的推理任務(wù)下放到邊緣和終端的趨勢,也將有更多的云邊端融合協(xié)同的場景。不過,對于端、邊的設(shè)備來說,會有更多的成本和功耗限制,提高“算力的效率”是更為關(guān)鍵的指標(biāo),包括單位算力的成本和實際可達(dá)的應(yīng)用效果。
靈汐科技副總經(jīng)理華寶洪表示,終端側(cè)與邊緣側(cè)從誕生伊始,就各自承擔(dān)著不同的使命。終端作為與用戶直接交互的設(shè)備,以感知作為首要功能,低功耗、低延時是基本要求,也相應(yīng)地會在計算能力上進(jìn)行權(quán)衡。一般來說,端側(cè)設(shè)備的計算能力弱于邊緣側(cè)的算力水平。他強(qiáng)調(diào),“對于終端廠商宣稱的算力,需要明確究竟是理論算力還是有效算力。只有終端與邊緣側(cè)的有效算力相媲美時,才是真正達(dá)到邊緣設(shè)備的算力級別?!?/p>
上海雪湖科技有限公司副總裁趙小吾從應(yīng)用場景和未來趨勢方面給出了他的見解?!霸七叾说亩x,本身就是因為受制于芯片算力和通訊傳輸能力的局限產(chǎn)生的邊界。一定程度上,邊、端的界限確實變模糊,但是針對不同應(yīng)用場景對性能的要求,邊界的定義可能不太一樣。對算力要求不高的場景,終端設(shè)備的性能是足夠的,可能就不需要專門的邊緣計算設(shè)備;對算力要求高的場景,比如車路協(xié)同、智慧交通等,終端傳感器設(shè)備是無法滿足需求的,就需要用邊緣計算設(shè)備來處理攝像頭、激光雷達(dá)和毫米波雷達(dá)的數(shù)據(jù),來實現(xiàn)全息感知的功能”,他表示,“隨著芯片和通訊傳輸技術(shù)的迭代,相信這樣的邊界會時而模糊時而清晰。”
“核心指標(biāo)”是什么?
“算力”是一個廣義的詞匯,該如何對算力設(shè)備進(jìn)行評估?比較重要的有兩個:理論峰值算力和真實有效算力。理論算力是指通過公式推導(dǎo)出的理論上的算力;而有效算力是指設(shè)備在實際運(yùn)作過程中能真實輸出的算力,是設(shè)備實際算力效能的體現(xiàn)。靈汐科技華寶洪還給出了以下六大評估指標(biāo):
計算芯片的峰值算力
理論計算得出的、理想狀況下的峰值算力。具體通過計算核的主頻、核數(shù)量、單核運(yùn)算能力等來輸出理論峰值,與實際場景中的真實有效處理能力有很大差距。
計算芯片的有效算力
設(shè)備在實際運(yùn)作過程中能真實輸出的算力。比如ResNet50在浮點16位精度下,推理一次的計算量是7.8Gflops左右,芯片每秒鐘處理的ResNet50的幀率乘以7.8G就是真實有效的輸出算力。如果推理幀率是400fps,真實算力是400*7.G=3Tflops。
計算芯片的有效利用率
代表了芯片真實輸出的運(yùn)算能力。其計算方式為:真實有效的輸出算力/理論算力。計算結(jié)果值越高,表明該芯片工作越高效。實際應(yīng)用場景中,多數(shù)傳統(tǒng)架構(gòu)計算芯片,有效利用率一般在30%左右,而新型架構(gòu)的計算芯片,芯片有效利用率可以到50%以上。領(lǐng)啟KA200異構(gòu)眾核、存算一體芯片有效利用率可達(dá)60%以上。
計算芯片對各種主流神經(jīng)網(wǎng)絡(luò)的支持程度
下一代人工智能有兩個不同的發(fā)展線路圖,一個是以深度學(xué)習(xí)算法為代表的傳統(tǒng)計算科學(xué),一個是以生物神經(jīng)網(wǎng)絡(luò)為代表腦科學(xué)。多數(shù)計算芯片只能支持二者之一。是否能將二者兼并支持,也是衡量計算芯片的核心指標(biāo)之一,異構(gòu)融合是達(dá)到這一指標(biāo)的重要途徑之一。
芯片能效比
計算方式為:典型網(wǎng)絡(luò)(如ResNet50)的推理能力/芯片的功耗,單位:推理幀率(fps/w)。
芯片的性價比
每平方毫米推理的幀率數(shù),計算方式為:典型網(wǎng)絡(luò)(如ResNet50)的推理能力/芯片的面積。
異構(gòu)“精髓”——有的放矢
在邊緣計算領(lǐng)域,多樣的應(yīng)用催生了多種多樣的計算需求,往往需要權(quán)衡算力、功耗、體積等問題,出于資源的優(yōu)化考慮,異構(gòu)計算逐漸成為業(yè)界共識。在算力需求猛增的第一階段,以CPU、GPU為代表的芯片率先迎來強(qiáng)勁增長。這些由先進(jìn)半導(dǎo)體技術(shù)打造的算力設(shè)備往往具備極強(qiáng)的性能表現(xiàn)以及良好的兼容性,占據(jù)了異構(gòu)計算領(lǐng)域的主流地位。
時擎于欣表示,所謂異構(gòu)計算,實際上是希望有不同的處理器形態(tài)來針對不同的算法進(jìn)行更高效的處理。相對于通用算力來說,“異構(gòu)”的目的應(yīng)該是相對于某種或某類特定應(yīng)用來定義的,因而需要更有針對性,更有的放矢。他強(qiáng)調(diào),“為了異構(gòu)而異構(gòu),意義不大?!?/p>
從指令集架構(gòu)角度來看,業(yè)界已形成了各自的“勢力范圍”。于欣認(rèn)為,從技術(shù)角度來說并沒有那么絕對,它們之間也會相互滲透,比如Arm架構(gòu)也有服務(wù)器和PC應(yīng)用,RISC-V也會越來越多向高性能方向嘗試。未來更多的還是老生常談的“生態(tài)”問題,恰恰因為技術(shù)角度沒有那么大的差異,生態(tài)就尤為重要,不過,先入為主之后的替代成本和門檻很高,這個過程會比較漫長。
Imagination計算業(yè)務(wù)產(chǎn)品管理總監(jiān)Rob Fisher表示,隨著對性能的需求日益增加,系統(tǒng)功耗等級需要不斷降低,這是異構(gòu)架構(gòu)真正體現(xiàn)價值的地方。
關(guān)于未來異構(gòu)計算的發(fā)展趨勢,他認(rèn)為,最密集的計算部分將定位在一個加速器上,該加速器能夠高效運(yùn)行,提供性能并管理功耗。不過,這只有在加速器能夠擴(kuò)展、滿足應(yīng)用的性能需求時才能發(fā)揮作用,也就是說,可擴(kuò)展性是未來架構(gòu)的重點。除了在單一維度上進(jìn)行擴(kuò)展之外,復(fù)雜計算工作負(fù)載還必須在多個維度上實現(xiàn)可擴(kuò)展性,從而改變計算資源組合以適應(yīng)需求。
雪湖科技趙小吾也認(rèn)為,異構(gòu)計算平臺主流的發(fā)展方向,一定是能夠更有效地獲取高性能計算能力架、構(gòu)靈活性高、可擴(kuò)展性好、計算資源利用率更高。由于不同的計算架構(gòu)各有優(yōu)勢,場景也在變得更加多元和復(fù)雜,要更深入地分析不同計算架構(gòu)和不同芯片的優(yōu)勢,設(shè)計出適合特定應(yīng)用場景下的異構(gòu)計算方案。
靈汐科技華寶洪則強(qiáng)調(diào)了對新型計算架構(gòu)進(jìn)行探索的緊迫性。傳統(tǒng)馮·諾依曼架構(gòu)當(dāng)前正面臨諸多瓶頸,如存儲墻、芯片利用率低,由于半導(dǎo)體工藝發(fā)展帶來的摩爾定律失效,更是給算力芯片的發(fā)展蒙上陰影。
他認(rèn)為,這就催生了新型顛覆性計算架構(gòu)的發(fā)展,類腦計算和量子計算就是兩個典型代表,這兩個前沿戰(zhàn)略方向已經(jīng)列入國家十四五規(guī)劃和2035年遠(yuǎn)景規(guī)劃。類腦計算將計算機(jī)的剛性和人腦的彈性結(jié)合起來,在取得高算力的同時,也保證了低功耗和低延時等。
隨著新型架構(gòu)的不斷出現(xiàn),未來的異構(gòu)計算必定會出現(xiàn)CPU、GPU和新型計算架構(gòu)融合的局面,即傳統(tǒng)馮·諾依曼架構(gòu)和非馮·諾依曼架構(gòu)的融合,而不僅是當(dāng)前的CPU和XPU之間的融合。
寫在最后
“邊緣計算”正在成為千行百業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型、智能升級的重要底座,它所承載的功能、以及對行業(yè)的賦能作用越來越關(guān)鍵。AI芯片作為核心的算力提供方之一,也必將在當(dāng)前的技術(shù)革新和未來的商業(yè)化實踐中,取得長足的發(fā)展。
對于正處于百花齊放階段的國產(chǎn)AI芯片來說,這是成長的沃土。盡管傳統(tǒng)通用處理器已占據(jù)發(fā)展先機(jī),但是也存在著高功耗、高價格、低能效等問題。CPU一統(tǒng)天下的計算時代一去不復(fù)返,計算多樣性所催生的“異構(gòu)、靈活、可擴(kuò)展”的架構(gòu)是未來計算時代的主旋律。正如幾位受訪人一致認(rèn)同的觀點,“提升能效比是計算架構(gòu)發(fā)展的不懈追求”。
本文主要從邊緣計算不斷發(fā)展的內(nèi)涵、技術(shù)指標(biāo)、技術(shù)路線等方向進(jìn)行了討論,在近期的系列文章中,還將從國產(chǎn)AI芯片在邊緣計算領(lǐng)域的機(jī)遇和挑戰(zhàn)、邊緣計算的發(fā)展格局、通用計算與專用計算的博弈等角度,進(jìn)行深入剖析,敬請關(guān)注!