最近ChatGPT引發(fā)了全球范圍內(nèi)的AI熱,隨之而來(lái)的是與AI算法緊密相關(guān)的AI計(jì)算與AI芯片又一次火爆了起來(lái)。但事實(shí)上,大語(yǔ)言模型能夠驅(qū)動(dòng)的算力增長(zhǎng)是有限的。根據(jù)相關(guān)數(shù)據(jù),未來(lái)有70%-80%的AI計(jì)算任務(wù)將發(fā)生在機(jī)器視覺(jué)與多模態(tài)領(lǐng)域。因此,真正的AI時(shí)代,其實(shí)是視頻計(jì)算的時(shí)代。
直播、短視頻的持續(xù)熱絡(luò),各種設(shè)備形態(tài)與行業(yè)場(chǎng)景對(duì)攝像、視頻能力的需求,使專(zhuān)用的視頻計(jì)算能力與處理單元將成為時(shí)代的剛需。
我們此刻正在,并且未來(lái)長(zhǎng)期將生活在一個(gè)無(wú)處不是屏幕,無(wú)處不是視頻的世界里。人們對(duì)高清、高幀率的視頻需求,從來(lái)都是有增無(wú)減的,而經(jīng)典計(jì)算結(jié)構(gòu)中的CPU+GPU體系,已經(jīng)無(wú)法滿(mǎn)足海量視頻業(yè)務(wù)的處理需求需求,于是視頻處理芯片VPU(Video Processing Unit)應(yīng)運(yùn)而生。
VPU究竟能做什么?它的應(yīng)用方向和市場(chǎng)格局處在怎樣的階段?讓我們打開(kāi)這枚小小的芯片,一起進(jìn)入VPU的玲瓏棋局。
觀局:為什么需要VPU?
這盤(pán)棋的開(kāi)端,我們需要來(lái)了解VPU的出現(xiàn)的必然性是什么。
在目前階段,無(wú)論是C端還是B端用戶(hù),對(duì)高清視頻(4K/8K)都有著愈發(fā)清晰強(qiáng)烈的需求。作為普通用戶(hù),我們期待著直播、短視頻、VR的高清體驗(yàn)持續(xù)升級(jí),而企業(yè)則需要提升在線(xiàn)會(huì)議、工業(yè)視覺(jué)、自動(dòng)駕駛等領(lǐng)域的高清視頻能力。整體而言,我們處在沖向4K泛在化、8K落地應(yīng)用的關(guān)鍵節(jié)點(diǎn)上。
但向高清視頻的沖刺,卻會(huì)帶來(lái)視頻編解碼方面更高的算力消耗與網(wǎng)絡(luò)成本。尤其對(duì)于算力而言,當(dāng)海量視頻編解碼需求出現(xiàn)時(shí),傳統(tǒng)的CPU計(jì)算方式缺乏針對(duì)性,處理效率低,并且會(huì)帶來(lái)能耗與部署空間的浪費(fèi),綜合成本過(guò)高。GPU處理視頻編解碼的能力更好,但其資源利用率和浮在靈活性依舊不足。尤其使用GPU來(lái)處理編解碼任務(wù),往往會(huì)陷入驅(qū)動(dòng)程序與處理器不兼容的問(wèn)題,從而導(dǎo)致大量任務(wù)無(wú)法正常運(yùn)行。
專(zhuān)業(yè)的芯片做專(zhuān)業(yè)的事,是這個(gè)時(shí)代半導(dǎo)體產(chǎn)業(yè)發(fā)展的核心命題。視頻任務(wù)既然讓CPU或GPU都有點(diǎn)難以處理,那么VPU這種編解碼更加靈活,處理能力更加具有專(zhuān)業(yè)性的芯片也就應(yīng)運(yùn)而生。
VPU瞄準(zhǔn)的,實(shí)際上是一個(gè)非常大的機(jī)會(huì)。
落子:VPU的應(yīng)用與考驗(yàn)
就目前情況來(lái)看,VPU的應(yīng)用領(lǐng)域與關(guān)聯(lián)場(chǎng)景非常豐富。這是因?yàn)橐曨l正成為無(wú)處不在,充斥在生活各個(gè)角落與產(chǎn)業(yè)各個(gè)領(lǐng)域的基礎(chǔ)信息樣態(tài)。在云端,短視頻和直播平臺(tái)每天要處理海量的視頻編解碼任務(wù),而在端側(cè),攝像頭、無(wú)人機(jī)、手機(jī)、PC等各種設(shè)備都具備拍攝視頻和播放視頻的功能。
這也讓VPU的落子主要呈現(xiàn)在兩個(gè)領(lǐng)域。一方面是在云端成為數(shù)據(jù)中心的一部分,以應(yīng)對(duì)海量視頻數(shù)據(jù)的加速需求;另一方面是在終端側(cè),與手機(jī)、汽車(chē)、安防、無(wú)人機(jī)、ARVR設(shè)備結(jié)合,提高設(shè)備的視頻編解碼性能,降低視頻處理所需的功耗與時(shí)延。在視頻處理需求爆發(fā)式增長(zhǎng)的今天,產(chǎn)業(yè)各界對(duì)VPU也提出了一系列新的需求,我們可以將其總結(jié)為三個(gè)能力:
1.高清編解碼能力:VPU需要應(yīng)對(duì)4K甚至8K的編解碼,滿(mǎn)足泛在化高清的落地需求。如今,在線(xiàn)會(huì)議、工業(yè)質(zhì)檢、安防等應(yīng)用也在升級(jí)4K,無(wú)處不在的泛化4K,已經(jīng)成為各界對(duì)視頻處理能力普遍而廣泛的需求。
2.軟件環(huán)境兼容能力:VPU要能夠靈活適配不同的操作系統(tǒng)與軟件環(huán)境,從而保障視頻應(yīng)用的軟硬兼容性,避免因軟件問(wèn)題導(dǎo)致資源措置與兼容難題。
3.硬件場(chǎng)景適配能力:VPU需要靈活適配不同的硬件特性,從而降低端到端時(shí)延,提高編解碼處理效率,以此來(lái)應(yīng)對(duì)不同硬件體系對(duì)VPU的需求。
在兩大領(lǐng)域、三大能力的框定下,VPU的棋局已經(jīng)愈發(fā)清晰。這盤(pán)棋,也確實(shí)吸引到了各界棋手的加入。
爭(zhēng)勢(shì):一場(chǎng)千億規(guī)模的棋局
目前階段,VPU的產(chǎn)業(yè)實(shí)踐與市場(chǎng)發(fā)展處在高速爆發(fā)期,各個(gè)領(lǐng)域的互聯(lián)網(wǎng)公司、科技企業(yè)都加入了這項(xiàng)關(guān)鍵技術(shù)的布局。其中比較有代表性的,是2021年4月,谷歌發(fā)布了自研的Argos VCU。在那之后,在流媒體、短視頻、直播領(lǐng)域具有優(yōu)勢(shì)的企業(yè),紛紛開(kāi)始布局VPU。
比如說(shuō),騰訊自研的視頻轉(zhuǎn)碼芯片“滄?!?,已于2022年3月成功流片。Meta、字節(jié)跳動(dòng)、快手等互聯(lián)網(wǎng)大廠紛紛啟動(dòng)了VPU布局。尤其值得注意的是,過(guò)往半導(dǎo)體投入并不多,但高度依賴(lài)視頻業(yè)務(wù)的字節(jié)跳動(dòng)與快手都布局了VPU,足可見(jiàn)業(yè)界對(duì)VPU技術(shù)的重視。有數(shù)據(jù)認(rèn)為,VPU將在未來(lái)成長(zhǎng)為千億人民幣規(guī)模的市場(chǎng),目前來(lái)看極有可能。
但互聯(lián)網(wǎng)、流媒體廠商布局VPU,還屬于跨界提前布局,其效果還需要幾年時(shí)間顯現(xiàn)出來(lái)。而業(yè)界在目前階段,則更需要成熟、穩(wěn)定的VPU產(chǎn)品進(jìn)行支撐。
比如說(shuō),此前安謀科技發(fā)布了第二代VPU產(chǎn)品“玲瓏”系列V6/V8。這兩款產(chǎn)品對(duì)應(yīng)市場(chǎng)主流的4k8k實(shí)時(shí)解碼需求而生。具有配置靈活可定制、編解碼性能優(yōu)異、面積小等特點(diǎn)。在硬件場(chǎng)景的適配上,玲瓏V6/V8既可以面向數(shù)據(jù)中心場(chǎng)景,也能夠與攝像頭、汽車(chē)、智能家居、移動(dòng)設(shè)備結(jié)合;在軟件兼容問(wèn)題中,其已經(jīng)完整實(shí)現(xiàn)了Android和Linux驅(qū)動(dòng),以及上層一些應(yīng)用框架支持,可以滿(mǎn)足各種消費(fèi)類(lèi)產(chǎn)品、云端以及嵌入式場(chǎng)景的需求。
總體來(lái)看,VPU市場(chǎng)應(yīng)用處在巨頭進(jìn)駐、高速爆發(fā)、產(chǎn)業(yè)應(yīng)用性廣泛的階段,這些特征基本預(yù)示了VPU賽道未來(lái)的潛力價(jià)值。
未來(lái),高清視頻與機(jī)器視覺(jué)將無(wú)處不在,VPU的身影或許也將如此。