作者 | 方文三
生產(chǎn)大模型并不是終極目標(biāo),讓它在各行各業(yè)中大展拳腳、發(fā)揮出實(shí)用價(jià)值才是最終追求。
基礎(chǔ)層是地基,應(yīng)用層是高度
人工智能產(chǎn)業(yè)鏈主要分為三個(gè)層次:基礎(chǔ)層、技術(shù)層和應(yīng)用層。
基礎(chǔ)層包括AI芯片、智能傳感器和云計(jì)算等,為人工智能提供數(shù)據(jù)和算力支持。
在AI產(chǎn)業(yè)初期,基礎(chǔ)層企業(yè)占比最大,達(dá)到83%,而技術(shù)層和應(yīng)用層企業(yè)分別占5%和12%。
基礎(chǔ)層就像是人工智能大樓的地基,而應(yīng)用層則決定大樓的高度。
在應(yīng)用層面,智能機(jī)器人、無(wú)人機(jī)等智慧終端有很大潛力,智慧城市、智慧醫(yī)療等領(lǐng)域也有很多機(jī)會(huì)。
據(jù)灼識(shí)咨詢數(shù)據(jù),2022年全球AI芯片市場(chǎng)規(guī)模達(dá)到960億美元,預(yù)計(jì)2027年將達(dá)到3089億美元,而中國(guó)AI市場(chǎng)規(guī)模預(yù)計(jì)將于2027年達(dá)到1150億美元。
此外,IDC數(shù)據(jù)顯示,到2025年,用于人工智能推理工作負(fù)載的芯片將達(dá)到60.8%。
AI大模型從生產(chǎn)終將走向應(yīng)用
大模型就像一個(gè)超級(jí)智能的廚師,它改變了傳統(tǒng)的做飯方式,讓我們可以更快、更好、更靈活地品嘗到各種美食。
但是,從商業(yè)化的角度來(lái)看,它仍然需要面對(duì)AI落地應(yīng)用的挑戰(zhàn)。
在過(guò)去的幾年里,有許多AI公司前仆后繼,像開拓一條充滿荊棘的道路一樣,尋找著AI落地的秘訣。
他們發(fā)現(xiàn),對(duì)于許多多樣化、碎片化的場(chǎng)景來(lái)說(shuō),邊緣計(jì)算就像一把打開AI落地應(yīng)用商業(yè)化大門的鑰匙。
大模型這種高級(jí)AI技術(shù),得落到具體業(yè)務(wù)里才能發(fā)揮出它的價(jià)值。
現(xiàn)在,大模型已經(jīng)成為了AI的新潮流,很多廠商在嘗試商業(yè)化時(shí)都提出了[行業(yè)大模型][一行一模]的觀點(diǎn),也就是用大模型來(lái)解決這些碎片化場(chǎng)景中的業(yè)務(wù)痛點(diǎn)。
從這一點(diǎn)來(lái)看,邊緣計(jì)算這個(gè)以靈活調(diào)度著稱的強(qiáng)大助手,將會(huì)成為未來(lái)大模型廣泛落地到各個(gè)場(chǎng)景的重要一環(huán)。
而那些為邊緣計(jì)算提供算力的AI推理芯片,也會(huì)在這個(gè)過(guò)程中迎來(lái)一次市場(chǎng)擴(kuò)容的機(jī)會(huì)。
就像一場(chǎng)盛大的派對(duì)即將開始,邊緣計(jì)算和AI推理芯片都將在這場(chǎng)派對(duì)中大放異彩。
推理芯片將成國(guó)內(nèi)大模型的入場(chǎng)券
訓(xùn)練芯片和推理芯片是AI芯片的兩大類,它們的功能各有側(cè)重。
訓(xùn)練芯片主要用于訓(xùn)練大模型,注重計(jì)算性能,而推理芯片則主要用于模型的推理運(yùn)算,注重效率和時(shí)延、功耗。
現(xiàn)在,國(guó)內(nèi)大模型正處于訓(xùn)練階段,需要很強(qiáng)的算力支持,所以很多AI公司都把目光放在了訓(xùn)練芯片上,購(gòu)買大量的GPU算力來(lái)訓(xùn)練算法模型。
這也讓英偉達(dá)成為了萬(wàn)億市值的神話,他們的H100、H800等芯片非常受歡迎,國(guó)內(nèi)也有華為、寒武紀(jì)等廠商在努力追趕。
現(xiàn)在推理芯片成為熱門話題,像機(jī)器人、無(wú)人駕駛汽車這些領(lǐng)域,都離不開推理芯片。
一旦大模型成熟,就會(huì)應(yīng)用到邊端設(shè)備上,這時(shí)就會(huì)需要推理芯片。
但是,由于一些不可抗力的因素,現(xiàn)在訓(xùn)練芯片和推理芯片都受到了管制。
所以,AI芯片的國(guó)產(chǎn)替代成為了重要議題。
咱們國(guó)內(nèi)現(xiàn)階段中,得在國(guó)產(chǎn)工藝的基礎(chǔ)上,研發(fā)、流片和商用這些推理芯片,現(xiàn)在國(guó)內(nèi)芯片的技術(shù)水平,大概就在14nm這個(gè)節(jié)點(diǎn)。
但那些千億級(jí)、萬(wàn)億級(jí)別的大模型,推理芯片得有超強(qiáng)的計(jì)算能力,還得功耗超低、成本超低,這要求可就到了5nm、2nm的制程工藝了。
燧原科技早早地就在2020年12月發(fā)布了云端AI推理加速卡云燧i10,2021年12月又升級(jí)到了第二代云端AI推理加速卡云燧i20。
去年8月,商湯科技向港交所遞交的IPO文件里,第一次披露了他們自己研發(fā)的AI專用算力芯片STPU、邊緣端AI芯片、服務(wù)器AI推理芯片。
在2021年7月,瀚博半導(dǎo)體在世界人工智能大會(huì)上放出了通用云端推理AI芯片SV100系列和VA1通用推理加速卡。
國(guó)際環(huán)境變幻莫測(cè),使得中國(guó)企業(yè)越來(lái)越難使用海外的先進(jìn)芯片技術(shù)。
在邊緣計(jì)算場(chǎng)景里,也存在一些痛點(diǎn),比如算力不集中、算法太長(zhǎng)、產(chǎn)品不夠標(biāo)準(zhǔn)、規(guī)模也參差不齊。
這時(shí)候,就需要有更高算力,還要增加更多的內(nèi)存容量和更大的內(nèi)存帶寬,這樣就能存得下、搬得快足夠多的數(shù)據(jù)。
同時(shí),邊緣計(jì)算對(duì)低功耗、低成本的要求更為嚴(yán)格。
除了支持大模型等AI計(jì)算任務(wù),AI邊緣推理芯片還負(fù)責(zé)落地應(yīng)用最后一公里的工作,需要具備強(qiáng)大的通用算力。
現(xiàn)在,云天勵(lì)飛在國(guó)產(chǎn)供應(yīng)鏈的幫助下,通過(guò)多重創(chuàng)新技術(shù)的組合,證明了自主研發(fā)的AI芯片也能滿足高算力、大內(nèi)存的大模型推理需求。
為了滿足這些要求,云天勵(lì)飛自主研發(fā)并推出了面向邊緣計(jì)算全場(chǎng)景、基于國(guó)產(chǎn)工藝的大模型推理芯片平臺(tái)DeepEdge10。
這是國(guó)內(nèi)首創(chuàng)的國(guó)產(chǎn)14nm Chiplet大模型推理芯片,采用自主可控的國(guó)產(chǎn)工藝,內(nèi)含國(guó)產(chǎn)RISC-V核,支持大模型推理部署。
依托自研芯片DeepEdge10創(chuàng)新的D2D chiplet架構(gòu)打造的X5000推理卡,已適配并可承載SAM CV大模型、Llama2等百億級(jí)大模型運(yùn)算,可廣泛應(yīng)用于AIoT邊緣視頻、移動(dòng)機(jī)器人等場(chǎng)景。
這顆芯片布局了邊緣計(jì)算的三大芯片平臺(tái)解決方案:感知計(jì)算、視頻高密、大模型推理。
結(jié)尾:
三年后,80%以上的企業(yè)將運(yùn)行在大模型之上;五年后,機(jī)器人和數(shù)字人的數(shù)量將超過(guò)人類的數(shù)量;
七年后,大模型的智慧程度將超過(guò)人腦,可能擁有超過(guò)1萬(wàn)億的參數(shù)體量。
這意味著我們正在進(jìn)入第四次工業(yè)革命的開端。
而現(xiàn)在大家都知道,邊緣計(jì)算是個(gè)大趨勢(shì)。所以,想要讓大模型在未來(lái)更好地應(yīng)用,就得先做好邊緣計(jì)算的推理芯片。
部分資料參考:
雷鋒網(wǎng):《AI推理芯片,大模型「下半場(chǎng)」的入場(chǎng)券》,偲睿洞察:《國(guó)產(chǎn)AI芯片,玩家?guī)缀巍?,買方研選:《AI芯片訓(xùn)練+推理芯片調(diào)研紀(jì)要》