加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • Imagination:AI SoC設(shè)計(jì)靈活性是關(guān)鍵
    • 行業(yè)呼喚芯片架構(gòu)突破“三角束縛”
    • 大模型不是“萬(wàn)金油”,算力是關(guān)鍵
    • 全面突圍:多元芯片架構(gòu)+軟硬件生態(tài)
    • 行業(yè)或?qū)⑾磁?,大模型持續(xù)進(jìn)化
    • 寫(xiě)在最后
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AI芯片格局震蕩,國(guó)產(chǎn)廠商“錢(qián)途”幾何?

01/11 22:44
4631
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

過(guò)去的一年,國(guó)內(nèi)AI產(chǎn)業(yè)面臨巨大挑戰(zhàn),大算力AI芯片和板卡被“卡”,AI芯片軟件生態(tài)也面臨巨大困難。業(yè)界普遍認(rèn)為,除了美國(guó)英偉達(dá)等產(chǎn)品外,使用其他產(chǎn)品進(jìn)行大模型開(kāi)發(fā)難度極大。

這種形勢(shì)其實(shí)也反映了市場(chǎng)需求的大幅增長(zhǎng)和技術(shù)進(jìn)步的迫切需求。大模型尤其是多模態(tài)大模型的出現(xiàn),正在將AI帶到更多領(lǐng)域,對(duì)AI技術(shù)發(fā)展起到巨大的推動(dòng)作用。

近期,英偉達(dá)“中國(guó)特供版”芯片遇冷的局面,也給國(guó)產(chǎn)AI芯片帶來(lái)更大的想象空間。國(guó)產(chǎn)AI芯片是否有望開(kāi)啟新格局、并深遠(yuǎn)影響AI技術(shù)的發(fā)展?<與非網(wǎng)>對(duì)話AI明星企業(yè),探尋產(chǎn)業(yè)的關(guān)鍵動(dòng)力和發(fā)展趨勢(shì)。

Imagination:AI SoC設(shè)計(jì)靈活性是關(guān)鍵

過(guò)去幾年,Transformer已經(jīng)取代傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)成為AI的首選,這在硬件方面產(chǎn)生了重大影響,尤其是對(duì)那些通常只針對(duì)少數(shù)算法優(yōu)化進(jìn)行定制的AI加速器。

這給硬件設(shè)計(jì)師帶來(lái)了挑戰(zhàn),他們往往希望能夠面向未來(lái)工作負(fù)載繼續(xù)進(jìn)行優(yōu)化。這在產(chǎn)品生命周期較長(zhǎng)的市場(chǎng)中尤其明顯,例如在汽車行業(yè),隨著車輛連接性的增強(qiáng),汽車甚至可以在車載SoC設(shè)計(jì)后十年內(nèi)接收軟件更新。

Imagination副總裁、中國(guó)區(qū)總經(jīng)理劉國(guó)軍認(rèn)為,“鑒于AI軟件的持續(xù)進(jìn)化,將設(shè)計(jì)靈活性整合到SoC中可能比僅專注于固定功能性能更為理想?!?/p>


Imagination副總裁、中國(guó)區(qū)總經(jīng)理 劉國(guó)軍

行業(yè)呼喚芯片架構(gòu)突破“三角束縛”

后摩智能聯(lián)合創(chuàng)始人項(xiàng)之初談到,如何讓大模型更廣泛落地,形成商業(yè)閉環(huán),為大眾帶來(lái)經(jīng)濟(jì)價(jià)值和福祉,是需要進(jìn)一步探索的。從支撐大模型底層的算力芯片角度看,目前并沒(méi)有找到特別好的方案,能夠在性能、功耗、成本等方面都能滿足大模型在更廣泛場(chǎng)景的落地需求。

“顯然不能到處去部署大幾百瓦、幾萬(wàn)美元一顆的GPU。所以我們需要更創(chuàng)新的芯片架構(gòu),去突破馮諾依曼架構(gòu)對(duì)算力、功耗、成本這個(gè)不可能三角的束縛”,項(xiàng)之初表示。


后摩智能聯(lián)合創(chuàng)始人 項(xiàng)之初

大模型不是“萬(wàn)金油”,算力是關(guān)鍵

鯤云科技合伙人、COO王少軍博士認(rèn)為,2023年,國(guó)產(chǎn)大模型爆發(fā)式增長(zhǎng),但真正實(shí)現(xiàn)產(chǎn)業(yè)落地還需要時(shí)間。目前,許多行業(yè)仍然主要使用傳統(tǒng)的深度學(xué)習(xí)方法,如CV和NLP類算法。而新應(yīng)用場(chǎng)景更加具體化,AI技術(shù)需要與具體業(yè)務(wù)需求結(jié)合得更緊密。

他指出,AI企業(yè)不僅需要具備技術(shù)能力,還要與各行業(yè)合作,深入了解業(yè)務(wù)場(chǎng)景,才能真正發(fā)揮AI技術(shù)的實(shí)際作用。

在AI的發(fā)展過(guò)程中,如何將產(chǎn)品落地到實(shí)際場(chǎng)景一直是一個(gè)挑戰(zhàn),大模型能否改變這一現(xiàn)狀?王少軍表示,對(duì)于常規(guī)場(chǎng)景,大模型有望解決這一問(wèn)題,但對(duì)于一些長(zhǎng)尾、稀缺場(chǎng)景,大模型仍存在局限性。在他看來(lái),算力才是大模型時(shí)代最基礎(chǔ)、優(yōu)先級(jí)最高的問(wèn)題,如果沒(méi)有足夠的算力,其他技術(shù)得以有效應(yīng)用的基礎(chǔ)也不存在。


鯤云科技合伙人、COO 王少軍博士

全面突圍:多元芯片架構(gòu)+軟硬件生態(tài)

AI芯片競(jìng)爭(zhēng)日趨激烈,而沿用原有技術(shù)路線、依靠先進(jìn)工藝來(lái)提升芯片性能,不論是從技術(shù)發(fā)展角度、還是在當(dāng)前的國(guó)際背景下,都變得越來(lái)越難。

“單純依賴芯片工藝并不能確保產(chǎn)業(yè)的持久發(fā)展,在國(guó)內(nèi)可控工藝條件下,通過(guò)架構(gòu)創(chuàng)新來(lái)實(shí)現(xiàn)性能更優(yōu)、性價(jià)比更高的芯片,應(yīng)該是國(guó)內(nèi)大多數(shù)芯片公司努力的方向”,王少軍談到,“只有當(dāng)產(chǎn)品性價(jià)比足夠高,滿足市場(chǎng)競(jìng)爭(zhēng)需求時(shí),行業(yè)才算真正做好,從業(yè)者的能力才算真正提升。當(dāng)前,產(chǎn)業(yè)界應(yīng)該積極探索底層技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的新路徑。數(shù)據(jù)流架構(gòu)就是一個(gè)備受關(guān)注的方向,國(guó)內(nèi)外一些大型公司也在致力于可重構(gòu)數(shù)據(jù)流的研究。這個(gè)方向具有廣泛的應(yīng)用場(chǎng)景,適用于云、邊、端各種場(chǎng)景。”

除了數(shù)據(jù)流架構(gòu),存算一體AI芯片架構(gòu)也被認(rèn)為有潛力承擔(dān)大模型時(shí)代的底層算力支撐。項(xiàng)之初表示,“存算一體作為一種新的芯片架構(gòu),需要資本、人才和社會(huì)資源的共同投入,促進(jìn)研發(fā)和落地,同時(shí)也需要更多的應(yīng)用機(jī)會(huì)進(jìn)行迭代?!?/p>

劉國(guó)軍認(rèn)為,隨著邊緣AI無(wú)處不在,對(duì)于那些要求快速響應(yīng)、高度安全或在網(wǎng)絡(luò)連接不穩(wěn)定的情況下運(yùn)行的應(yīng)用,直接在設(shè)備上處理AI工作負(fù)載的能力變得至關(guān)重要。并且,賦予AI芯片設(shè)計(jì)靈活性至關(guān)重要,特別是在邊緣設(shè)備有限的面積、內(nèi)存和功耗條件下。他介紹,Imagination GPU IP能以高性能和高效率處理計(jì)算工作負(fù)載,而且支持包括OpenCL在內(nèi)的常用API,具備高度可編程性。通過(guò)持續(xù)投資軟件領(lǐng)域,包括工具、庫(kù)、模型和驅(qū)動(dòng)程序等,希望提供最優(yōu)的計(jì)算編程環(huán)境。“人工智能的普及預(yù)計(jì)將主導(dǎo)半導(dǎo)體行業(yè)及Imagination未來(lái)的業(yè)務(wù)發(fā)展”,他補(bǔ)充道。

行業(yè)或?qū)⑾磁?,大模型持續(xù)進(jìn)化

千芯科技董事長(zhǎng)陳巍認(rèn)為,大模型主要有以下四大趨勢(shì):首先,大模型還會(huì)進(jìn)一步進(jìn)化。從目前看來(lái),Transformer結(jié)構(gòu)雖好,但對(duì)于超長(zhǎng)token生成時(shí),算力資源呈幾何級(jí)數(shù)增長(zhǎng),對(duì)于編程等長(zhǎng)文的自動(dòng)生成并不友好。有較大概率會(huì)有新的結(jié)構(gòu)替代,或者Transformer自己進(jìn)化,形成新一代的大模型基礎(chǔ)結(jié)構(gòu)。


千芯科技董事長(zhǎng) 陳巍

第二,多模態(tài)大模型和混合專家(MoE)模型會(huì)逐漸成為新的主流模型。目前文本模態(tài)的大模型是主流,但隨著技術(shù)的進(jìn)步,多模態(tài)大模型會(huì)提供更多的功能、落地應(yīng)用。另外大模型的主體會(huì)逐漸演變到MoE模式,而這兩者都會(huì)對(duì)算力有更高要求。

第三,大模型逐漸具備自學(xué)習(xí)能力。目前的大模型訓(xùn)練還是離線的,這使得模型訓(xùn)練后就固化,難以隨著應(yīng)用場(chǎng)景自動(dòng)適應(yīng)。預(yù)估1-2年,自適應(yīng)學(xué)習(xí)的大模型會(huì)逐漸進(jìn)入應(yīng)用領(lǐng)域,更好地服務(wù)人類社會(huì)。

第四,CUDA生態(tài)有一定概率被其他開(kāi)源生態(tài)取代。目前來(lái)看,CUDA生態(tài)是主流,但由于CUDA編程模型本身是以緩存為中心的,與目前大模型的分層結(jié)構(gòu)有一定的調(diào)度矛盾。從這個(gè)角度看,現(xiàn)有的CUDA生態(tài)也是大模型算力發(fā)展的障礙。隨著微軟、Google、特斯拉等巨頭自研大模型芯片的進(jìn)度加快,預(yù)計(jì)這些巨頭也會(huì)協(xié)力推動(dòng)新的并行硬件編程生態(tài)。

王少軍則從算力和大模型角度提出兩大值得關(guān)注的方向:一是推理的重要性,隨著大模型應(yīng)用在更多場(chǎng)景,推理將成為關(guān)鍵,需要關(guān)注推理芯片的計(jì)算訴求和系統(tǒng)要求,以降低成本并提高易用性,從而推動(dòng)大模型在行業(yè)中的快速落地。二是大模型輕量化的趨勢(shì),大模型走向輕量化、并且在邊緣和終端進(jìn)行部署,將成為值得關(guān)注的領(lǐng)域。

2023年10月,工業(yè)和信息化部等六部門(mén)印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,要求到2025年國(guó)內(nèi)算力達(dá)到300EFLOPS。其中,不僅包括云端算力,也強(qiáng)調(diào)了邊緣算力的協(xié)同發(fā)展?!斑@對(duì)于國(guó)產(chǎn)AI芯片企業(yè)來(lái)說(shuō)是一個(gè)積極的信號(hào),意味著存在巨大的市場(chǎng)和豐富的應(yīng)用場(chǎng)景。對(duì)于從業(yè)者來(lái)說(shuō),每個(gè)人都有機(jī)會(huì)在這個(gè)市場(chǎng)中分得一杯羹,為整個(gè)行業(yè)帶來(lái)利好”, 王少軍表示。

項(xiàng)之初認(rèn)為,雖然國(guó)內(nèi)AI產(chǎn)業(yè)目前是被客觀因素限制的狀態(tài),并沒(méi)有完全展示出應(yīng)有的潛力。但總體上看,因?yàn)辇嫶蟮膽?yīng)用場(chǎng)景和數(shù)據(jù)量,還是會(huì)讓中國(guó)成為全球唯二的AI產(chǎn)業(yè)市場(chǎng),這個(gè)預(yù)期將會(huì)長(zhǎng)期存在??傮w上,大模型的下沉、在更多垂直領(lǐng)域的落地,將會(huì)給行業(yè)帶來(lái)新的增長(zhǎng)契機(jī),比如Transformer上車對(duì)自動(dòng)駕駛的意義等趨勢(shì)都值得關(guān)注。

當(dāng)然,AI芯片未來(lái)一兩年還是會(huì)有很多挑戰(zhàn),比如資本市場(chǎng)過(guò)山車般的態(tài)度轉(zhuǎn)變,會(huì)讓很多暫時(shí)沒(méi)實(shí)現(xiàn)融資、前期擴(kuò)張又過(guò)于激進(jìn)的公司陷入困境。

“但硬幣總有另外一面,市場(chǎng)態(tài)度的轉(zhuǎn)冷,能夠讓芯片人才安靜下來(lái),而不是頻繁跳槽抬高短期收入,這對(duì)行業(yè)的健康發(fā)展,對(duì)有長(zhǎng)期價(jià)值的公司反而是好事”,項(xiàng)之初補(bǔ)充。

寫(xiě)在最后

自去年10月,美國(guó)發(fā)布新規(guī)阻止英偉達(dá)向中國(guó)出售尖端AI芯片以來(lái),英偉達(dá)陸續(xù)推出幾款“特供”芯片,以便在合規(guī)情況下繼續(xù)在中國(guó)的生意。

不過(guò),幾家頭部云廠商近期表明,訂購(gòu)的芯片數(shù)量遠(yuǎn)遠(yuǎn)少于原計(jì)劃購(gòu)買的已被禁的高性能芯片。知情人士稱,一方面,這些云廠商將先進(jìn)半導(dǎo)體訂單轉(zhuǎn)移給了本土芯片公司;另一方面,他們也在更多依賴公司內(nèi)部開(kāi)發(fā)的芯片。

短期來(lái)看,國(guó)產(chǎn)AI芯片與英偉達(dá)降級(jí)版芯片的性能差距在縮小,但論及中美芯片局勢(shì)實(shí)現(xiàn)逆轉(zhuǎn)還為時(shí)過(guò)早。正如幾位受訪人所指出,AI當(dāng)前面臨的形勢(shì)是極其復(fù)雜的,既需要底層技術(shù)的根本變革,也需要軟硬件生態(tài)、上下游供應(yīng)鏈的合力發(fā)展,同時(shí),也要充分看到AI大模型的發(fā)展方向,下沉到邊緣、端側(cè)是必然方向,也將給多元算力發(fā)展帶來(lái)全新機(jī)遇。

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
STM32F429IGT6 1 STMicroelectronics High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator, FMC with SDRAM, TFT

ECAD模型

下載ECAD模型
$14.94 查看
ATXMEGA128D4-CU 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 49VFBGA
$16.33 查看
STM32H757XIH6TR 1 STMicroelectronics RISC Microcontroller
暫無(wú)數(shù)據(jù) 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費(fèi)電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢(shì)。歡迎交流~