過去的一年,ChatGPT拉開全民AI的序幕,AI經(jīng)歷“iPhone時(shí)刻”。這一年,大佬入局、獨(dú)角獸“宮斗”、千模大戰(zhàn);這一年,AI芯片已經(jīng)成為不容忽視的產(chǎn)業(yè)力量,對于國產(chǎn)芯片來說,如何“戴著鐐銬”前進(jìn)成為產(chǎn)業(yè)突圍的重點(diǎn)……這是AI狂奔的一年,也是AI不斷刷新認(rèn)知的一年。
高漲也好,低潮也罷,我們不能孤立地看待這些現(xiàn)象。AI這一波發(fā)展背后,是應(yīng)用的快速變焦,炙手可熱的計(jì)算機(jī)視覺、智能語音等賽道暫時(shí)平靜,AIGC站上風(fēng)口,相伴而來的還有無止境的算力焦慮……
只有直面困難,才能更好地走向未來。新年伊始,<與非網(wǎng)>對話AI芯片領(lǐng)域幾家明星公司,聽他們聊聊AI的難處和新機(jī)遇。
AI落地的冰與火
2023年,AI產(chǎn)業(yè)在生成式AI驅(qū)動(dòng)下邁向新臺(tái)階,迎來了爆發(fā)式增長,大語言模型以及多模態(tài)大模型成為AI產(chǎn)業(yè)發(fā)展的重要推手?;鸨耐瑫r(shí),國內(nèi)外大模型在大規(guī)模應(yīng)用和落地時(shí)也遇到了實(shí)際困難。
千芯科技董事長陳巍認(rèn)為主要有三類:
第一,實(shí)際模型與客戶場景的匹配問題。由于大模型精度和幻覺問題,好的大模型業(yè)務(wù)產(chǎn)品需要與客戶協(xié)作深度打磨,單純使用RAG方法和向量數(shù)據(jù)庫增強(qiáng)可能還不夠,需要結(jié)合Pre-train使用Fine-tune或Instruct-tune,并且模型參數(shù)量較大且訓(xùn)練時(shí)間較長。
第二,大模型部署的成本問題。大部分AI廠商面臨大模型部署成本較高的問題,通常需要7nm或工藝更先進(jìn)的算力芯片、12GB以上的存儲(chǔ),部署越多可能利潤越低。
第三,國際大環(huán)境的客戶需求下降和下行問題,當(dāng)然這也是國際和國內(nèi)普遍遇到的情況,不僅限于AI產(chǎn)業(yè)。
千芯科技董事長 陳巍
“受到大的經(jīng)濟(jì)形勢、芯片行業(yè)周期的影響,整體來看,AI行業(yè)的落地和發(fā)展,今年還是低于預(yù)期的,不少下游環(huán)節(jié)反映,AI特性在應(yīng)用中并非強(qiáng)需求,市場導(dǎo)入的意愿,在目前的大背景下,并不強(qiáng)烈”,時(shí)擎科技總裁于欣表示,“AI還是需要算法和芯片更緊密的耦合,相對而言,前期的一次性投入會(huì)比較大。這對AI加速落地,形成了一定的障礙?!?/p>
時(shí)擎科技總裁 于欣
安謀科技市場總監(jiān)錢電生認(rèn)為,大模型帶來的挑戰(zhàn)主要體現(xiàn)在軟硬件兩方面:
硬件方面,由于主流的AI芯片都是針對并行計(jì)算而設(shè)計(jì)的,更適用于以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為主的架構(gòu)。而如今到了以Transformer架構(gòu)為主流的時(shí)代,則需要更多串行計(jì)算的能力以及足夠的存儲(chǔ)帶寬支持;此外,除了硬件算力的提升以外,如何提升計(jì)算的效率以及對內(nèi)存的利用和優(yōu)化,是眾多硬件廠商在大模型時(shí)代所面臨的最大挑戰(zhàn)。
軟件方面,大模型的輕量化、如何兼顧性能及精度、實(shí)現(xiàn)大模型在端側(cè)設(shè)備的部署等問題,有待進(jìn)一步解決。
安謀科技市場總監(jiān) 錢電生
端、邊AI將成為硬件廠商布局重點(diǎn)
在Transformer大模型熱戰(zhàn)于云端之際,業(yè)界已經(jīng)看到了它在端側(cè)、邊緣側(cè)的市場機(jī)會(huì)。如何使Transformer在硬件設(shè)備尤其是端側(cè)和邊緣側(cè)硬件高效運(yùn)行,將成為硬件廠商未來的重點(diǎn)方向。
于欣表示,對于人工智能算法而言,模型的“大”和“小”,“專用”和“通用”都是相對的。很多垂直領(lǐng)域,十億參數(shù)量級(jí)的“大模型”開始在邊、端部署。未來1-2年,時(shí)擎科技會(huì)繼續(xù)基于語音、視覺、影像等多模態(tài)智能交互和信號(hào)處理的應(yīng)用落地。同時(shí),也會(huì)密切關(guān)注并積極布局大模型在端側(cè)推理的進(jìn)展。
錢電生認(rèn)為,未來一到兩年,在硬件及架構(gòu)層面,伴隨著算力低成本、隱私、及時(shí)響應(yīng)等需求攀升,大模型的推理會(huì)逐步從云端向端側(cè)及邊緣側(cè)轉(zhuǎn)移,未來大模型推理市場規(guī)模遠(yuǎn)遠(yuǎn)大于訓(xùn)練市場已成為業(yè)內(nèi)共識(shí)。
Transformer仍是大模型的主流基礎(chǔ)架構(gòu),業(yè)界需要重點(diǎn)關(guān)注端側(cè)硬件對Transformer架構(gòu)的持續(xù)優(yōu)化所帶來的算力效率提升。同時(shí),也需要關(guān)注下一代新架構(gòu)的動(dòng)態(tài),例如微軟的RetNet、斯坦福的Mamba等,是否有機(jī)會(huì)挑戰(zhàn)Transformer的主流地位以及可能對硬件架構(gòu)設(shè)計(jì)產(chǎn)生的影響有待進(jìn)一步關(guān)注。
軟件層面,錢電生強(qiáng)調(diào),“大模型輕量化將成為規(guī)?;瘮U(kuò)展的關(guān)鍵,有望進(jìn)一步降低應(yīng)用成本并帶動(dòng)端側(cè)算力發(fā)展,業(yè)界需要重點(diǎn)關(guān)注大模型輕量化前沿技術(shù)與公司產(chǎn)品的深度融合,例如大語言模型推理框架、模型量化壓縮的最新算法等?!?/p>
同時(shí),面臨Meta公司LLaMA為代表的大模型引領(lǐng)的開源風(fēng)潮,他認(rèn)為需要繼續(xù)重點(diǎn)關(guān)注新的開源大模型,特別是面向端側(cè)的大模型(參數(shù)量<70億)的性能表現(xiàn),以及在手機(jī)、PC、智能汽車等智能終端上落地的應(yīng)用場景。
在多模態(tài)領(lǐng)域,以Stable Diffusion為代表的開源擴(kuò)散模型已成為文生圖領(lǐng)域的主流,未來,需要進(jìn)一步關(guān)注多模態(tài)領(lǐng)域文生圖、文生視頻的最新技術(shù)趨勢及端側(cè)落地的應(yīng)用場景。
人才、高性價(jià)比算力是當(dāng)前競爭核心
結(jié)合AI產(chǎn)業(yè)當(dāng)前的現(xiàn)實(shí)因素,哪些是稀缺動(dòng)力?陳巍認(rèn)為,核心是人才和高性價(jià)比的算力。從OpenAI的“宮斗戲”可以看到,人才是極力爭奪的關(guān)鍵,而不是數(shù)據(jù)和算法。對國內(nèi)市場來說,缺乏的不僅是算法人才,更多是算法應(yīng)用和工程人才。雖然很多開源大模型已經(jīng)做得很不錯(cuò)了,但是落地時(shí)缺少合適的人才把大模型的優(yōu)勢發(fā)揮出來。
此外是高性價(jià)比的算力。國內(nèi)很多廠商已經(jīng)開始大舉進(jìn)入AI領(lǐng)域,但在算力方面,受限于成本和可用的計(jì)算卡,推進(jìn)速度相對慢一些。特別是國內(nèi)有些優(yōu)秀的開源大模型團(tuán)隊(duì),由于缺乏算力支持,有些很好的想法可能不一定有條件嘗試。
“也正因算力受限,國內(nèi)的AI產(chǎn)業(yè),特別是大模型技術(shù)的發(fā)展有些延緩”,陳巍談到,“盡管我們開玩笑是‘百模大戰(zhàn)’、‘千模大戰(zhàn)’,但實(shí)際上針對國內(nèi)場景進(jìn)行了大規(guī)模底層Pre-train的國內(nèi)模型還較少,這使得國內(nèi)大模型的落地速度也有一定的延緩?!?/p>
前景遠(yuǎn)大光明,道路曲折漫長
辯證看待AI產(chǎn)業(yè)當(dāng)前的發(fā)展現(xiàn)狀,其實(shí)困難往往也意味著新的機(jī)會(huì)。
陳巍談到,目前來看,解決大模型的精度和幻覺都需要更大的算力。積極效應(yīng)是對新架構(gòu)技術(shù)的發(fā)展產(chǎn)生了明顯推動(dòng)作用:一方面,越來越多國內(nèi)AI產(chǎn)業(yè)玩家在尋找能代替GPGPU的高性價(jià)比方案;另一方面,也在積極研究能降低算力需求的新型模型。在市場客戶需求帶動(dòng)下,同時(shí)給國內(nèi)AI產(chǎn)業(yè)和算力芯片的快速發(fā)展帶來了契機(jī)。
IP層面如何克服大模型的挑戰(zhàn)?錢電生表示,布局大模型相關(guān)的技術(shù)路線是必不可少的舉措,產(chǎn)品層面要更好地支持以Transformer為主的模型架構(gòu),比如在下一代“周易”NPU的設(shè)計(jì)上,安謀科技將會(huì)從精度、帶寬、調(diào)度管理、算子支持等多方面對主流大模型架構(gòu)進(jìn)行迭代優(yōu)化。同時(shí),IP廠商還需要聯(lián)合大模型算法廠商、模型輕量化廠商、OS/應(yīng)用側(cè)廠商等產(chǎn)業(yè)鏈合作伙伴在生態(tài)層面進(jìn)行深入合作,打造軟硬一體的端側(cè)大模型解決方案。
于欣認(rèn)為,只有把技術(shù)、場景和成本三者進(jìn)行更深度的有機(jī)融合,形成自己的技術(shù)壁壘,才能避免陷入到單純的價(jià)格戰(zhàn),從而有利于行業(yè)長期的發(fā)展。未來,一定還是場景驅(qū)動(dòng)技術(shù),而不是相反。這要求上游從業(yè)者深刻理解場景和業(yè)務(wù)模式,甄別形形色色的需求,去偽存真,在這個(gè)基礎(chǔ)上去打磨底層的算法、處理器、芯片,形成自己的差異化的競爭優(yōu)勢,才有可能在激烈的市場競爭中破局突圍。
“隨著AIGC元年的到來,未來5-10年會(huì)是AI行業(yè)發(fā)展的一個(gè)嶄新階段,AI芯片作為算力的基石,也一定會(huì)有更多的機(jī)會(huì)等待從業(yè)者去挖掘”,于欣強(qiáng)調(diào),“用一句話來形容目前AI產(chǎn)業(yè)的發(fā)展,我認(rèn)為是‘前景遠(yuǎn)大光明,道路曲折漫長’?!?/p>