對AI創(chuàng)業(yè)者來說,最大的機會一度在互聯(lián)網(wǎng)、金融等領(lǐng)域。不過隨著ChatGPT這個龐然大物重重砸開新時代的大門,通往AGI(Artificial general intelligence;通用人工智能)的道路展現(xiàn)在眼前,有能力應(yīng)對各類情況、解決各種問題的“全才型AI”成為可期待的愿景,不論是科技巨頭還是創(chuàng)業(yè)者,都迅速錨定這個大市場。
日前,Meta首席執(zhí)行官馬克·扎克伯格首次明確宣布將投身AGI,并將對兩大研究團隊FAIR和GenAI進行更緊密的整合。OpenAI首席執(zhí)行官Sam Altman在達沃斯世界經(jīng)濟論壇上也表示,AGI即將在不久的將來到來,并且將改變世界,不過不會像人們想象的那樣劇烈。國內(nèi)方面也起波瀾,壁仞公司聯(lián)合創(chuàng)始人徐凌杰最近宣布離職,內(nèi)部告別郵件中寫道“AGI is calling,江湖再見”。
大模型拉動AI產(chǎn)業(yè)發(fā)展,并向AGI生態(tài)閉環(huán)快速進發(fā),也助推了AI創(chuàng)業(yè)的新方向。
無問蒼穹,清華師生組合再征AI大賽道
成立于2023年5月31日的上海無問芯穹智能科技有限公司,種子輪就引入了紅杉中國、北極光創(chuàng)投、金沙江創(chuàng)投等知名投資機構(gòu),以及無限基金SEE Fund等。去年11月30日,無問蒼穹悄然完成一輪天使輪融資,新增股東包括百度、騰訊、智譜AI等。
巨頭紛紛進入,這家低調(diào)的創(chuàng)業(yè)公司引起了業(yè)界關(guān)注。
天眼查顯示,無問芯穹創(chuàng)始人汪玉,不論在學(xué)界還是產(chǎn)業(yè)界都頗有建樹,他擔(dān)任清華電子工程系長聘教授、系主任,信息科學(xué)技術(shù)學(xué)院副院長;而在AI火爆初期,汪玉擔(dān)任負責(zé)人的深度學(xué)習(xí)處理器項目,正是AI公司深鑒科技的雛形,汪玉的得意門生姚頌和單羿,是深鑒科技創(chuàng)始成員。無問芯穹種子輪的投資方無限基金SEE Fund,正是原“深鑒科技”創(chuàng)始人兼CEO姚頌所發(fā)起的。
深鑒科技自2016年成立以來,一直基于自適應(yīng)和智能計算企業(yè)賽靈思(已被AMD收購)的技術(shù)平臺開發(fā)機器學(xué)習(xí)解決方案。經(jīng)深鑒科技優(yōu)化的神經(jīng)網(wǎng)絡(luò)剪枝技術(shù)運行在賽靈思FPGA器件上,可以實現(xiàn)突破性的性能和極佳的能效。2018年7月,賽靈思宣布完成對深鑒科技的收購。
再看無問芯穹法定代表人、執(zhí)行董事&總經(jīng)理曾書霖,他的導(dǎo)師正是汪玉。曾書霖2018年本科畢業(yè)于清華大學(xué)電子工程系,而后繼續(xù)攻讀博士學(xué)位,主要研究方向為軟硬件協(xié)同設(shè)計、深度學(xué)習(xí)加速器和FPGA(現(xiàn)場可編程門陣列)硬件虛擬化。曾書霖曾在賽靈思和深鑒科技也都有過實習(xí)經(jīng)驗,使他當(dāng)時對FPGA和AI、深度學(xué)習(xí)都有了更深入的體驗。
根據(jù)官網(wǎng)介紹,無問芯穹提供AGI算力解決方案,以大模型能效優(yōu)化工具包為核心,整合國產(chǎn)芯片算力,構(gòu)建統(tǒng)一算力底座,提供包括NVIDIA、AMD、海光、天數(shù)智芯等多種加速算力云服務(wù),屏蔽硬件差異。
此外,無問芯穹向上通過智算云服務(wù)、智算一體機等多種方式服務(wù)大模型算法企業(yè),協(xié)同算力、算法、生態(tài)推動行業(yè)大模型的高效落地,構(gòu)建AGI時代的大模型基礎(chǔ)設(shè)施。
如何看待AI大模型的發(fā)展挑戰(zhàn)?汪玉近期在業(yè)內(nèi)一個公開沙龍上提出了三點:第一是芯片禁令和國產(chǎn)供應(yīng)鏈不成熟,導(dǎo)致高性能芯片和算力不足;第二是訓(xùn)練和推理居高不下的成本;第三,由于我國算法和芯片的生態(tài)分散,導(dǎo)致資源難以有效利用。
他指出,在模型層和芯片層之間,如何做高效的部署,通過統(tǒng)一的中間層解決異構(gòu)芯片的適配問題會是一條重要途徑。如果能夠通過相對統(tǒng)一的中間層,能夠支持長文本,做到更高的性價比、做到一鍵部署,并且包括一些工具可以輔助算法和應(yīng)用開發(fā)商,把算法壓縮、算子優(yōu)化包括自動編譯等全都囊括在內(nèi)。那么這樣的一類中間層,是有望把M個大模型和N個硬件更好地匹配起來的。
“我們在努力做這樣一個中間層,在云端優(yōu)化不同的算力,以此來支撐更多不同的模型”,汪玉表示,“中國的大模型生態(tài),最后是需要應(yīng)用、模型、算法框架開發(fā)平臺和基礎(chǔ)設(shè)施聯(lián)合起來做的,怎么樣更好地推動這樣一個生態(tài)的發(fā)展,是現(xiàn)在面臨的一個很重要的挑戰(zhàn)。”
智子引擎,人大師生布局AI大模型多模態(tài)理解
南京智子引擎信息科技有限公司成立于2021年5月。去年四五月份開始,大模型“戰(zhàn)況”逐漸升級,智子引擎正是在去年5月和8月分別宣布了天使輪和天使+融資進展,總交易金額約為數(shù)千萬人民幣,披露的投資方有中金資本、軟通高科等。
智子引擎CEO高一釗,是中國人民大學(xué)高瓴人工智能學(xué)院博士生,師從盧志武。值得注意的是,盧志武在智子引擎擔(dān)任顧問一職,此外,他本人也是軟通動力首席AI科學(xué)家。
公開資料顯示,盧志武團隊是國內(nèi)最早研究多模態(tài)大模型、并取得杰出技術(shù)成果的團隊之一。盧志武和高一釗從事多模態(tài)大模型始于 2020 年。
在 ChatGPT 的熱浪下,盧志武和高一釗看到了多模態(tài)研究在大模型時代的新機遇,成立了多模態(tài)大模型公司“智子引擎”。借鑒以往文瀾模型研發(fā)的經(jīng)驗,“智子引擎”團隊于去年3月推出了自主研發(fā)的多模態(tài)對話大模型,并發(fā)布了第一款應(yīng)用級多模態(tài) ChatGPT 產(chǎn)品“元乘象 ChatImg”。
根據(jù)盧志武的介紹,ChatGPT的強項是在文本處理,對多模態(tài)方向的沖擊相較對少?!霸讼?ChatImg”發(fā)布的時間節(jié)點早于OpenAI的GPT-4,這也證明其團隊對多模態(tài)大模型的前沿眼光。
“元乘象 ChatImg”就好比是“會看圖的ChatGPT”,它基于多模態(tài)融合模塊和語言解碼器,用戶輸入一張圖片,Chatlmg就能對其中的內(nèi)容進行解讀,并繼續(xù)相關(guān)的對話?!霸讼?ChatImg”的參數(shù)量在百億級別,主要使用了圖文對數(shù)據(jù)和 VQA 數(shù)據(jù)作為訓(xùn)練集,同時進行圖文匹配、圖文檢索、圖像描述生成、文本描述生成等多種任務(wù)的訓(xùn)練。根據(jù)用戶輸入的圖片或文字,“元乘象ChatImg”可以進行智能聊天、講故事、寫廣告等。
高一釗認為,2024年多模態(tài)領(lǐng)域會有較快增長,而這個領(lǐng)域又可以分成兩大方向,即多模態(tài)生成和多模態(tài)理解。
“多模態(tài)生成方向的視頻生成是目前最受大家關(guān)注的,資源也都流向了這里,2024年一定會產(chǎn)生非常多優(yōu)秀的成果。多模態(tài)理解方向是我們商業(yè)模式的核心,我們持續(xù)看好。這不僅是因為我們看到了已存在的需求,更因為未來無人機、機器人等領(lǐng)域都需要AI對多模態(tài)信息的理解能力。智子引擎2024年將會在多模態(tài)生成和理解方向發(fā)布多個模型及應(yīng)用,繼續(xù)做前沿的創(chuàng)新,推動中國多模態(tài)行業(yè)的發(fā)展”,高一釗表示。
在元乘象Chatimg+無人機組合而成的智慧巡檢系統(tǒng)、元乘象Chatimg+智能機器人等應(yīng)用中,多模態(tài)大模型已經(jīng)初步展現(xiàn)出了下沉到一線應(yīng)用中的能力。相比以往AI在視覺層面的小試牛刀,多模態(tài)大模型可以賦予終端更多維度的信息交互能力,從而實現(xiàn)更為強大的感知和決策能力。
智慧互通獲云天勵飛Pre-IPO輪投資,發(fā)力AI交通大模型
成立于2015年6月的智慧互通科技股份有限公司,專注于計算機視覺與智能傳感、自動化控制領(lǐng)域技術(shù)研發(fā)與應(yīng)用,提供超視線機器人(ASER)、車態(tài)感知(VSA)、全息道路(HRS)、智能路網(wǎng)(IRN)等技術(shù)和解決方案。
2018年至今,智慧互通已完成7輪融資,獲得小米集團、高榕資本、蔚來資本、中金資本、綠動資本、深創(chuàng)投、中關(guān)村啟航基金、中關(guān)村科學(xué)城等投資與助力。而在2023年12月28日宣布的最新一輪Pre-IPO中,智慧互通獲得了云天勵飛的Pre-IPO輪戰(zhàn)略投資。
據(jù)介紹,云天勵飛自主研發(fā)的國產(chǎn)AI芯片,可滿足智慧互通在城市路內(nèi)停車場景中高位視頻的邊緣計算需求,為智慧互通AI技術(shù)底座提供有力支撐。
云天勵飛去年發(fā)布的14nm Chiplet大模型推理芯片,采用國產(chǎn)工藝,內(nèi)含國產(chǎn)RISC-V核,支持大模型推理部署。依托其自研芯片DeepEdge10創(chuàng)新的 D2D chiplet架構(gòu)打造的X5000推理卡,已適配并可承載SAM CV大模型、Llama2等百億級大模型運算,可廣泛應(yīng)用于AIoT邊緣視頻、移動機器人等場景。
當(dāng)前,在AI的常見領(lǐng)域中,如機器視覺、人機交互、自然語言處理、知識圖譜、機器人等,國內(nèi)外的行業(yè)競爭都極為激烈,靠某項技術(shù)“一招鮮打天下”幾乎不再可能。因此,AI必須向傳統(tǒng)行業(yè)靠攏,尋找能解決問題、帶來價值的“AI+行業(yè)”交叉點。
在智慧交通基礎(chǔ)設(shè)施建設(shè)領(lǐng)域,我國政策紅利持續(xù)釋放,智慧城市基礎(chǔ)設(shè)施與智能網(wǎng)聯(lián)汽車協(xié)同發(fā)展的試點城市紛紛加快了智能路網(wǎng)建設(shè)的步伐。賽迪顧問測算數(shù)據(jù)顯示,2022年中國智能路網(wǎng)的市場規(guī)模為258.9億元,預(yù)計2030年能達到2634.8億元。
根據(jù)行業(yè)數(shù)據(jù),在智慧停車方面,當(dāng)前全國路邊停車泊位約200萬個,高位視頻方案滲透率約30%且呈現(xiàn)快速上升趨勢。同時, 根據(jù)國家統(tǒng)計局的汽車保有量3.19億輛和住建部車均泊位缺口0.3-0.5個測算,全國尚有8000萬以上的停車位需求缺口。路邊停車的邊緣計算算力需求將達十億以上市場量級。
盡管市場規(guī)模不斷擴大,但具體應(yīng)用面臨著場景、芯片平臺、算力需求碎片化的痛點,算法投入產(chǎn)出不成正比。大模型由于具有強大的圖像或語言理解能力、場景泛化能力,有望解決這些痛點。而為了滿足大模型部署需求,邊緣計算芯片需要考慮SoC集成、算力可靈活擴展芯片架構(gòu)、統(tǒng)一的工具鏈架構(gòu)、隱私保護等方面因素。
據(jù)了解,雙方將打造更具市場競爭力的“AI+交通”解決方案,共同推動國產(chǎn)AI芯片在智慧交通領(lǐng)域的應(yīng)用。
寫在最后
全球科技巨頭和初創(chuàng)企業(yè)共同角逐AI機遇,產(chǎn)業(yè)確定性不斷增強。特別是大語言模型、多模態(tài)技術(shù)的發(fā)展,以及所拉動的AI創(chuàng)業(yè)熱潮,推動產(chǎn)業(yè)向AGI快速進化。
圍繞AGI的創(chuàng)業(yè)方向主要有:數(shù)據(jù)+大模型+應(yīng)用、數(shù)據(jù)+大模型+硬件等。本文所分析的三家企業(yè),不論是打造基礎(chǔ)設(shè)施的無問蒼穹、看好多模態(tài)理解的智子引擎,還是落地AI交通大模型的智慧互通和云天勵飛,關(guān)于AGI的終極猜想還是解決生產(chǎn)力問題,在落地部署、一線應(yīng)用、垂直細分領(lǐng)域,找到AI的大方向。