作者?| 方文三
2022年的WAIC,和大模型相關(guān)的論壇寥寥無幾,而今年,不聊大模型的論壇屈指可數(shù),參展的大模型高達(dá)30余個(gè)。
2023世界人工智能大會,大模型當(dāng)之無愧成為[頂流]。
大模型的[國家隊(duì)]集結(jié)
WACI 2023大會上,由國家標(biāo)準(zhǔn)委指導(dǎo)的國家人工智能標(biāo)準(zhǔn)化總體宣布:
我國首個(gè)大模型標(biāo)準(zhǔn)化專題組組長由上海人工智能實(shí)驗(yàn)室與百度、華為、阿里等企業(yè)聯(lián)合擔(dān)任。
新組建的專題小組將承擔(dān)大模型的標(biāo)準(zhǔn)化制訂工作,目的是推動大模型和標(biāo)準(zhǔn)化的實(shí)踐結(jié)合,促進(jìn)人工智能產(chǎn)業(yè)的健康發(fā)展。
一方面,美國政府又升級制裁,將限制中國企業(yè)使用美國廠商的云計(jì)算服務(wù),堵住中國人工智能公司可能通過使用云服務(wù)繞過當(dāng)前芯片出口管制規(guī)則的漏洞。
另一方面,這場世界人工智能大會,也給全球展現(xiàn)出了中國AI產(chǎn)業(yè)、大模型技術(shù)發(fā)展的蓬勃動力。
急待彌合新技術(shù)和場景的鴻溝
或許對自研大模型的廠商而言,商業(yè)化的事還可以拖一拖,底層技術(shù)創(chuàng)新是第一要務(wù)。
但對To B AI應(yīng)用廠商來說,一邊是新技術(shù)對現(xiàn)有技術(shù)路線帶來的潛在顛覆效應(yīng),另一邊是新需求誕生創(chuàng)造出的市場增長想象空間。
如何彌合新技術(shù)和需求場景之間的鴻溝,似乎是更加急迫的事情。
大模型之戰(zhàn)逐漸步入后半場,更多人開始關(guān)注大模型與實(shí)體產(chǎn)業(yè)的結(jié)合,企業(yè)也接連展示其產(chǎn)品的應(yīng)用場景。
也因此,國內(nèi)頭部科技企業(yè)的發(fā)力點(diǎn)從通用人工智能大模型,轉(zhuǎn)向行業(yè)大模型。
比如騰訊在6月中旬發(fā)布了一站式行業(yè)大模型精選商店騰訊云Maas;
而華為也在WAIC舉辦期間推出了賦能千行百業(yè)的盤古大模型3.0;
而京東也重磅推出了自研產(chǎn)業(yè)大模型言犀。
很顯然,通用大模型與產(chǎn)業(yè)大模型,已引起了國內(nèi)頭部科技公司AI戰(zhàn)略的分野。
雖然兩者并不是對立關(guān)系,但不同的路線與方向會令其駛向不同的遠(yuǎn)方。
商湯:熱門行業(yè)終端落地應(yīng)用
今年4月,商湯發(fā)布了[日日新]大模型體系,包括千億級參數(shù)的語言大模型[商量]、文生圖創(chuàng)作平臺[秒畫]、AI數(shù)字人視頻生成平臺[如影]、3D內(nèi)容生成平臺[瓊宇]和[格物],這些都在展臺對觀眾開放體驗(yàn)。
同時(shí),宣布了[商湯日日新SenseNova]大模型體系的多方位全面升級,以及在該體系下的一系列大模型產(chǎn)品更新和落地成果。
此外,商湯也著重介紹并展示了其大模型技術(shù)自正式發(fā)布以來與產(chǎn)業(yè)各方的應(yīng)用實(shí)踐。
包括商湯絕影最新打造的智能座艙產(chǎn)品和車路云協(xié)同交通體系等;
以及在金融、醫(yī)療、電商、移動終端、產(chǎn)業(yè)園區(qū)等行業(yè)生產(chǎn)實(shí)踐中的落地應(yīng)用。
華為:全面布局行業(yè)大模型
目前,華為云盤古大模型3.0已在煤礦、鐵路、氣象、金融、代碼開發(fā)、數(shù)字內(nèi)容生成等領(lǐng)域發(fā)揮作用,提升生產(chǎn)效率、降低研發(fā)成本。
盤古大模型3.0是一個(gè)面向行業(yè)的大模型系列,有基礎(chǔ)大模型、行業(yè)大模型、專用大模型三層架構(gòu)。
包括[5+N+X]三層架構(gòu),L0層包括自然語言、視覺、多模態(tài)、預(yù)測、科學(xué)計(jì)算五個(gè)基礎(chǔ)大模型。
華為可能不想寫詩,但大模型ToB(企業(yè)級服務(wù))的錢,卻很想賺到。
百度:多層全棧布局完成
自今年3月份發(fā)布文心一言大模型后,百度已在芯片(昆侖芯)、框架(飛槳社區(qū))、模型(文心系列)、應(yīng)用(百度云合作伙伴)四層完成全棧布局。
訊飛:以不同AI+應(yīng)用場景切入
訊飛展示了[星火]大模型在辦公、教育、醫(yī)療、工業(yè)、金融、汽車和數(shù)字員工的應(yīng)用場景。
不僅展示了大模型在PC與手機(jī)等不同終端中的應(yīng)用實(shí)例。
還以不同行業(yè)場景為切入點(diǎn),讓公眾直觀了解大模型如何賦能學(xué)習(xí)機(jī)助力教育提質(zhì)增效,幫助醫(yī)療行業(yè)搭建個(gè)性化診后康復(fù)管理平臺等行業(yè)類創(chuàng)新應(yīng)用。
京東:根據(jù)自身業(yè)務(wù)打造行業(yè)大模型
京東的優(yōu)勢在于有豐富的零售、物流、金融、健康、政務(wù)等垂直場景的數(shù)據(jù)和行業(yè)經(jīng)驗(yàn)積累。
因此,言犀大模型的定位就是面向產(chǎn)業(yè),訓(xùn)練時(shí)融合70%的通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),針對知識密集型、任務(wù)型產(chǎn)業(yè)場景。
對于有模型訓(xùn)練需求的客戶,京東將提供言犀大模型開放計(jì)算平臺、向量數(shù)據(jù)庫基礎(chǔ)設(shè)施能力,以及2個(gè)行業(yè)數(shù)據(jù)平臺。
京東還將零售、金融、健康、物流等廣泛專業(yè)領(lǐng)域的產(chǎn)業(yè)數(shù)據(jù)也融合到基座模型進(jìn)行訓(xùn)練。
除了大語言模型,京東也在語音、視覺等多模態(tài)模型上進(jìn)行了研發(fā)。
阿里:開源社區(qū)降本增效
會上,阿里云發(fā)布了AI繪畫創(chuàng)作大模型通義萬相,并開啟定向邀測。
不過,更多被提到的是MaaS(模型即服務(wù))理念。
在開發(fā)者生態(tài)層,阿里發(fā)起的大模型開源社區(qū)[魔搭],目前集聚了180多萬AI開發(fā)者和900多個(gè)優(yōu)質(zhì)AI模型。
用戶通過輸入指令,可以一鍵調(diào)用其他的AI模型,用多個(gè)模型協(xié)同完成復(fù)雜任務(wù),這也是降低大模型使用門檻的方式。
用阿里云CTO周靖人的話來說:[把促進(jìn)中國大模型生態(tài)的繁榮作為首要目標(biāo)。]
騰訊:避開擁擠切入行業(yè)大模型
騰訊選擇從MaaS切入產(chǎn)業(yè)大模型領(lǐng)域。
通過技術(shù)中間層向外部企業(yè)提供預(yù)訓(xùn)練、精調(diào)和應(yīng)用開發(fā)等解決方案。
騰訊作為一家云服務(wù)提供商,擁有龐大的技術(shù)資源和豐富的行業(yè)經(jīng)驗(yàn),可以為企業(yè)提供強(qiáng)大的計(jì)算和存儲能力,支持大規(guī)模的產(chǎn)業(yè)大模型訓(xùn)練和優(yōu)化。
在騰訊看來,各家通用大模型水平最多也就在 GPT-3.5 水平附近,說自己超越ChatGPT往往會言過其實(shí),[多騰訊一個(gè)不多,少騰訊一個(gè)不少]。
那樣還不如主打行業(yè)大模型概念,爭取在行業(yè)大模型上成為第一。
而且,對行業(yè)大模型來說,其不需要像通用大模型一樣耗費(fèi)巨資訓(xùn)練通用數(shù)據(jù),而更側(cè)重行業(yè)本身的數(shù)據(jù)。
各垂直領(lǐng)域的行業(yè)大模型早已被多家企業(yè)先后推出。騰訊不做通用的、聊天式的大模型,也是揚(yáng)長避短。
凡是投入,都會有限度
如果是做模型是烹飪,數(shù)據(jù)好比是食材,大模型對高質(zhì)量的[食材]需求更高。
但在公開互聯(lián)網(wǎng)中,中文的高質(zhì)量數(shù)據(jù)本就偏少,大模型廠商其實(shí)很難建立起數(shù)據(jù)壁壘。
在國內(nèi)廠商尚在追趕GPT-3.5的情況下,沒有誰能顯著拉開差距。
本質(zhì)上,AI大模型訓(xùn)練仍然昂貴,即便是大廠,也不可能不求回報(bào)地一直投入。
這意味著,國內(nèi)廠商剛開始做大模型,就面臨著更殘酷的生存考驗(yàn)。
搶著在行業(yè)落地,也是希望能盡快商業(yè)化,再投入到AI模型的開發(fā)和訓(xùn)練中。
不過造輪子不等于沒意義,而是在發(fā)展初期必需要做的積累和儲備。
如果把大模型產(chǎn)業(yè)類比學(xué)數(shù)學(xué),現(xiàn)階段各家廠商都在做的洗數(shù)據(jù)、堆參數(shù)、調(diào)代碼,就好比每天都要背九九乘法表的小學(xué)生。
等到有了足夠的積累才有可能去學(xué)線性代數(shù)、微積分這些更高級的知識,跳出造輪子的階段去做創(chuàng)新。
結(jié)尾:
當(dāng)一種新技術(shù)熱潮顯現(xiàn),往往有兩種演進(jìn)路徑:
一是新技術(shù)兌現(xiàn)了價(jià)值,成為基礎(chǔ)設(shè)施的一部分,不再被關(guān)注,比如互聯(lián)網(wǎng)、推薦算法。
另一個(gè)是新技術(shù)短期內(nèi)無法兌現(xiàn)價(jià)值,然后被新的熱潮搶走資源與風(fēng)頭。
各大廠商的戰(zhàn)略配方是,去大模型糟粕,取其精華;或者[借力打力]。
部分資料參考:
數(shù)字時(shí)氪:《大模型無法一步到位?還得是「熟悉的配方」》,TE智庫:《現(xiàn)階段廠商比客戶更需要大模型》,DoNews:《[舊趨勢]退場,大模型稱王》,智能涌現(xiàn):《30個(gè)大模型,搶著落地》,商業(yè)秀:《2023WAIC,重新審視AI大模型時(shí)代》,國際金融報(bào):《AI大模型,開啟[戰(zhàn)國]時(shí)代!》,零態(tài)LT:《30家企業(yè)爭鳴WAIC:大模型進(jìn)入高維戰(zhàn)》,億歐智庫:《大模型進(jìn)入戰(zhàn)國時(shí)代,從WAIC看誰是七雄》