除了“ChatGPT之父”奧特曼被OpenAI董事會(huì)罷免之外,剛剛過(guò)去的這幾天,有關(guān)大模型的消息多次刷屏。先是馬斯克旗下人工智能初創(chuàng)公司xAI推出首款人工智能模型Grok,公開(kāi)叫板OpenAI,再是OpenAI轉(zhuǎn)身甩出一個(gè)“王炸”,GPT-4 Turbo、自定義GPT以及GPT商店接連登場(chǎng),令整個(gè)業(yè)界為之震撼。緊接著,一場(chǎng)DDoS攻擊導(dǎo)致ChatGPT發(fā)生全球大宕機(jī),不得不宣布推遲新功能上線時(shí)間,并暫停新的ChatGPT Plus注冊(cè)。
國(guó)內(nèi)大模型市場(chǎng)也是一片沸騰。招聯(lián)金融、馬上消費(fèi)等連番發(fā)布金融大模型;OPPO、小米、vivo等紛紛官宣大模型“上機(jī)”;美的、長(zhǎng)虹、TCL等家電品牌下場(chǎng)自研大模型......“模型熱”正酣之時(shí),百度CEO李彥宏卻直言“國(guó)內(nèi)大模型太多、應(yīng)用太少”,再度引發(fā)熱議。“卷”起來(lái)的GPT生態(tài)圈背后是對(duì)大模型未來(lái)的思索。
馬斯克“Grok”對(duì)戰(zhàn)“ChatGPT”勝算幾何?
馬斯克的高調(diào)加入無(wú)疑會(huì)讓大模型之爭(zhēng)進(jìn)一步升級(jí)。業(yè)內(nèi)人士猜測(cè),馬斯克選擇在這個(gè)時(shí)間點(diǎn)發(fā)布模型,是為了“對(duì)抗”O(jiān)penAI。不過(guò),相較之下,Grok的入局晚了不少,勝算幾何尚難評(píng)估。
OpenAI最近舉辦的首次開(kāi)發(fā)者大會(huì)賺足了眼球,比如全新升級(jí)的GPT-4 Turbo支持128k上下文,價(jià)格卻降低了2/3,沖擊了現(xiàn)有的商用服務(wù)價(jià)格;新推出的GPTs將大模型從技術(shù)推向了商業(yè)化,這對(duì)產(chǎn)業(yè)發(fā)展而言是至關(guān)重要的一步。
OpenAI創(chuàng)始人Sam Altman對(duì)ChatGPT至今的成就進(jìn)行了回顧。他提到:“到目前為止,我們已經(jīng)擁有大約200萬(wàn)的開(kāi)發(fā)者,他們?cè)谖覀兲峁┑?a class="article-link" target="_blank" href="/tag/API/">API上構(gòu)建了各種各樣的應(yīng)用,并取得了令人驚嘆的成果。超過(guò)92%的世界500強(qiáng)企業(yè)都在使用我們的產(chǎn)品作為基礎(chǔ)。此外,我們的周活躍用戶數(shù)量已經(jīng)達(dá)到了約1億。”這些數(shù)據(jù)意味著OpenAI在構(gòu)建大模型商業(yè)閉環(huán)的過(guò)程中,已經(jīng)成功地吸引了最有付費(fèi)意愿和需求的客戶群體。
不過(guò),ChatGPT也并非十全十美。北京計(jì)算機(jī)學(xué)會(huì)數(shù)字經(jīng)濟(jì)專委會(huì)秘書長(zhǎng)王娟向《中國(guó)電子報(bào)》記者表示:“ChatGPT對(duì)新生事物認(rèn)知有盲點(diǎn)和漏洞,很多測(cè)試開(kāi)始給模型‘喂數(shù)據(jù)’誘導(dǎo)結(jié)果,大模型也有脫軌的時(shí)候?!?/p>
“生成式AI的市場(chǎng)應(yīng)用依然處于早期階段,一切皆有可能,”Forrester副總裁、研究總監(jiān)戴鯤在接受《中國(guó)電子報(bào)》記者采訪時(shí)分析稱,“xAI的商業(yè)版圖融合了大模型、社交平臺(tái)、自動(dòng)駕駛與腦機(jī)接口等不同領(lǐng)域,差異化的生態(tài)能力為Grok的未來(lái)發(fā)展提供了獨(dú)具特色的發(fā)展可能?!?/p>
根據(jù)已經(jīng)公布的一些測(cè)試數(shù)據(jù),Grok在GSM8k(中學(xué)數(shù)學(xué)單詞)、MMLU(多學(xué)科多項(xiàng)選擇)、HumanEval(代碼完成)、MATH(初高中數(shù)學(xué))等多項(xiàng)數(shù)學(xué)和推理能力的基準(zhǔn)測(cè)試中性能均優(yōu)于GPT-3.5,雖然距離GPT-4還有或多或少的距離,但作為第一次正式發(fā)布的公測(cè)版本,Grok-1已經(jīng)有非常顯著的進(jìn)展。
而在訓(xùn)練數(shù)據(jù)方面,GPT-4在訓(xùn)練數(shù)據(jù)的廣度和深度方面都具備顯著的先發(fā)生態(tài)優(yōu)勢(shì),也可以在調(diào)用時(shí)實(shí)時(shí)搜索Web數(shù)據(jù),這是Grok所不具備的。Grok的差異化優(yōu)勢(shì)在于它可以更有效地訪問(wèn)X平臺(tái)(即之前的Twitter)的信息,這賦予了Grok實(shí)時(shí)社交平臺(tái)數(shù)據(jù)洞察及多樣化的生成風(fēng)格。
“巨量、實(shí)時(shí)且獨(dú)特的數(shù)據(jù)是該模型的基礎(chǔ),可以實(shí)時(shí)從推文中獲取最新知識(shí),主打一個(gè)實(shí)時(shí)性,也就是說(shuō)這個(gè)模型在不斷學(xué)習(xí)和更新。同時(shí),Grok有著不走尋常路的幽默模式語(yǔ)言風(fēng)格,馬斯克的個(gè)人風(fēng)格在其中凸顯,開(kāi)發(fā)語(yǔ)言是Rust以及深度學(xué)習(xí)框架新秀JAX,分布式的架構(gòu)讓系統(tǒng)避免了大模型的系統(tǒng)性風(fēng)險(xiǎn)?!蓖蹙瓯硎尽?/p>
“Grok的定位并不一定是GPT的競(jìng)品,GPT定位是全場(chǎng)景的AI平臺(tái),Grok更多是適合X的大模型應(yīng)用平臺(tái),兩者的定位不一樣。Grok是一個(gè)不錯(cuò)的補(bǔ)充?!遍_(kāi)放原子開(kāi)源基金會(huì)TOC主席譚中意對(duì)《中國(guó)電子報(bào)》記者說(shuō)道。
GPT生態(tài)選擇題:開(kāi)源還是閉源?
無(wú)論是Grok與OpenAI的對(duì)決,還是國(guó)內(nèi)各種大模型的比拼,想要突出重圍,生態(tài)建設(shè)是重中之重。這也是OpenAI、阿里云、騰訊等廠商著急做模型商店的根本原因。
“OpenAI的模型商店從理念上與國(guó)內(nèi)大部分廠商的戰(zhàn)略規(guī)劃是一致的,都希望通過(guò)模型商店的方式打造生態(tài),一方面便于中小廠商引流,一方面更利于客戶選擇和開(kāi)發(fā)人員與廠商協(xié)作,以此實(shí)現(xiàn)圍繞GPT大模型更強(qiáng)的黏性,最終推動(dòng)營(yíng)收的增長(zhǎng)?!贝黯H說(shuō)道。
但同時(shí)他也指出,由于廠商自身的市場(chǎng)定位與發(fā)展戰(zhàn)略不同,模型的覆蓋、模型被集成的機(jī)制、面向的客戶群體、針對(duì)的行業(yè)細(xì)分與商業(yè)場(chǎng)景、對(duì)底層云平臺(tái)的選擇、與相關(guān)云服務(wù)的集成、計(jì)量計(jì)費(fèi)、許可與定價(jià)模式等各個(gè)方面肯定會(huì)存在差異。
“雖然都要做模型商店,但OpenAI要做的模型商店和騰訊、阿里等要做的模型商店差異很大。騰訊、阿里云提供的是MAAS服務(wù)(模型即服務(wù)),它們的模型商店支持多種不同的模型(開(kāi)源和閉源的模型都包括);OpenAI則是在其閉源的ChatGPT上提供各種定制化的服務(wù),依賴于其提供的底層模型?!弊T中意說(shuō)道。
就像持續(xù)至今天的“iOS”和“安卓”之爭(zhēng),大模型的生態(tài)建設(shè)同樣面臨開(kāi)源還是閉源這道選擇題。譚中意認(rèn)為:“OpenAI的ChatGPT是閉源的,Meta的Llama2是開(kāi)源的。以后的大模型生態(tài),將是開(kāi)源生態(tài)和閉源生態(tài)之間的競(jìng)爭(zhēng)和合作同時(shí)并存?!?/p>
國(guó)內(nèi),百川智能大模型、智源AI大模型、騰訊混元大模型、阿里云通義千問(wèn)大模型等都宣布加入開(kāi)源的“大部隊(duì)”。而華為的盤古大模型、百度的文心一言等則選擇了閉源。
戴鯤指出,與傳統(tǒng)技術(shù)領(lǐng)域不同,大模型的開(kāi)源包含多種不同層次,涉及模型架構(gòu)、用于模型預(yù)訓(xùn)練的代碼與超參數(shù)、完成預(yù)訓(xùn)練的模型權(quán)重與參數(shù)、用于模型評(píng)估的輸入數(shù)據(jù)預(yù)處理代碼與模型評(píng)估代碼、全過(guò)程配置與開(kāi)發(fā)文檔、API與插件接口、許可證方式等。保持開(kāi)放的接口與插件體系、搭配開(kāi)放的文檔與有限開(kāi)源的商業(yè)許可是必然的選擇,而其他層次的開(kāi)源與否可以根據(jù)市場(chǎng)發(fā)展動(dòng)態(tài)選擇。
“模型商店帶來(lái)的將是更加廣泛的數(shù)據(jù)和商業(yè)模式。如果開(kāi)源能夠提供閉源所不能替代的活躍度,同時(shí)促進(jìn)開(kāi)發(fā),當(dāng)然很好。但如果只是增加了短期的應(yīng)對(duì)負(fù)荷和同質(zhì)化產(chǎn)品競(jìng)爭(zhēng),對(duì)技術(shù)和商業(yè)價(jià)值都沒(méi)有太大意義,閉源就很好?!蓖蹙暾f(shuō)道。同時(shí)她指出,OpenAI至少目前的目的不是純粹的商業(yè)化。騰訊、阿里的模型商店是要用模型盈利和定價(jià)帶動(dòng)應(yīng)用層的配套,以及云和硬件產(chǎn)業(yè)鏈市場(chǎng)。
百川智能創(chuàng)始人、CEO王小川表示,未來(lái)開(kāi)源和閉源會(huì)像蘋果和安卓系統(tǒng)一樣并行發(fā)展。大部分服務(wù)會(huì)依賴開(kāi)源模型,而閉源會(huì)提供特定的增值服務(wù)。開(kāi)源模型提供80%,最后靠閉源提供剩下20%服務(wù)。
模型生態(tài)究竟應(yīng)該怎么建?
發(fā)展至今,無(wú)論是通用大模型還是行業(yè)垂直大模型,賽道上都已擠滿了各類玩家,有互聯(lián)網(wǎng)科技公司,有AI技術(shù)公司,還有手機(jī)廠商、家電廠商、金融機(jī)構(gòu)、文娛公司、教育機(jī)構(gòu)等跨界選手。這反映出業(yè)界對(duì)大模型抱有極大的熱情與信心,但同時(shí)也表明產(chǎn)業(yè)尚未形成一個(gè)真正具備吸引力和競(jìng)爭(zhēng)力的模型生態(tài)。
談及構(gòu)建模型生態(tài)的關(guān)鍵要素,戴鯤表示,模型自身的能力、廠商的平臺(tái)化能力和生態(tài)運(yùn)營(yíng)能力,三者缺一不可。首先,模型要有卓越的性能、出色的多模態(tài)支持、良好的開(kāi)放性與快速迭代、良好體驗(yàn)的開(kāi)發(fā)環(huán)境、完善的文檔與案例等;其次,廠商必須具備平臺(tái)化能力,比如涵蓋公有云、私有云與邊緣云在內(nèi)的服務(wù)于ModelOps的全棧云原生能力平臺(tái)化,圍繞模型的人工智能平臺(tái)與數(shù)據(jù)管理的全生命周期平臺(tái)化,面向各行業(yè)細(xì)分業(yè)務(wù)場(chǎng)景進(jìn)行模型定制的平臺(tái)化,以及涵蓋從底層芯片到開(kāi)發(fā)和上層應(yīng)用的軟硬件適配平臺(tái)化等;此外,廠商還需具備生態(tài)運(yùn)營(yíng)的能力,比如對(duì)國(guó)內(nèi)、國(guó)際開(kāi)源社區(qū)與產(chǎn)業(yè)聯(lián)盟的貢獻(xiàn)與影響,從模型開(kāi)發(fā)到工程實(shí)踐對(duì)開(kāi)發(fā)人員的有效支持以及企業(yè)業(yè)務(wù)與技術(shù)決策者的思想領(lǐng)導(dǎo)力等。
“頭部廠商積累的數(shù)據(jù)客觀上形成模型生態(tài)的競(jìng)爭(zhēng)基礎(chǔ),所以在生態(tài)建設(shè)方面,字節(jié)、騰訊、阿里這些企業(yè)的核心競(jìng)爭(zhēng)力更具優(yōu)勢(shì)?!蓖蹙瓯硎?。實(shí)際上,模型并非越多越好,國(guó)內(nèi)現(xiàn)在大模型很熱,已有的大模型愿景大多都是做全產(chǎn)業(yè)鏈布局。很多看上去不錯(cuò)的大模型,實(shí)際本身不僅不產(chǎn)生任何價(jià)值,還造成了算力、人力和財(cái)力的浪費(fèi)。
根據(jù)專家預(yù)測(cè),未來(lái)幾十年的大模型相關(guān)的產(chǎn)業(yè)形態(tài),首先是有幾家提供通用大模型服務(wù)的企業(yè),包括百度、阿里等;其次是多家企業(yè)提供行業(yè)大模型的服務(wù),包括金融、能源、制造等行業(yè);最后是數(shù)百家甚至上千家技術(shù)企業(yè)提供企業(yè)內(nèi)部的私有化大模型服務(wù),用于知識(shí)管理、軟件開(kāi)發(fā)、供應(yīng)鏈等具體場(chǎng)景。每家企業(yè)內(nèi)都會(huì)有很多大模型的服務(wù),其中大部分是部署在企業(yè)內(nèi)部的私有化大模型服務(wù),也有少部分是訪問(wèn)公網(wǎng)大模型 API 服務(wù)。
“要建立不錯(cuò)的生態(tài)環(huán)境,需要卓越的技術(shù)能力和商業(yè)能力,從國(guó)內(nèi)大模型廠商來(lái)看,百度相對(duì)而言技術(shù)實(shí)力比較靠前,騰訊和阿里云也有豐富的應(yīng)用場(chǎng)景,都有不錯(cuò)的前景?!弊T中意表示。不過(guò),對(duì)比OpenAI,差距還是非常明顯的。比如中文數(shù)據(jù)集在數(shù)量上和質(zhì)量上還跟英文數(shù)據(jù)集有很大差距,算力也受到很大限制,架構(gòu)在大模型上的開(kāi)發(fā)生態(tài)才剛剛開(kāi)始。
“我們需要的大模型是一個(gè)能夠持續(xù)進(jìn)化的大模型,是一個(gè)能在此基礎(chǔ)上產(chǎn)生健康生態(tài)(開(kāi)發(fā)活躍、良性競(jìng)爭(zhēng)、技術(shù)和商業(yè)都兼顧)的大模型,中國(guó)的大模型生態(tài)應(yīng)該是閉源和開(kāi)源互相競(jìng)爭(zhēng)、互相合作的模式。”譚中意表示。
作者丨宋婧,編輯丨趙晨
美編丨馬利亞,監(jiān)制丨連曉東