禾下乘涼夢(mèng),是一個(gè)今天國(guó)人無(wú)比熟悉的詞。它來(lái)自袁隆平院士對(duì)雜交水稻高產(chǎn)的理想追求,是袁隆平的中國(guó)夢(mèng)。他生前多次提到,夢(mèng)想到禾下乘涼,夢(mèng)里水稻長(zhǎng)得有高粱那么高,籽粒有花生米那么大。
或許,千行百業(yè)都有這樣一個(gè)“禾下乘涼夢(mèng)”??萍继剿鲿?huì)為生產(chǎn)與創(chuàng)造帶來(lái)難以估量的價(jià)值,極大改變?nèi)藗兊纳?。?a class="article-link" target="_blank" href="/tag/AI/">AI領(lǐng)域,有一項(xiàng)技術(shù)經(jīng)常讓我聯(lián)想到“禾下乘涼夢(mèng)”,那就是預(yù)訓(xùn)練大模型。在袁隆平院士的夢(mèng)中,雜交水稻會(huì)長(zhǎng)得非常高大,帶來(lái)極高的畝產(chǎn)量;大模型也是在訓(xùn)練數(shù)據(jù)與模型規(guī)模上非常大,在模型能力上形成巨大優(yōu)勢(shì)。
從2018年開(kāi)始,大模型開(kāi)始作為AI領(lǐng)域重要的技術(shù)方向被廣泛關(guān)注。多年過(guò)去,我們對(duì)于大模型最大的期待,或許就在于它能不能從實(shí)驗(yàn)室和數(shù)據(jù)集中的“種子”,真正變成一片片賦能行業(yè),普惠經(jīng)濟(jì)的稻田。
雜交水稻的發(fā)展,離不開(kāi)精心耕耘的試驗(yàn)田。實(shí)現(xiàn)大模型的“禾下乘涼夢(mèng)”,或許也需要這樣的“試驗(yàn)田”挺身而出,為時(shí)代探明大模型的前進(jìn)方向——這個(gè)關(guān)頭,百度站了出來(lái)。
9月23日,2022萬(wàn)象·百度移動(dòng)生態(tài)大會(huì)在廣東珠海召開(kāi)。會(huì)上,百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組(MEG)總經(jīng)理何俊杰首次對(duì)外全面解讀百度移動(dòng)生態(tài)戰(zhàn)略。其中非常值得注意的一點(diǎn),是會(huì)上詳細(xì)展示了我們熟悉的百度移動(dòng)生態(tài),是如何與百度打造的文心系列大模型深度結(jié)合,帶來(lái)搜索、信息流、AIGC等領(lǐng)域的禾木生長(zhǎng)。在百度移動(dòng)生態(tài)中,文心大模型的能力可謂能用盡用,應(yīng)出盡出。
換個(gè)角度想,如果我們想知道未來(lái)千行百業(yè)如何在大模型的禾下乘涼,那么今天百度移動(dòng)生態(tài)的場(chǎng)景坐標(biāo),或許正指向著明天智能中國(guó)的大模型之路。
大模型3.0階段,產(chǎn)業(yè)轉(zhuǎn)化成為核心
在討論百度移動(dòng)生態(tài)融合文心大模型能力的重要性之前,我們必須先來(lái)了解這背后的技術(shù)與產(chǎn)業(yè)背景。百度移動(dòng)生態(tài)與大模型融合之所以重要,是因?yàn)榇竽P瓦@項(xiàng)技術(shù)本身正處在非常重要的發(fā)展節(jié)點(diǎn)。
從發(fā)展歷程上看,從2018年預(yù)訓(xùn)練大模型開(kāi)始受到行業(yè)重視算起,大模型的發(fā)展可以歸納為三個(gè)階段。第一階段就是所謂的“大煉模型”。傳統(tǒng)的深度模型已經(jīng)是行業(yè)主旋律,而預(yù)訓(xùn)練大模型作為一種新興的技術(shù)思路,開(kāi)始進(jìn)入萌芽階段。接下來(lái)在第二階段,大模型的價(jià)值得到了產(chǎn)學(xué)各界的普遍認(rèn)同。伴隨著資本與社會(huì)關(guān)注度的廣泛注入,談AI必談大模型成為風(fēng)尚,各界也就進(jìn)入從“大煉模型”到“煉大模型”的轉(zhuǎn)變。在這個(gè)階段中,各種大模型層出不窮,在訓(xùn)練數(shù)據(jù)參數(shù)上的擴(kuò)張,技術(shù)思路的發(fā)展帶來(lái)了大模型技術(shù)的繁榮。
當(dāng)大模型的技術(shù)研發(fā)儲(chǔ)備到一定階段,新的挑戰(zhàn)也隨之而來(lái):這么多大模型,到底應(yīng)該如何與產(chǎn)業(yè)應(yīng)用結(jié)合?這個(gè)問(wèn)題如果不能妥善解決,那么大模型的繁榮發(fā)展終究是空中樓閣。所以,大模型的3.0階段,就是從“煉大模型”到“用大模型”的轉(zhuǎn)變。如何實(shí)現(xiàn)有效的產(chǎn)業(yè)轉(zhuǎn)化,已經(jīng)變成了目前階段大模型領(lǐng)域的最核心任務(wù)。
想要用好大模型,從技術(shù)向產(chǎn)業(yè)的轉(zhuǎn)化邏輯上看,需要具備三個(gè)前提條件:技術(shù)過(guò)硬,平臺(tái)與工具齊備,有清晰明確的場(chǎng)景價(jià)值作為示范。而一路深耕文心系列大模型的百度,顯然在前兩項(xiàng)能力中具備先發(fā)優(yōu)勢(shì)。
百度自2019年開(kāi)始深耕預(yù)訓(xùn)練模型研發(fā),發(fā)布了知識(shí)增強(qiáng)文心ERNIE系列模型。2021年12月,百度與鵬城實(shí)驗(yàn)室聯(lián)合發(fā)布全球首個(gè)知識(shí)增強(qiáng)千億大模型“鵬城-百度·文心”,參數(shù)規(guī)模達(dá)到2600億,在60多項(xiàng)NLP任務(wù)中取得最好效果。2022年5月的Wave Summit深度學(xué)習(xí)開(kāi)發(fā)者峰會(huì)上,百度發(fā)布10個(gè)大模型,包括融合學(xué)習(xí)任務(wù)知識(shí)的知識(shí)增強(qiáng)千億大模型、多任務(wù)統(tǒng)一學(xué)習(xí)的視覺(jué)大模型、跨模態(tài)大模型、生物計(jì)算大模型、行業(yè)大模型等,并提出支撐大模型產(chǎn)業(yè)落地的3個(gè)關(guān)鍵路徑:建設(shè)更適配場(chǎng)景需求的大模型體系,提供全流程支持應(yīng)用落地的工具、平臺(tái)和方法,建設(shè)激發(fā)創(chuàng)新的開(kāi)放生態(tài)等。
至此,文心大模型已經(jīng)既包含基礎(chǔ)的通用大模型,也包含面向重點(diǎn)任務(wù)領(lǐng)域的行業(yè)大模型,同時(shí)還具備豐富的工具平臺(tái)。從技術(shù)過(guò)硬角度看,文心大模型具有知識(shí)增強(qiáng)的差異化優(yōu)勢(shì),可以從大規(guī)模知識(shí)圖譜和海量無(wú)結(jié)構(gòu)數(shù)據(jù)中完成學(xué)習(xí),從而實(shí)現(xiàn)模型效率更高、效果更好,具有良好的可解釋性。從平臺(tái)建設(shè)與產(chǎn)業(yè)轉(zhuǎn)化上看,文心大模型具有產(chǎn)業(yè)級(jí)特性,提供全流程支持應(yīng)用落地的工具和方法,營(yíng)造激發(fā)創(chuàng)新的開(kāi)放生態(tài)。
換言之,清晰的場(chǎng)景化示范價(jià)值,是文心大模型推動(dòng)大模型走向3.0階段的“最后一公里”。這個(gè)時(shí)候,百度豐富的產(chǎn)業(yè)生態(tài)布局,就體現(xiàn)出了關(guān)鍵價(jià)值。
百度移動(dòng)生態(tài),做大模型時(shí)代的“試驗(yàn)田”
在科技領(lǐng)域有句話,叫“自己的降落傘自己先跳”。對(duì)于希望率先探索大模型應(yīng)用與產(chǎn)業(yè)轉(zhuǎn)化的百度來(lái)說(shuō),也必須“自己的大模型自己先用”。
好在百度豐富的移動(dòng)生態(tài)布局,不僅是大模型應(yīng)用的價(jià)值沃土,更能以其苛刻的技術(shù)要求、清晰的能力展現(xiàn)、具有代表性的應(yīng)用場(chǎng)景,成為更多開(kāi)發(fā)者與企業(yè)的大模型“試驗(yàn)田”。
2022萬(wàn)象·百度移動(dòng)生態(tài)大會(huì)中,我們看到了百度移動(dòng)生態(tài)與文心大模型基礎(chǔ)能力豐富多元的融合。百度移動(dòng)生態(tài),向來(lái)是百度AI技術(shù)落地的“首站”,長(zhǎng)期秉持著AI技術(shù)能用盡用、能出盡出的原則。
而在與大模型的結(jié)合上,我們首先可以看到百度最新發(fā)布了面向搜索場(chǎng)景的跨模態(tài)大模型“知一”。它可以理解全網(wǎng)文本、圖片、視頻、結(jié)構(gòu)化信息等形態(tài)各異的資源,從而打破資源形態(tài)的界限,將最滿足用戶需求的結(jié)果呈現(xiàn)給用戶,真正實(shí)現(xiàn)大模型技術(shù)與搜索、信息流等百度核心業(yè)務(wù)的深度融合。
而對(duì)于更多百度移動(dòng)生態(tài)中的開(kāi)發(fā)者、創(chuàng)作者而言,基于文心大模型打造的“創(chuàng)作者AI助理團(tuán)”可以帶來(lái)劃時(shí)代的AIGC體驗(yàn)。這個(gè)AI團(tuán)隊(duì)里,有文案、有插畫(huà)師、有視頻制作人,在這些“助理”們的齊心努力下,可以讓創(chuàng)作者實(shí)現(xiàn)“一個(gè)人成為一支隊(duì)伍”。
基于百度文心大模型,“AI文案助理”可以根據(jù)創(chuàng)作者的需求快速產(chǎn)出不同風(fēng)格的文章標(biāo)題、內(nèi)容段落,“AI插畫(huà)助理”可以根據(jù)關(guān)鍵詞,自動(dòng)“畫(huà)”出十余種不同風(fēng)格的畫(huà)作,讓創(chuàng)作者實(shí)現(xiàn)“配圖自由”。相關(guān)能力,目前已經(jīng)可以在百度APP中體驗(yàn),效果十分突出。
“AI視頻制作助理”基于文心大模型的自然語(yǔ)言處理和跨模態(tài)AI技術(shù),讓創(chuàng)作者的圖文自動(dòng)生成視頻,速度可達(dá)“分鐘級(jí)”。這項(xiàng)技術(shù)讓創(chuàng)作者從圖文到視頻的創(chuàng)作周期縮短了3倍以上,而且也為創(chuàng)作者帶來(lái)“一篇內(nèi)容,兩種收益”的效果。
“創(chuàng)作者AI助理團(tuán)”,可說(shuō)是全景式展現(xiàn)了大模型的一個(gè)應(yīng)用價(jià)值——AIGC(AI Generated Content,人工智能自動(dòng)生成內(nèi)容)。基于大模型打造的AIGC能力,可以實(shí)現(xiàn)多種多樣的AI自主創(chuàng)作,以及形態(tài)豐富的創(chuàng)作輔助功能,實(shí)現(xiàn)自動(dòng)生產(chǎn)文案、自動(dòng)生產(chǎn)圖片、圖文轉(zhuǎn)視頻等一系列技術(shù)飛躍。目前,“創(chuàng)作者AI助理團(tuán)”已經(jīng)開(kāi)始邀請(qǐng)內(nèi)測(cè),將從今年第四季度起陸續(xù)向更多創(chuàng)作者開(kāi)放。
由此我們不難看出,文心大模型帶給百度移動(dòng)生態(tài)的能力并不是“錦上添花”的簡(jiǎn)單能力升級(jí),而是實(shí)打?qū)嵉目缭绞絼?chuàng)新,甚至可以說(shuō)解決了移動(dòng)開(kāi)發(fā)者、創(chuàng)作者長(zhǎng)期以來(lái)最核心的創(chuàng)作門(mén)檻困擾,讓創(chuàng)作者聚焦于創(chuàng)作的最核心部分。
這樣的能力升級(jí),當(dāng)然對(duì)于百度移動(dòng)生態(tài)的未來(lái)發(fā)展至關(guān)重要。但更重要的,可能是這種結(jié)合展示了一種可能,一種大模型走向深度產(chǎn)業(yè)應(yīng)用的可能。
AIGC豐收時(shí),行業(yè)轉(zhuǎn)化深耕中:文心大模型的禾下乘涼夢(mèng)
不久之前,科技部發(fā)布了《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場(chǎng)景的通知》(以下簡(jiǎn)稱《通知》),指出要充分發(fā)揮人工智能賦能經(jīng)濟(jì)社會(huì)發(fā)展的作用,打造形成一批可復(fù)制、可推廣的標(biāo)桿型示范應(yīng)用場(chǎng)景。
不難看出,以場(chǎng)景作為先導(dǎo),快速實(shí)現(xiàn)AI技術(shù)的行業(yè)落地與規(guī)?;o助正在成為目前AI產(chǎn)業(yè)發(fā)展的主要任務(wù)。對(duì)于大模型來(lái)說(shuō)也是如此,各行業(yè)想要真正理解大模型的價(jià)值,應(yīng)用大模型的能力,首先需要以場(chǎng)景為先導(dǎo),以示范為坐標(biāo)。
百度移動(dòng)生態(tài)對(duì)于大模型的深入應(yīng)用,正好可以構(gòu)成這種迫切為時(shí)代所需要的場(chǎng)景示范。從大模型走向產(chǎn)業(yè)轉(zhuǎn)化的路徑上看,百度移動(dòng)首先證明了AIGC的可用性。AIGC作為大模型走向產(chǎn)業(yè)的重要一站,更多行業(yè)可以從百度的經(jīng)驗(yàn)中消化并吸納AIGC的價(jià)值,從而實(shí)現(xiàn)自身的大模型落地。其次,百度移動(dòng)生態(tài)與大模型融合,還證明了大模型與產(chǎn)業(yè)需求、產(chǎn)業(yè)真實(shí)情況的融合價(jià)值。百度移動(dòng)生態(tài)擁有著巨大的流量以及多樣化的業(yè)務(wù),這些條件都是對(duì)大模型可用性的考驗(yàn)。
知名經(jīng)濟(jì)學(xué)家任澤平也在萬(wàn)象大會(huì)期間表示:“在AIGC的時(shí)代,百度APP作為‘前哨’和‘根據(jù)地’,是AIGC應(yīng)用最廣闊的天地,也將成為人人皆可用的AI新基建。這種‘百度搭臺(tái),人人唱戲’的模式,將會(huì)激發(fā)全民更大的創(chuàng)造力,很多新模式、新應(yīng)用都會(huì)破土而出。”
從文心大模型與百度移動(dòng)生態(tài)的結(jié)合,到AIGC產(chǎn)業(yè)實(shí)踐的探索,再到更多行業(yè)應(yīng)用大模型的可能,我們可以看到這個(gè)路徑為大模型的3.0階段帶來(lái)了三重價(jià)值。
1.自種自證:大模型的技術(shù)能力已經(jīng)趨向飽滿
百度移動(dòng)生態(tài)對(duì)文心大模型的應(yīng)用,首先讓各行業(yè)的開(kāi)發(fā)者看到了大模型能做什么,有著怎樣的想象力,而這歸其根本來(lái)自文心大模型的技術(shù)能力。大模型的種子,需要在土壤中證明自己的價(jià)值,而AIGC與百度移動(dòng)生態(tài)就提供了這樣的土壤。以AI智能寫(xiě)作為例, ERNIE 3.0 Zeus是文心大模型最新發(fā)布的融合任務(wù)相關(guān)知識(shí)的千億大模型,其在學(xué)習(xí)海量數(shù)據(jù)和知識(shí)的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)百余種不同形式的任務(wù)知識(shí),在各類任務(wù)表現(xiàn)出了更強(qiáng)的創(chuàng)作能力。從財(cái)經(jīng)、體育類新聞快訊,再到詩(shī)歌、小說(shuō)等文學(xué)創(chuàng)作,AI寫(xiě)作覆蓋的領(lǐng)域越來(lái)越廣,創(chuàng)作形式和內(nèi)容也變得更加豐富多彩。
今年高考期間,ERNIE 3.0 Zeus 加持的AI數(shù)字人度曉曉挑戰(zhàn)寫(xiě)高考作文,以40秒40篇的速度,獲得了位列總考生前25%的成績(jī)。ERNIE 3.0 Zeus的智能創(chuàng)作能力目前已經(jīng)對(duì)外開(kāi)放,各行各業(yè)的廣大開(kāi)發(fā)者可以在線體驗(yàn)與定制ERNIE 3.0 Zeus的文本創(chuàng)作能力。再說(shuō)說(shuō)AI作畫(huà),AI作畫(huà)這樣的AIGC應(yīng)用想要得到保障,背后是文心跨模態(tài)大模型的有力支撐,作為全球最大中文跨模態(tài)生成模型,文心ERNIE-ViLG參數(shù)規(guī)模已達(dá)100億,它將「文生成圖」和「圖生成文」任務(wù)融合到同一個(gè)模型進(jìn)行端到端學(xué)習(xí),從而增強(qiáng)文本和圖像的跨模態(tài)語(yǔ)義對(duì)齊。而近期文心ERNIE-ViLG文圖生成算法迎來(lái)升級(jí),通過(guò)漸進(jìn)式擴(kuò)散模型,生成空間由小及大、生成輪廓由粗到細(xì),同時(shí)根據(jù)生成階段自動(dòng)選擇最優(yōu)生成網(wǎng)絡(luò),文本生成圖像的效果取得進(jìn)一步提升??梢哉f(shuō),每一幅AI畫(huà)作的背后,都有文心大模型技術(shù)能力飽滿的證明。
2.沃土通衢:產(chǎn)業(yè)工具與開(kāi)發(fā)平臺(tái)逐漸完備
各行業(yè)、各領(lǐng)域中的開(kāi)發(fā)者,想要真正用到大模型,就需要針對(duì)性的平臺(tái)與工具,從而降低技術(shù)獲取門(mén)檻,提升產(chǎn)業(yè)開(kāi)發(fā)效率。為此,文心大模型在工具化、平臺(tái)化中進(jìn)行了豐富的探索。以AI作畫(huà)為例,文心一格是百度推出的AI藝術(shù)和創(chuàng)意輔助平臺(tái),是百度依托于飛槳、文心大模型持續(xù)的技術(shù)創(chuàng)新,在“AI作圖”方面發(fā)布的產(chǎn)品。面向有設(shè)計(jì)需求和創(chuàng)意的人群,文心一格可以基于文心大模型智能生成多樣化AI創(chuàng)意圖片,輔助創(chuàng)意設(shè)計(jì),打破創(chuàng)意瓶頸。對(duì)便捷性需求更高的開(kāi)發(fā)者,還可以使用文心文圖生成大模型ERNIE-ViLG 服務(wù),極速獲得沉浸式文圖生成大模型的技術(shù)體驗(yàn),更可靈活方便、高效地實(shí)現(xiàn)產(chǎn)品集成。這樣我們可以看到,對(duì)AI作畫(huà)有不同需求、不同考量的開(kāi)發(fā)者,都有平臺(tái)和工具來(lái)獲取自己想要的AIGC能力。這就是大模型走向行業(yè),走向應(yīng)用的沃土通衢。
3.禾下乘涼:大模型規(guī)?;瘧?yīng)用的開(kāi)始
面向更廣闊的行業(yè)應(yīng)用前景與產(chǎn)業(yè)想象力,文心大模型不僅僅推動(dòng)與百度業(yè)務(wù)的結(jié)合,更積極探索對(duì)外賦能的形式與方法。文心大模型具備的知識(shí)增強(qiáng)特性,本身就可以實(shí)現(xiàn)在實(shí)體問(wèn)答、知識(shí)預(yù)測(cè)等領(lǐng)域獲得更好效果,提升大模型在行業(yè)場(chǎng)景中的可用性。同時(shí),文心·行業(yè)大模型采用行業(yè)知識(shí)增強(qiáng)技術(shù)對(duì)行業(yè)特色數(shù)據(jù)與行業(yè)特色知識(shí)學(xué)習(xí),進(jìn)而提升大模型對(duì)行業(yè)應(yīng)用的適配性。目前文心已經(jīng)聯(lián)合國(guó)家電網(wǎng)、浦發(fā)銀行發(fā)布知識(shí)增強(qiáng)的電力行業(yè)NLP大模型“國(guó)網(wǎng)-百度·文心”、金融行業(yè)NLP大模型“浦發(fā)-百度·文心”,已在電力、金融相關(guān)任務(wù)完成落地應(yīng)用。在航天領(lǐng)域,文心大模型攜手中國(guó)航天發(fā)布世界上首個(gè)航天大模型——“航天-百度·文心大模型”,推進(jìn)航天領(lǐng)域AI技術(shù)應(yīng)用。
文心大模型早已推出了開(kāi)發(fā)套件、API和內(nèi)置文心大模型能力的開(kāi)發(fā)平臺(tái),可以讓不同領(lǐng)域、不同需求的產(chǎn)業(yè)開(kāi)發(fā)者以更低成本、更低門(mén)檻精準(zhǔn)獲得大模型賦能,促進(jìn)人工智能的進(jìn)一步廣泛應(yīng)用。
文心大模型在產(chǎn)業(yè)中加速落地,正在成為推動(dòng)AIGC發(fā)展的新引擎,同時(shí)也在成為推動(dòng)產(chǎn)業(yè)智能化的新基座。大模型的規(guī)?;瘧?yīng)用和落地千行百業(yè),或許就是我們期待的那個(gè)智能中國(guó)的禾下乘涼夢(mèng)。