文心一言上線進(jìn)入倒計(jì)時(shí),對話百度AI中臺負(fù)責(zé)人。
生成式AI(AIGC)正引爆全球,各行各業(yè)的CEO和開發(fā)者們都在尋找機(jī)會,搭上這趟數(shù)智化“快班車”,從而實(shí)現(xiàn)業(yè)務(wù)轉(zhuǎn)型、業(yè)績增長。
在國內(nèi),接入百度對話機(jī)器人“文心一言”無疑成為企業(yè)進(jìn)入AIGC賽道“掘金”的一張入場券。根據(jù)官方數(shù)據(jù),已有超400家企業(yè)宣布接入文心一言,覆蓋消費(fèi)、工業(yè)、旅游、傳媒等各個(gè)領(lǐng)域。
無論是讓文心一言做搜索引擎的“大腦”,還是基于其開發(fā)智能媒體小編、智能家居助手、電商金牌客服等應(yīng)用……我們看到,AI不僅在口口相傳中名氣大漲,也在這一過程中變得更加規(guī)?;?、平民化、普惠化。
百度創(chuàng)始人兼董事長李彥宏在近日的內(nèi)部信中說:“AI技術(shù)已經(jīng)發(fā)展到一個(gè)臨界點(diǎn),各行各業(yè)都不可避免地被改變,中國AI市場即將迎來爆發(fā)性的需求增長?!?/p>
在生成式AI爆發(fā)的前夕,企業(yè)接入文心一言這樣的應(yīng)用,無疑意味著其搭上了通往數(shù)智化高地的“快班車”。但這顯然只是“長征”的第一步。如何讓AI技術(shù)真正跨越工程化鴻溝,飛躍AI落地的“最后一公里”?這是各行各業(yè)的CEO和開發(fā)人員眼下關(guān)注的問題,因?yàn)檫^去幾年AI工程化確實(shí)經(jīng)歷了不少挫折。
近日,通過對話百度AI中臺的三位資深專家,智東西對這一問題進(jìn)行了深入探討。百度AI中臺,簡單說是百度智能云旗下的AI開發(fā)PaaS(平臺即服務(wù))平臺,后續(xù)將推動文心一言大規(guī)模產(chǎn)業(yè)落地,面向企業(yè)提供一系列AI開發(fā)和運(yùn)維工具。
400+企業(yè)接入文心一言有多少能抵達(dá)“最后一公里”?
根據(jù)官方消息,百度文心一言將在3月16日正式推出。屆時(shí),百度多項(xiàng)主流業(yè)務(wù)將接入文心一言,包括百度搜索,以及基于百度智能云的智能語音助手小度、智能駕駛阿波羅(Apollo)等;同時(shí),目前已有超400家企業(yè)宣布加入文心一言生態(tài)圈,享用這一服務(wù)。
從AI產(chǎn)業(yè)落地的流程來看,接入文心一言或許只是一個(gè)開始。
要實(shí)現(xiàn)技術(shù)到產(chǎn)品的“最后一公里”飛躍并不容易,AI開發(fā)工程化尤為重要。如果把AI模型比成一個(gè)汽車發(fā)動機(jī),AI工程化就好比將一臺發(fā)動機(jī)裝配成一輛可自如行駛的汽車的過程。
百度AI中臺相關(guān)負(fù)責(zé)人告訴智東西,在過去很長時(shí)間里,AI工程化面臨以下幾個(gè)顯著問題:
1、AI開發(fā)流程長且復(fù)雜,行業(yè)缺乏規(guī)范。AI開發(fā)流程大致包括:數(shù)據(jù)采集和標(biāo)注、模型訓(xùn)練、應(yīng)用部署、數(shù)據(jù)回流和模型觀察,沒有規(guī)范意味著混亂無序。
2、市面上眾多AI工具使用門檻高。AI模型面對碎片化場景會效果衰減,企業(yè)需要做二次開發(fā),但市面上的AI開發(fā)工具不是不好用,就是不符合需求。
3、客戶基礎(chǔ)設(shè)施不完善、內(nèi)部孤島嚴(yán)重、人才短缺。比如某銀行客戶各部門建立的17個(gè)云系統(tǒng),同時(shí)各部門孤島嚴(yán)重、需求難以聚合,加之缺乏專業(yè)AI人才,眾多因素使得花大成本購入的AI技術(shù)成為爛尾工程。
為了應(yīng)對這些AI工程化難題,整套百度AI中臺的價(jià)值在文心一言的落地中凸顯了出來。
來說,百度AI中臺是一個(gè)助力企業(yè)AI模型開發(fā)和運(yùn)維的PaaS平臺。其面向金融、能源、互聯(lián)網(wǎng)、教育等多行業(yè)提供人臉識別、OCR、圖像、AR、自然語言處理等多種AI能力(文心一言是其中一項(xiàng)AI服務(wù)),并幫助其實(shí)現(xiàn)簡單、快速部署和驗(yàn)證。
百度AI中臺相關(guān)負(fù)責(zé)人告訴智東西,一方面,文心一言本身的數(shù)據(jù)準(zhǔn)備、標(biāo)注、模型訓(xùn)練、應(yīng)用評估等開發(fā)過程,都是基于百度AI中臺完成。另一方面用途可能更受企業(yè)關(guān)注,那就是助力文心一言的應(yīng)用開發(fā)。
具體來說,在文心一言相關(guān)模型開發(fā)過程中,百度AI中臺可提供從數(shù)據(jù)模型評估、推理優(yōu)化、數(shù)據(jù)回流等全生命周期開發(fā)工具,以保證模型訓(xùn)練效果。比如:在數(shù)據(jù)標(biāo)注環(huán)節(jié),百度AI中臺提供智能標(biāo)注方式和標(biāo)注標(biāo)準(zhǔn),最高可使成本降低70%;在算力消耗方面,百度AI中臺能依照規(guī)范提高GPU利用率,能提升資源利用率40%~80%。
總的來說,有了AI中臺中一整套工具鏈,企業(yè)將能更好地飛躍產(chǎn)品落地的“最后一公里”,從而實(shí)現(xiàn)AI投入變現(xiàn)。
生成式AI爆發(fā)前夕產(chǎn)業(yè)呼喚更適合跑AI的云
眾所周知,算法、算力和數(shù)據(jù)是AI落地的三大要素。
當(dāng)下,基于大模型的AIGC正進(jìn)入爆發(fā)前夜,新的海量智能算力需求也隨之產(chǎn)生。知名調(diào)查機(jī)構(gòu)IDC預(yù)測,人工智能產(chǎn)業(yè)的軟件、硬件和服務(wù)有望在2023年突破5000億美元大關(guān)。智能算力成為產(chǎn)業(yè)最大增量。
百度AI中臺相關(guān)負(fù)責(zé)人告訴智東西,在這種背景下,產(chǎn)業(yè)需要“更適合跑AI的云”。
何謂“更適合跑AI的云”?該負(fù)責(zé)人解讀道,從傳統(tǒng)思路來看,云計(jì)算主要支撐企業(yè)數(shù)字化,AI契合智能化升級,往往分階段完成;但現(xiàn)在,很多企業(yè)會選擇將數(shù)字化和AI化一起規(guī)劃、齊頭并進(jìn),效率會高得多——這就需要更適合跑AI的云。而隨著生成式AI爆發(fā),適合跑AI的云無疑需要支持大模型,支持更高速效的訓(xùn)練和推理,需要更好的異構(gòu)算力支持。
這位負(fù)責(zé)人稱,百度AI大底座正是提供了這樣的新型AI基礎(chǔ)設(shè)施。
簡單來說,百度AI大底座是集百度十年AI研發(fā)之大成的“全棧自研的AI基礎(chǔ)設(shè)施”。百度AI大底座將AI生產(chǎn)全要素,包括自研芯片、大模型、深度學(xué)習(xí)框架、AI應(yīng)用集于一身,并可面向企業(yè)真實(shí)業(yè)務(wù)場景進(jìn)行端到端的全流程調(diào)優(yōu)。
縱觀人工智能產(chǎn)業(yè),我們看到當(dāng)下市面上實(shí)際上已經(jīng)出現(xiàn)了“AI大裝置”等同類產(chǎn)品。但就像“發(fā)動機(jī)”有很多車企造,每一家的質(zhì)量水平有所區(qū)別一樣,百度AI中臺負(fù)責(zé)人告訴智東西,百度AI大底座相比同行競品的一大特征就是:“全要素”和“端到端”。
▲百度AI大底座架構(gòu)圖
具體來看,百度AI大底座由前文提到的AI中臺、底層百舸異構(gòu)計(jì)算平臺兩部分構(gòu)成。百度AI中臺是用戶“界面”,文心大模型是其中可調(diào)用的一個(gè)關(guān)鍵模型PaaS服務(wù)。百舸異構(gòu)計(jì)算平臺是底層基礎(chǔ)設(shè)施服務(wù)平臺,通過自研芯片、計(jì)算、存儲、加速等多方面技術(shù)提供加速算力IaaS(基礎(chǔ)設(shè)施即服務(wù))服務(wù)。
▲百度AI大底座產(chǎn)品圖譜
這位負(fù)責(zé)人指出,這種端到端的能力十分關(guān)鍵。比如有些企業(yè)可能買了最好的AI模型,但由于在開發(fā)中缺乏對數(shù)據(jù)的標(biāo)注和結(jié)果監(jiān)控,就導(dǎo)致AI應(yīng)用中間斷層,久而久之AI模型就被閑置了。舉個(gè)具體案例,比如某銀行在布局OCR技術(shù)中,曾就有旗下七八個(gè)部門采購了不同廠商的產(chǎn)品,并不會考慮數(shù)據(jù)回流等全鏈條問題,就導(dǎo)致整體效果大打折扣。
可以看到,基于AI大底座,百度一定程度上建立了在生成式AI爆發(fā)前夕的技術(shù)優(yōu)勢。根據(jù)IDC數(shù)據(jù),百度智能云已連續(xù)四年居AI公有云市場第一。而這種先發(fā)優(yōu)勢,很有可能在AI大模型時(shí)代保持疊層效果。
AI走向平民化,百度要打造人人能用的AI開發(fā)平臺
生成式AI的爆發(fā)也意味著AI進(jìn)一步走向“平民化”。
這種核心價(jià)值層面的升維,不僅大大提升了AI的知名度,實(shí)際上也對AI開發(fā)工具提出了更加深刻的要求。
具體來說,大模型本身就幫企業(yè)簡化了AI工程化流程,企業(yè)只需結(jié)合業(yè)務(wù)具體場景進(jìn)行小樣本調(diào)優(yōu)就能獲得所需應(yīng)用。
但與此同時(shí),承載了“平民化”期待的生成式AI,需要在工程化中延續(xù)這一“普惠”價(jià)值。新的問題就出現(xiàn)了:大模型擁有巨量參數(shù),一次調(diào)優(yōu)涉及的資源消耗依然可觀;同時(shí)這類技術(shù)往往進(jìn)入企業(yè)業(yè)務(wù)核心,帶來更高價(jià)值的同時(shí),一旦出問題后果會更嚴(yán)重。
因此要實(shí)現(xiàn)真正的AI平民化,一整套高效易用的AI規(guī)范與標(biāo)準(zhǔn)、工具平臺尤為重要,而這需要產(chǎn)學(xué)研多方力量共同努力。
面向AI普惠發(fā)展訴求,百度已積極參與行動。2022年底,為了引導(dǎo)產(chǎn)業(yè)有序發(fā)展,中國信息通信研究院聯(lián)合百度、阿里、華為、“AI四小龍”等幾十家優(yōu)秀企業(yè)編制了MLOps系列標(biāo)準(zhǔn)。MLOps(Machine Learning Operations),簡單來說,是指AI開發(fā)與運(yùn)維的全流程。信通院MLOps標(biāo)準(zhǔn)則可以理解為一本匯集AI開發(fā)全流程的最佳實(shí)踐“寶典”,其誕生標(biāo)志國內(nèi)AI開發(fā)從混亂無序走向標(biāo)準(zhǔn)統(tǒng)一,將大幅提升AI開發(fā)質(zhì)量和效率。
在這一背景下,百度AI中臺已首批通過信通院MLOps系列標(biāo)準(zhǔn),意味著其能夠讓企業(yè)獲得最專業(yè)的AI開發(fā)服務(wù),以業(yè)界較低的成本開發(fā)出需要的AI應(yīng)用。換句話說,MLOps標(biāo)準(zhǔn)提供了一套AI軟件項(xiàng)目研發(fā)和運(yùn)營的方法論,百度AI中臺則為企業(yè)提供了對應(yīng)方法論的“絕佳工具”。
百度AI中臺相關(guān)負(fù)責(zé)人說,百度智能云企業(yè)AI開發(fā)平臺的整體能力在需求管理、數(shù)據(jù)工程和模型開發(fā)三個(gè)模塊均達(dá)到了旗艦級水平。
在功能上,百度AI中臺具有完善的需求和代碼管理流程,AI模型生產(chǎn)過程具備可視化建模、自動化建模、作業(yè)建模、工作流等建模方式,對底層計(jì)算資源具有完備高效的管理模式,對模型具有全面的管理能力,對數(shù)據(jù)具有功能豐富的管理平臺和質(zhì)檢能力。
在服務(wù)過程上,百度AI中臺從組織結(jié)構(gòu)到流程管理,再到管理工具方面,均具有較高的服務(wù)水平,能夠?yàn)橥獠科髽I(yè)客戶的需求提供較為快速和較高質(zhì)量的響應(yīng)。
百度AI中臺相關(guān)負(fù)責(zé)人告訴智東西,在AI基礎(chǔ)設(shè)施能力獲得權(quán)威認(rèn)證背后,AI普惠實(shí)際上是百度智能云長期以來的一大核心價(jià)值。
這不是一蹴而就的。他回顧道,2016年,百度發(fā)布了國內(nèi)第一個(gè)深度學(xué)習(xí)框架——飛槳,隨之百度內(nèi)部開始“賽馬”做多個(gè)機(jī)器學(xué)習(xí)平臺。2018年,高級開發(fā)能力的BML、低門檻開發(fā)的EasyDL、以及用戶實(shí)訓(xùn)比賽社區(qū)的AI Studio三大平臺脫穎而出。
“分久必合,合久必分”。2020年百度將這三大平臺整合,并按照MLOps的過程將業(yè)務(wù)劃分為樣本數(shù)據(jù)中心、開發(fā)中心、模型中心和服務(wù)運(yùn)行平臺四大階段板塊,基本涵蓋了人工智能開發(fā)運(yùn)維的全生命周期。通過2021~2022年的一年三到四次迭代,這一平臺最終實(shí)現(xiàn)了AI開發(fā)低門檻目標(biāo)。
可以看到,通過八年內(nèi)部賽馬打造百度AI中臺,百度正將其“反饋驅(qū)動創(chuàng)新”的科學(xué)方法論賦能給企業(yè),更將其AI普惠價(jià)值傳達(dá)給行業(yè)。
結(jié)語:生成式AI風(fēng)起云智一體趨勢凸顯
當(dāng)下,我國人工智能產(chǎn)業(yè)在經(jīng)歷了十幾年波峰波谷之后,正乘著生成式AI技術(shù)的東風(fēng)迎來新的春天。憑借技術(shù)屬性和社會人才等各方面條件,AI技術(shù)落地的廣度深度延展,正走向規(guī)?;?、平民化、普惠化。
從企業(yè)角度來看,他們正通過接入文心一言等產(chǎn)品的方式,實(shí)現(xiàn)數(shù)字化與智能化轉(zhuǎn)型的齊頭并進(jìn)。盡管正如科技部部長在兩會“部長通道”中所說,國產(chǎn)力量與OpenAI等國際公司仍存在差距。但百度文心一言無疑是國內(nèi)企業(yè)吃到AI技術(shù)新紅利的一條“快車道”入口。
與此同時(shí),企業(yè)接入大平臺大模型也只是一個(gè)開始。下一步,如何基于AI大模型進(jìn)行二次開發(fā)、數(shù)據(jù)挖掘、優(yōu)化調(diào)優(yōu)及部署測試,讓AI實(shí)現(xiàn)“最后一公里”飛躍,成為更關(guān)鍵的問題。
這也使我們越來越意識到,AI落地是一條算法、算力和數(shù)據(jù)跨越漫長開發(fā)鏈條的握手合作。產(chǎn)業(yè)呼喚更適合跑AI的云,云智一體也成為云計(jì)算產(chǎn)業(yè)發(fā)展的重要趨勢。
作者 | 李水青
編輯 | 漠影