作者 | 李梅? 編輯 | 陳彩嫻
“打開‘深度學習+’大門的三把鑰匙:知識、生態(tài)、千行百業(yè)。”
1764年的一天,“珍妮紡紗機”誕生在英國一個織工哈格里夫斯的家中,將織布效率提高了八倍,吹響了人類進入機器時代的號角。很快,這股“機器之風”就吹到了采煤、冶金、制造、交通等各個領域。一項技術能夠將它的觸角延伸至各行各業(yè),靠的是其底層通用性。正如百度CTO王海峰所說,深度學習具有很強的通用性,呈現出標準化、自動化和模塊化的工業(yè)大生產特征。
在以人工智能為核心的第四次工業(yè)革命中,也正是深度學習技術的通用性打開了AI走向大規(guī)模落地應用的空間。其中,深度學習框架平臺和大模型承擔了技術基座的角色,被委以AI時代基礎設施的重任,前者是讓各類神經網絡在不同硬件條件下高效執(zhí)行的樞紐,后者則使用預訓練技術適配各類上游任務。進入2023年,深度學習下一個黃金十年的列車將駛向AI工業(yè)大生產時代,我們要如何穿過迷霧、找到AI技術創(chuàng)新和產業(yè)落地的最佳路徑?在深度學習領域有著十余年技術積淀的百度,及時地給出了一個答案:“深度學習+”。在今天的百度Create AI開發(fā)者大會上,百度CTO王海峰發(fā)表了題為《“深度學習+”,創(chuàng)新發(fā)展新引擎》的主題演講,他提出:人工智能的技術創(chuàng)新和產業(yè)發(fā)展,已經進入“深度學習+”階段。
王海峰在百度Create AI開發(fā)者大會上王海峰揭示了“深度學習+”的“+”在三個層面的內涵:技術角度,是深度學習+知識;生態(tài)角度,是深度學習+上下游生態(tài)伙伴;產業(yè)角度,是深度學習+千行百業(yè)。AI走向規(guī)?;拇笊a,這三個層面缺一不可。
01、知識:AI是通才,也是行業(yè)專才
過去幾年,深度學習模型在視覺、NLP、語音等各領域已經取得了巨大成功,但業(yè)內的一個普遍共識是,目前模型還存在可解釋性差、通用性不強的弊病,模型的性能也還有很大的提升空間。一個關鍵原因就在于,模型在學習過程中缺乏先驗知識的輸入。這從技術上筑起了一道墻,攔住了AI走向大規(guī)模產業(yè)化的路。在王海峰看來,深度學習+知識,是AI技術進一步發(fā)展的重要方向。人類的推理能力依賴知識,知識凝結了人類千百年來的智慧,捕獲和識別領域知識并將其編碼到模型當中,提升模型對于知識的記憶和推理能力,這種知識增強的深度學習范式更為接近人類大腦。在AI的大模型時代,為智能注入更多智慧,這正是百度走出的一條與眾不同的大模型路線。
2018年,谷歌發(fā)布語言模型BERT,在NLP領域掀起了預訓練模型的技術革命。百度則是國內最早一批占領高地的機構,2019年3月,百度發(fā)布并開源了國內首個知識增強的語言模型文心ERNIE 1.0,它在語言推理、問答匹配等各類中文語言任務上的性能超過了BERT。通過引入知識圖譜,將海量數據與多源的豐富知識相融合,模型的學習效率大大提高,可解釋性也得到了增強。這先行的一步,背后是百度在NLP領域深厚的技術積累,早在2010年,國際頂級NLP專家王海峰加盟百度后,就牽頭成立了國內第一個NLP研發(fā)部門,如今也在大模型上發(fā)力最早。到了今天,文心系列大模型的參數規(guī)模最高已經進化到千億級別,在語言理解、文本生成、跨模態(tài)語義理解等領域取得了多項技術突破。百度沿著“深度學習+知識”這條路線,走出了大模型的差異化道路,并且已經走得很穩(wěn)、很長遠。
縱觀國內各家大模型的發(fā)展,與其他玩家相比,百度更早地從拼參數的盲目風潮中抽身,確立了文心的另一個“殺手锏”:產業(yè)級。這背后遵循的依然是“深度學習+知識”的邏輯:在AI走向大規(guī)模產業(yè)化的過程中,大模型在具備通用知識的同時,必然還要向各行各業(yè)“拜師學習”,進而成為精通各領域的“專家”。所以,“+知識”加的不僅是科學知識、經驗知識,還要有行業(yè)知識。為了填補基礎模型與應用場景之間的鴻溝,在文心通用大模型的基礎上,百度與多個領域的頭部企業(yè)和機構合作,運用行業(yè)知識增強技術,首次把各個行業(yè)的特有數據和知識融合到大模型中,將大模型的能力適配和延展到了能源電力、金融、航天、傳媒、影視、汽車、城市管理、燃氣、保險、電子制造和社科等多個領域。百度的11個行業(yè)大模型,勾勒出了未來AI工業(yè)大生產圖景的雛形。
目前來看,大模型的產業(yè)化尚任重道遠,而2022年AIGC賽道的火爆,則給我們指明了眼下大模型落地最為清晰的一個路徑。OpenAI于去年4月發(fā)布的文生圖模型DALL·E 2打響了AI繪畫熱潮的第一槍,隨后Stability AI在8月推出開源的Stable Diffusion模型,讓AI繪畫的圈子徹底沸騰起來。而在Stable Diffusion上線前三天的8月19日,百度就發(fā)布了一款AI繪畫產品——文心一格。它基于文心大模型的技術,能夠根據文字生成多種風格的高清畫作,是普通人進行高質量藝術創(chuàng)作的一支“神筆”。而長遠來看,AI作畫在toB端有著更為寬廣的場景,在解決了版權、生成的可控性等難題后,像文心一格這樣的工具在移動內容生產、游戲、工業(yè)設計等場景都會有廣泛的應用。
AIGC巨大的想象空間植根于大模型的跨模態(tài)能力。多模態(tài)學習是深度學習在下一個十年的重點方向,如同人類能從一段文字描述中構想出一幅畫面,模型融合了語言、視覺等多模態(tài)知識后,可具備跨模態(tài)生成的能力,文生圖、文生視頻都會是未來大模型的風口所在。這也便是“深度學習+知識”這一概念在模態(tài)層面的延展。
02、生態(tài):乘飛槳駛向產業(yè)更深處
一項缺乏生態(tài)體系的技術,終究會被歷史淘汰。AI技術要走向工業(yè)大生產,深度學習框架、基礎算法、AI芯片以及數據、應用和人才等等,都缺一不可。在AI的產業(yè)鏈上,每一個需求和反饋都需要順暢地傳遞到深度學習技術及應用的每個環(huán)節(jié),經過各環(huán)節(jié)的持續(xù)迭代優(yōu)化,才能最終加速AI的技術創(chuàng)新和產業(yè)化。正是基于這樣的思考,百度提出了“深度學習+上下游生態(tài)伙伴”的觀點。
在這樣一個生態(tài)體系中,深度學習框架上承神經網絡模型和應用,下接各類芯片,因而處于一個非常核心的位置。類比PC時代的操作系統(tǒng)Windows、移動時代的操作系統(tǒng)IOS和安卓,王海峰認為,深度學習框架可以說是當今“智能時代的操作系統(tǒng)”。一個好的框架,能夠幫助開發(fā)者和企業(yè)大幅提升深度學習模型的研發(fā)效率及效果,避免重復“造輪子”。尤其是對于大模型而言,框架可以解決開發(fā)效率低、推理速度慢、部署成本不可控、芯片難以適配等棘手難題。
百度的飛槳平臺(PaddlePaddle)作為一個技術底座,其強大的能力如今已經在文心系列大模型上得到了驗證。而回溯飛槳的誕生,從一開始,它就不僅僅是百度自身的一個成果,更是中國AI發(fā)展歷史上的一次重大飛躍。早在2012年,百度就開始探索深度學習技術及應用。2013年1月,百度建立全世界第一個深度學習研究院(IDL),并開始布局研發(fā)深度學習框架,最終于2016年開源首個國產深度學習框架PaddlePaddle。
在國內市場上,PaddlePaddle至今都是唯一可與國際兩大主流框架TensorFlow和PyTorch正面交鋒的深度學習框架。而細究中國人在深度學習框架領域的研究歷史,我們會發(fā)現這樣一個演變:早期的代表性框架如Caffe(2014年)和MXnet(2015年)都始于學術界,出自一群在國外讀博的華人學生之手,而從PaddlePaddle開始,百度向深度學習框架注入了深厚的產業(yè)基因。直到2020年,各家公司紛紛推出自己的框架,國產框架才迎來在產業(yè)界的爆發(fā)元年。2019年,PaddlePaddle擁有了中文名“飛槳”,其直意是“很快的快船”。如今,乘著這艘快船,AI已經駛向了技術落地的深水區(qū)。飛槳平臺已經匯聚了535萬開發(fā)者、創(chuàng)建了67萬個AI模型,服務著20萬家企事業(yè)單位。
可以看到的是,越來越多的企業(yè)正在借助飛槳的AI技術生態(tài),進行低門檻的AI應用和開發(fā)。例如,中小型企業(yè)可以基于飛槳開發(fā)大量不同種類的技術服務型應用或者模型,大企業(yè)則可以憑借自身的數據優(yōu)勢,借助飛槳提升業(yè)務經營效率。基于研發(fā)模型所用的核心框架、包含各種已經訓練好的深度學習模型的模型庫、支持低代碼的開發(fā)套件和工具組件,以及飛槳企業(yè)版零門檻AI開發(fā)平臺EasyDL和全功能AI開發(fā)平臺BML,飛槳將AI的能力開放給了各行各業(yè)。事實上,從生態(tài)的角度看,百度不僅是國內唯一,而且是全球范圍內極少數擁有全棧布局的人工智能公司。在AI的算力層,飛槳亦建設了極具競爭力的硬件生態(tài)。飛槳正緊密與國內外硬件廠商開展軟硬一體聯(lián)合優(yōu)化,截止目前已有超過30家硬件廠商與飛槳深度融合優(yōu)化,國內外主流芯片基本都已適配飛槳。
2022年,飛槳還聯(lián)合硬件伙伴發(fā)布了“硬件生態(tài)共創(chuàng)計劃”,目前伙伴數量已達28家,包括英特爾、英偉達等硬件廠商。從中國第一款云端全功能AI芯片“昆侖”、飛槳深度學習框架、文心大模型等核心技術,到搜索、智能云、自動駕駛、智能家居等應用,百度自身的技術創(chuàng)新與落地體系,是國內AI走向工業(yè)大生產的一個縮影。
03、千行百業(yè):百度的大視野
AI技術最終要落到何處?在百度看來,必然是千行百業(yè)。憑借飛槳平臺和文心大模型,百度不僅在自身的搜索、信息流等業(yè)務中實現了大規(guī)模應用,還將眼光放在了更廣闊的各行各業(yè)上:工業(yè)、農業(yè)、能源、城市、科學計算等等20多個領域。應用深度學習技術來降本增效,基本上已經成為各行各業(yè)的一個共識,但企業(yè)要真正應用AI來解決實際問題,面臨的難題其實不少:首先,每個行業(yè)有每個行業(yè)的難題,行業(yè)雖數得過來,但細分場景的數量是難以統(tǒng)計的,提供算法、模型的AI公司很難洞悉每個行業(yè)自身的特殊場景需求。其次,傳統(tǒng)行業(yè)大都沒有自己的AI研發(fā)團隊,算法生產的成本相對太高,不是所有企業(yè)都能承擔得起的。
此外,沒有適用工業(yè)場景的部署硬件系統(tǒng),也成了AI落地的“最后一公里”難題。為此,百度飛槳給出的解法是,基于行業(yè)的特色數據,為企業(yè)提供相當于“一整個算法團隊”的能力。舉一個制造業(yè)的例子。在每架飛機起飛前和降落后,飛機航線維修人員都需要進行全面的檢修,但人工檢修很難做到100%不出差錯。因此,許多飛機維修服務公司希望能開發(fā)一款輔助檢修的AI應用,但沒有專業(yè)的算法團隊,預算也不夠,這件事無從下手。在四川賽福威飛機維修服務有限公司,一位IT項目負責人最終借助百度飛槳EasyDL平臺解決了這個難題。毫無AI算法經驗的他,基于EasyDL平臺開發(fā)了一套機務維修安全衛(wèi)士系統(tǒng),能夠高效檢測飛機空速管套、飛行記錄本等,已經在長沙黃花機場實現了落地。
飛槳還正在讓AI走進田間地頭。在北京市大興區(qū)長子營鎮(zhèn),百度飛槳與京東方后稷、裕農聯(lián)合打造了一個AI智慧植物工廠?;诎俣華I技術算法構建的克重識別模型,通過拍攝的圖片就識別重量、健康狀態(tài),準確率達到95%以上;基于飛槳EasyDL平臺的目標檢測模型則實現了自動識別常見昆蟲,識別精度達到90%。
從前,為了觀察蔬菜的生長和蟲害情況,廠里唯一一位農業(yè)專家需日行兩三萬步,而現在,在2600平米的空間里,AI 正在24小時看護植物,兩位工人只需做一些基礎工作,整體工作效率大大提高。像這樣的智慧植物工廠,正在落地到全國各地的智能溫室中。國內有著龐大而豐富的產業(yè)體系,這為AI技術落地帶來了巨大機遇,百度飛槳正在讓強大的AI變得人人可用,為每一個行業(yè)的問題提供答案。同時,豐富的應用場景也反過來會推動底層技術本身的突破,形成一個良性循環(huán)。
04、寫在最后
大衛(wèi)·米切爾在他的科幻小說《云圖》中說:歷史是一副牌,從中隨意抽出幾張出來,我們的祖輩那代抽到的是3、4、5,而我們這一代人抽到的則是10、J和Q。一代人有一代人的使命。深度學習的前十年,AI的能力在算法、學術論文、紙上項目中不斷打破天花板、刷新人類的認知;而在下一個十年,AI的工業(yè)大生產是落在我們肩頭的使命。在這個過程中,國內一眾大廠必然要擔當起引領者的角色。于百度而言,它不曾錯失過去十年深度學習的每一個重要節(jié)點,今日,百度在業(yè)界率先提出“深度學習+”的概念,則又是一次先行者的遠見。在國際人工智能競爭愈發(fā)激烈的當下,中國AI的下一個十年要往何處走,百度已經趟出了一條清晰可見的路。
以大模型為例,谷歌、微軟、Meta、OpenAI、英偉達等國外科技巨頭都在這條賽道上競相追逐,對比之下,在資源投入、技術創(chuàng)新、商業(yè)化落地等方面,國內的大模型發(fā)展都不容樂觀,近日火爆出圈的ChatGPT更是引許多國內研究者發(fā)出了“此誠危急存亡之秋”的呼喊。在AI深入產業(yè)的視野下,國產大模型配國產架構,這是百度區(qū)別于其他AI玩家的核心競爭優(yōu)勢。在2023年的開始,百度用“深度學習+”初步打造了一個AI工業(yè)大生產的宇宙,期待更多住民的到來。