加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • AI大底座如何構(gòu)成?
    • AI大底座有何用?
    • AI大底座,為什么是現(xiàn)在?
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

百度發(fā)布「AI大底座」:一口氣把10年AI技術(shù)積累打包了

2023/01/13
736
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

魚羊 發(fā)自 凹非寺

技術(shù)創(chuàng)新的節(jié)點(diǎn)性時(shí)刻,往往是以基建變革的形式展現(xiàn)。

現(xiàn)在,中國AI頭號玩家百度,再次明確復(fù)現(xiàn)了這一規(guī)律:

AI大底座,已正式對外推出。

就在剛剛結(jié)束的百度AI開發(fā)者大會(huì)上,李彥宏判斷,深度學(xué)習(xí)算法是第四次科技革命的標(biāo)志。

并且“創(chuàng)新驅(qū)動(dòng)增長,反饋驅(qū)動(dòng)創(chuàng)新”,這種技術(shù)力量向產(chǎn)業(yè)蔓延的過程中,真正的應(yīng)用創(chuàng)新要靠在產(chǎn)業(yè)實(shí)際應(yīng)用中的“反饋”才能實(shí)現(xiàn)。

而集百度AI能力之大成的AI大底座,正是百度交出的答卷。

什么是AI大底座?

可以這樣理解:這一基礎(chǔ)設(shè)施涵蓋從芯片、框架,到大模型、應(yīng)用的AI發(fā)展全要素。等于是把大數(shù)據(jù)、大算力、大模型集結(jié)到了同一個(gè)體系結(jié)構(gòu)當(dāng)中。

相比于傳統(tǒng)云服務(wù),可以說是全面“AI化”,把計(jì)算跟智能更緊密地綁定在了一起。

百度此舉,如何解讀?又具體印證了怎樣的技術(shù)大勢?

我們照例一層層拆解來看。

AI大底座如何構(gòu)成?

還是先來看看AI大底座的完整構(gòu)成。

具體分為兩層:

基礎(chǔ)架構(gòu)AI IaaS層:最核心的組成部分是提供AI算力支持的芯片。在百度AI大底座中,核心芯片包括百度自研的AI芯片昆侖芯,以及太行DPU等。

應(yīng)用平臺(tái)AI PaaS層:整合百度AI兩大王牌飛槳深度學(xué)習(xí)框架百度文心大模型,能夠?qū)崿F(xiàn)從數(shù)據(jù)存儲(chǔ),到AI模型訓(xùn)練、生產(chǎn)、部署、測試的全鏈路、批量化生產(chǎn)。

從架構(gòu)上來看,AI大底座既在底層的AI計(jì)算、存儲(chǔ)、加速、容器方面進(jìn)行了系統(tǒng)優(yōu)化和產(chǎn)品自研,也在更高層的AI開發(fā)、模型供給能力方面,釋出了百度長期積累的AI技術(shù)優(yōu)勢。

更值得關(guān)注的是,由于百度在全要素上都實(shí)現(xiàn)了核心產(chǎn)品自研,集大成的AI大底座各層之間深度耦合,使得端到端的整合優(yōu)化成為可能。

基于這樣的架構(gòu),AI應(yīng)用開發(fā)的模式不再是手工作坊式的“一項(xiàng)目一訓(xùn)練”,需要耗費(fèi)大量數(shù)據(jù)標(biāo)注成本和人工調(diào)優(yōu)成本,而是更像流水線工廠:

AI底層技術(shù)被抽象出來,形成了通用化、模塊化的平臺(tái)套件,企業(yè)只需要按照實(shí)際業(yè)務(wù)需求“搭積木”。

AI大底座有何用?

這樣一種基礎(chǔ)設(shè)施的形式,能帶來什么新價(jià)值?

核心還是與產(chǎn)業(yè)升級最本質(zhì)的需求有關(guān),即降本增效。

結(jié)合實(shí)際案例來看。理想汽車和百度智能云合作,基于百度AI大底座,構(gòu)建了用于自動(dòng)駕駛研發(fā)的“理想汽車智能云”。

理想的需求在于,隨著自動(dòng)駕駛研發(fā)的深入,其所面對的業(yè)務(wù)場景越來越龐大、復(fù)雜;并且隨著智能汽車出貨量越來越多,很多車載數(shù)據(jù)要回傳進(jìn)一步再訓(xùn)練,其中涉及到復(fù)雜的AI開發(fā)應(yīng)用環(huán)節(jié),對算力、模型泛化能力的要求也很高。

于是,百度AI大底座一方面為其提供了完整的開發(fā)應(yīng)用工具鏈,涵蓋數(shù)據(jù)采集標(biāo)注、數(shù)據(jù)閉環(huán)、模型開發(fā)、云仿真等AI開發(fā)環(huán)節(jié),讓理想可以不用花費(fèi)額外的時(shí)間精力,考慮資源調(diào)度、訓(xùn)練性能、模型部署驗(yàn)證等問題。

另一方面,在百度AI大底座的體系之中,應(yīng)用落地過程中出現(xiàn)的模型效果問題,能夠在深度學(xué)習(xí)框架的支持之下,快速驅(qū)動(dòng)迭代新的模型結(jié)構(gòu);同時(shí)當(dāng)上層應(yīng)用對底層芯片算力提出新的要求,也能夠迅速得到反饋調(diào)整。

通過這樣端到端的優(yōu)化,AI大底座使自動(dòng)駕駛常用的算子訓(xùn)練和推理速度平均提升了100%,同時(shí)使研發(fā)迭代效率提升了100%。

從這個(gè)案例中可以看出,企業(yè)做智能化、做AI開發(fā)的核心痛點(diǎn)包括兩方面:

其一,基礎(chǔ)設(shè)施構(gòu)建需要花費(fèi)大量時(shí)間精力。尤其在智能計(jì)算占比加重的情況下,芯片、框架、模型、應(yīng)用各個(gè)環(huán)節(jié),都需要大規(guī)模投入和長期技術(shù)積累。

其二,所構(gòu)建的基礎(chǔ)設(shè)施如果不能從底層硬件到上層應(yīng)用深度耦合,就會(huì)影響AI開發(fā)的實(shí)際效率和迭代速度。

而AI大底座作為一個(gè)全棧融合的智算基礎(chǔ)設(shè)施,憑借其全要素、端到端優(yōu)化的特點(diǎn),在滿足產(chǎn)業(yè)對基礎(chǔ)設(shè)施的最新需求的同時(shí),恰恰能解決智能化過程中資源效能和模型效能的瓶頸問題。

此外,上層文心大模型的引入,還驅(qū)動(dòng)AI大底座形成了平臺(tái)化的反饋閉環(huán)機(jī)制。

簡單來說,就是產(chǎn)業(yè)應(yīng)用中產(chǎn)生的新知識和經(jīng)驗(yàn),還能不斷被用來再訓(xùn)練大模型,讓AI實(shí)現(xiàn)“自我升級”,以適應(yīng)不同的業(yè)務(wù)環(huán)境。

國網(wǎng)福建,就已受益于這一機(jī)制。

為了解決復(fù)雜自然環(huán)境中的設(shè)備巡檢等業(yè)務(wù)問題,國網(wǎng)福建同樣選擇了智能化升級。

他們遇到的一個(gè)問題是,雖然攝像頭、無人機(jī)等設(shè)備可以充當(dāng)巡檢人員的“眼睛”,替人進(jìn)入到復(fù)雜、危險(xiǎn)環(huán)境中回傳數(shù)據(jù),再靠AI來輔助判斷安全隱患、瑕疵點(diǎn)。但實(shí)際上,自然界的陽光、云彩、光線、植被,任何一點(diǎn)變化都可能給數(shù)據(jù)帶來新的噪音,影響模型的準(zhǔn)確率。

另外,國網(wǎng)是一個(gè)大集團(tuán),底下各個(gè)分公司面對的自然環(huán)境都不一樣,因此通用模型落實(shí)到本地,效果往往不盡如人意。

國網(wǎng)福建的最新解決方案,是依托于百度AI大底座,打造了一個(gè)電力大模型。

這個(gè)電力大模型每到一處,通過吸收少量當(dāng)?shù)貥颖拘畔⑦M(jìn)行微調(diào),就能快速適應(yīng)當(dāng)?shù)匦枨蟆M瑫r(shí),微調(diào)的過程又會(huì)被反饋到通用大模型本體當(dāng)中,進(jìn)一步加強(qiáng)通用大模型的泛化能力。

數(shù)據(jù)顯示,這種AI自我升級能力的引入,使得電網(wǎng)巡檢場景中安全隱患識別率提升了30%,識別效率提升了5倍。

AI大底座,為什么是現(xiàn)在?

簡單總結(jié)起來,百度AI大底座,從技術(shù)的角度來看,就是百度AI技術(shù)的集大成者。從產(chǎn)業(yè)價(jià)值的角度來看,則是以集中力量辦大事的方式,解決了產(chǎn)業(yè)升級當(dāng)前面臨的痛點(diǎn)問題。

但,為什么是現(xiàn)在?

當(dāng)ChatGPT為首的一眾大模型,在2022年里掀起一波又一波AIGC的狂歡。

在更靠近實(shí)際應(yīng)用的產(chǎn)業(yè)側(cè),新一輪技術(shù)沖擊也正在引爆各行各業(yè)對AI應(yīng)用的需求增長。

無論是理想的案例,還是國家電網(wǎng)的案例,本質(zhì)上看,這一輪基礎(chǔ)設(shè)施之變,實(shí)際上就是圍繞智能之變。

這一點(diǎn),在數(shù)據(jù)上亦有反饋。IDC最新報(bào)告就預(yù)測,2022年,中國AI公有云服務(wù)市場規(guī)模將達(dá)到74.6億人民幣。相較于2021年的44.1億元人民幣,增長了近41%。

所以,為什么百度選擇在此時(shí)推出AI大底座,第一重答案,就是時(shí)代所需,大勢所至。

如果說基礎(chǔ)云計(jì)算,加速了企業(yè)數(shù)據(jù)、業(yè)務(wù)電子化、數(shù)字化的進(jìn)程,那么當(dāng)AI開始更深層次地被嵌入到企業(yè)發(fā)展的鏈路之中,新一代AI基礎(chǔ)設(shè)施的推出就變得勢在必行。

百度集團(tuán)副總裁侯震宇也坦承:AI大底座正是應(yīng)經(jīng)濟(jì)加速智能化的大潮流而生。

而盡管在通用云產(chǎn)品上,百度智能云更多扮演的是“追趕者”的角色,但其與AI的淵源,卻是時(shí)間跨度最長的。

有不少行業(yè)分析認(rèn)為,百度智能云從誕生起就是百度AI技術(shù)的輸出窗口,可以說從出生起就是一朵打著AI標(biāo)簽的云。

這就是第二重答案:在AI+Cloud這一方向上,百度具有“人無我有”的技術(shù)優(yōu)勢和經(jīng)驗(yàn)積累。

AI領(lǐng)域出身的玩家,在底層芯片和系統(tǒng)能力上往往欠缺經(jīng)驗(yàn)。而有著深厚底層設(shè)施基礎(chǔ)的廠商,在上層AI軟件能力上,又缺少豐富的落地案例積累。

從這個(gè)層面上來說,在芯片、深度學(xué)習(xí)框架、大模型、產(chǎn)業(yè)應(yīng)用各個(gè)環(huán)節(jié)都有自研基礎(chǔ),且已積累豐富落地經(jīng)驗(yàn)的,百度算得上是獨(dú)一家:

芯片方面,2011年,百度就啟動(dòng)了自研FPGA AI加速器項(xiàng)目。2017年,已經(jīng)有超過1.2萬片F(xiàn)PGA在百度業(yè)務(wù)體系中被部署。

2018年,百度更是發(fā)布了自主研發(fā)的AI芯片昆侖芯。2020年,第一代昆侖芯開始大規(guī)模部署。目前,這顆芯片已經(jīng)落地超過2萬片,并且被廣泛應(yīng)用在百度搜索和自動(dòng)駕駛等領(lǐng)域,同時(shí)服務(wù) 50 多家外部客戶,是國內(nèi)為數(shù)不多真正經(jīng)受過大規(guī)模算法考驗(yàn)的芯片。

框架方面,百度飛槳是國內(nèi)最早啟動(dòng)研發(fā)的自研深度學(xué)習(xí)框架。2016年開源至今,已凝聚406萬開發(fā)者,服務(wù)過15.7萬企事業(yè)單位,開發(fā)模型達(dá)47.6萬個(gè)。

根據(jù)IDC報(bào)告,截至2021年上半年,TensorFLow、PyTorch以及百度飛槳成為國內(nèi)最高頻使用的開源框架。

大模型方面,百度文心大模型是基于百度逾10年的AI技術(shù)積累,和20年來產(chǎn)品業(yè)務(wù)沉淀下的用戶真實(shí)需求打造。從2019年ERNIE 1.0發(fā)布算起,文心大模型在公開權(quán)威語義評測中已斬獲十余項(xiàng)世界冠軍。

基于文心大模型,百度目前已發(fā)布11個(gè)行業(yè)大模型,大模型總量達(dá)36個(gè),已構(gòu)成業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系。目前已大規(guī)模應(yīng)用于搜索、信息流等互聯(lián)網(wǎng)產(chǎn)品,并在工業(yè)、能源、金融、汽車、通信、媒體、教育等各行業(yè)落地應(yīng)用。

這些技術(shù)布局,往往始于技術(shù)微末之時(shí),甚至被冠以“燒錢”的字眼。

但也正是十年飲冰的堅(jiān)持投入,使得百度AI大底座成為了行業(yè)內(nèi)首個(gè)全棧自研的智算基礎(chǔ)設(shè)施。

又正是長期技術(shù)積累帶來的全棧自研能力,給行業(yè)和百度本身,都帶來了更深遠(yuǎn)的影響。

對于行業(yè)而言,一個(gè)全要素、端到端的基礎(chǔ)設(shè)施,實(shí)際是在AI應(yīng)用密度越來越高、需求計(jì)算量越來越大的情況下,把高門檻技術(shù)以低門檻方式輸出實(shí)現(xiàn),同時(shí)還使得更高性價(jià)比成為可能。

用百度自己的話說,是:

別人用100張卡來做的事,我們用五六十張就能解決。

百度AI大底座可提升千卡并行加速比至90%以上,訓(xùn)練場景資源利用率70%以上,模型開發(fā)迭代效率提升100%以上。

這一點(diǎn),還更為具象化地體現(xiàn)在了百度首次對外開放的陽泉智算中心上。

這一智算中心是目前已建成的亞洲最大單體智算中心,具備4EFLOPS的算力,千卡加速比達(dá)到90%,異構(gòu)資源利用率超過70%。

在綠色節(jié)能方面,其PUE值(電能使用效率)低至1.08。這意味著百度一家企業(yè)一年節(jié)省的電量等于德國一個(gè)中型城市全年用電量。因節(jié)能而節(jié)省的成本,隨著智算中心的對外開放,也將投射到客戶的成本節(jié)約上。

注:PUE=數(shù)據(jù)中心總能耗/IT設(shè)備能耗,越接近1表明能效水平越好。

這也就意味著,未來能參與到智能化升級進(jìn)程中的企業(yè),將不止于實(shí)力更為強(qiáng)勁的產(chǎn)業(yè)頭部企業(yè),更多中小企業(yè)亦將為前沿科技所輻射。

而對于百度而言,自主可控本身亦是更深層次社會(huì)價(jià)值的體現(xiàn)。

技術(shù)的創(chuàng)新,驅(qū)動(dòng)著基建的變革,又通過新一代基礎(chǔ)設(shè)施的種種特征,更為清晰地被標(biāo)注在產(chǎn)業(yè)應(yīng)用之中,切切實(shí)實(shí)地影響著產(chǎn)業(yè)智能化轉(zhuǎn)型的節(jié)奏和發(fā)展速度。

背后科技自立的價(jià)值,不言而喻。

是以,時(shí)候到了。

并且就如百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖所分享的那樣:智能化為行業(yè)創(chuàng)造價(jià)值的浪潮才剛剛開始。

百度

百度

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機(jī)構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅(jiān)持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機(jī)構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅(jiān)持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜