加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • “文心一言”是表,“昆侖芯”是實(shí)
    • 百度“昆侖芯”的野望
    • 造芯火熱
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

百度“文心一言”遇冷,背后的“昆侖芯”火熱

2023/03/17
4129
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論
就在國(guó)產(chǎn)ChatGPT“文心一言”發(fā)布的時(shí)候,百度港股卻應(yīng)聲下跌近10%。用戶不買賬?技術(shù)不過關(guān)?拋開似乎是“趕鴨子上架”般的文心一言外殼,百度AI成功與否的關(guān)鍵,還得看背后的“昆侖芯”。

2023年3月16日下午兩點(diǎn),百度創(chuàng)始人、董事長(zhǎng)、CEO李彥宏宣布文心一言正式發(fā)布。李彥宏介紹指出,文心一言具有文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、多模態(tài)生成、數(shù)理邏輯推算、中文理解等能力。李彥宏在在開場(chǎng)白中表示:“百度文心一言‘十月懷胎’,終于‘一朝分娩’。”

不過資本市場(chǎng)似乎察覺到了“文心一言”上市的急迫心理。發(fā)布會(huì)是兩點(diǎn)準(zhǔn)時(shí)開的,股票也是應(yīng)聲暴跌的。14時(shí)22分,百度股價(jià)跌幅擴(kuò)大至近10%,截至收盤,百度當(dāng)天下跌收至6.36%。記者在“文心一言”發(fā)布的第一時(shí)間嘗試體驗(yàn)一下,卻發(fā)現(xiàn)它的官網(wǎng)并不像ChatGPT一樣擁有簡(jiǎn)單直接的搜索入口,進(jìn)入文心一言(ERNIE Bot)頁(yè)面需要點(diǎn)擊上方的二級(jí)導(dǎo)航欄才能找到。重要的是,目前該頁(yè)面依舊處于未開放狀態(tài),要想真正體驗(yàn)到中國(guó)版ChatGPT還需要等一等,這或許也是百度開了發(fā)布會(huì),卻導(dǎo)致股票下跌的原因之一。李彥宏也在發(fā)布會(huì)上直言:“作為國(guó)內(nèi)大型企業(yè)中首家發(fā)布“類ChatGPT”產(chǎn)品的企業(yè),百度之所以選擇最先發(fā)布,是因?yàn)槭袌?chǎng)有需求,百度包括搜索、智能云以及小度音響等在內(nèi)的產(chǎn)品,以及眾多的合作伙伴,都等待著用這項(xiàng)技術(shù),百度需要盡早的發(fā)布這項(xiàng)技術(shù)?!保皟?nèi)測(cè)中“文心一言”并不完美,但市場(chǎng)有需求必須要推出來?!?/p>

 

近年來百度的發(fā)展遭遇瓶頸,無論是家喻戶曉的百度搜索,還是曾經(jīng)人手必備的百度貼吧,都難以再取得往日輝煌,連“BAT”領(lǐng)頭羊的“B”如今也被字節(jié)跳動(dòng)取代。百度在舊戰(zhàn)場(chǎng)失利,卻在新賽道上蓄力已久。早在2016,李彥宏就已經(jīng)在為AI搖旗吶喊,曾講出“移動(dòng)互聯(lián)網(wǎng)的時(shí)代已經(jīng)結(jié)束。”,“我看之前那些講互聯(lián)網(wǎng)下半場(chǎng)的人,今天都開始講人工智能了。”

不過這幾年“AI”一直不冷不熱,VR/AR、元宇宙、區(qū)塊鏈等概念的炒作一波接一波,但都是雷聲大雨點(diǎn)小,大部分都只是停在PPT上,百度就像“地主家的傻兒子”般持續(xù)押寶,自研的AI芯片“昆侖”系列持續(xù)迭代。進(jìn)入2023年,ChatGPT的出現(xiàn)終于讓“AI”真正熱了起來。風(fēng)口來臨,有了芯片的百度還能再起飛嗎?

 

“文心一言”是表,“昆侖芯”是實(shí)

2018年,自然語(yǔ)言處理NLP領(lǐng)域進(jìn)入了LLM時(shí)代。谷歌出品的Bert模型,碾壓了以往的所有模型,學(xué)會(huì)了如何從大量的數(shù)據(jù)中學(xué)習(xí)復(fù)雜的上下文聯(lián)系。于此同時(shí),OpenAI也基于Transformer模型發(fā)布了初代GPT。Transformer是一個(gè)利用注意力機(jī)制來提高模型訓(xùn)練速度的模型,它適用于并行化計(jì)算,可以對(duì)輸入的文本進(jìn)行重新編解碼,通過各類矩陣函數(shù),將輸入數(shù)據(jù)分配到眾多NPU中并行計(jì)算,最后輸出最可能的結(jié)果,Bert和GPT都是Transformer的衍生品。Transformer的提出,使得深度學(xué)習(xí)模型參數(shù)突破了1億,GPT-1也應(yīng)用了上億規(guī)模的參數(shù)量,數(shù)據(jù)集約有25億單詞量。

圖源 | syncedreview.com

此后OpenAI持續(xù)迭代GPT系列,GPT-2在GPT的基礎(chǔ)上,添加了多個(gè)任務(wù),擴(kuò)增了數(shù)據(jù)集和模型參數(shù),其參數(shù)量達(dá)到了15億規(guī)模,使用了800萬(wàn)在Reddit被鏈接過的網(wǎng)頁(yè)數(shù)據(jù)。GPT-3擁有1750億個(gè)可調(diào)節(jié)參數(shù),其語(yǔ)料庫(kù)大小達(dá)到了45TB。而ChatGPT是基于GPT-3.5制造的,其可調(diào)參數(shù)與語(yǔ)料庫(kù)訓(xùn)練量將更為驚人。GPT的每一代均相比前一代有了數(shù)量級(jí)的飛躍,百度要想將“文心一言”塑造一個(gè)比肩ChatGPT的AI大模型,其數(shù)據(jù)運(yùn)算量絕不會(huì)小,起碼在數(shù)量級(jí)上應(yīng)處于同一水平。

而處理這些海量語(yǔ)料庫(kù)的背后,其實(shí)是成百上千顆AI芯片的并行計(jì)算。記者曾在之前的文章《ChatGPT如何驅(qū)使上千顆GPU為你工作》中講到,若使用8張英偉達(dá)V100GPU計(jì)算45TB數(shù)據(jù),需要連續(xù)工作36年,若將這些數(shù)據(jù)平均分布到1000張英偉達(dá)H100 GPU中,單顆ALU僅會(huì)分到2.6KB左右的計(jì)算量,總計(jì)算量將會(huì)減少至數(shù)天。即使是在用戶使用模型的時(shí)候,也會(huì)有數(shù)量眾多GPU藏在“大模型”背后為你計(jì)算。

然而早在2022年8月26日,美國(guó)政府就向英偉達(dá)下達(dá)通知,要求對(duì)A100、H100進(jìn)行新的出口管制許可,并立即生效。這也意味著中國(guó)的大模型計(jì)算也會(huì)受到美國(guó)限制,中國(guó)需要用自己的AI芯片來計(jì)算大模型了。中美在AI大模型上爭(zhēng)得頭破血流,看似是軟件的比拼,實(shí)質(zhì)上還是要在芯片上一決高下。

“文心一言”和“ChatGPT”是表,“昆侖芯”與“英偉達(dá)”是實(shí)。

 

百度“昆侖芯”的野望

2021年6月,百度智能芯片及架構(gòu)部門完成獨(dú)立融資,成立昆侖芯(北京)科技有限公司,首輪估值約130億元,百度芯片首席架構(gòu)師歐陽(yáng)劍出任昆侖芯公司CEO。在此之前一年,百度已經(jīng)試產(chǎn)了第一代云端通用人工智能計(jì)算處理器“昆侖1”芯片,這在當(dāng)時(shí)國(guó)內(nèi)唯一一款經(jīng)歷過互聯(lián)網(wǎng)大規(guī)模核心算法考驗(yàn)的云端AI芯片。在芯片部門獨(dú)立融資兩個(gè)月后,百度就宣布第二代昆侖芯片“昆侖2”正式量產(chǎn)。

事實(shí)上,百度在AI領(lǐng)域的布局野心很大,“文心一言”只是基于百度文心大模型研發(fā)的其中一小步。這點(diǎn)在百度文心的官網(wǎng)上也能看到,對(duì)話功能僅僅占了文心大模型總體規(guī)劃的一小塊。假如沒有ChatGPT的橫空出世引爆全球,或許“文心一言”還得在項(xiàng)目檔期表上躺個(gè)一年半載。

 

“文心一言”之外, “昆侖芯”在自動(dòng)駕駛上的押注要更多。阿波羅(Apollo)是百度發(fā)布的面向汽車行業(yè)及自動(dòng)駕駛領(lǐng)域的合作伙伴提供的軟件平臺(tái)。整個(gè)系統(tǒng)基于文心大模型“感知 2.0”架構(gòu)組建,其中昆侖系列芯片是該系統(tǒng)的核心,也是未來L4級(jí)別自動(dòng)駕駛的必需要素。根據(jù)百度方面的說法,未來自動(dòng)駕駛也會(huì)和“文心一言”進(jìn)行整合。事實(shí)上微軟已經(jīng)嘗試將ChatGPT與Bing搜索結(jié)合并取得了不錯(cuò)的成績(jī),未來百度也可以跟著微軟的道路實(shí)行大模型商業(yè)化運(yùn)營(yíng)。

不過押上了百度“身家性命”的昆侖芯,其落地應(yīng)用卻令人十分迷惑。目前國(guó)內(nèi)AI芯片賽道玩家不少,寒武紀(jì)、地平線等均推出了自己的產(chǎn)品。在云計(jì)算領(lǐng)域,寒武紀(jì)已經(jīng)拿下國(guó)內(nèi)AI芯片市場(chǎng)的30%,僅次于英偉達(dá)。地平線也與上汽、一汽、蔚來等廠商深度合作,提供自動(dòng)駕駛相關(guān)AI芯片?!袄觥蹦??自“昆侖2”量產(chǎn)已經(jīng)過去兩年,今天記者依舊很難從互聯(lián)網(wǎng)上搜索到除百度之外的廠商應(yīng)用昆侖芯片的痕跡。據(jù)了解,有消息稱全國(guó)各地都有超算中心應(yīng)用昆侖芯片,也有部分工業(yè)檢測(cè)廠家購(gòu)買了昆侖芯片的檢測(cè)儀器,除此之外再難見蹤跡,其具體應(yīng)用情況難以查詢。拆分出來的昆侖,似乎還是百度的一個(gè)部門,獨(dú)立融資圖啥?

 

造芯火熱

目前谷歌、亞馬遜、阿里巴巴、騰訊、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)企業(yè)均投身造芯領(lǐng)域,百度只是其中動(dòng)身較早的玩家。尤其是近年來美國(guó)持續(xù)加大對(duì)華半導(dǎo)體行業(yè)的限制,中國(guó)對(duì)于國(guó)產(chǎn)芯的需求愈發(fā)強(qiáng)烈,全國(guó)各地紛紛掀起了“造芯熱潮”。但造芯哪有那么簡(jiǎn)單。

芯片制造業(yè)是一項(xiàng)極為復(fù)雜、困難的技術(shù)活動(dòng),需要高超的人才、雄厚的資金和長(zhǎng)期的研發(fā)投入。尤其是在制程工藝、芯片設(shè)計(jì)和設(shè)備研發(fā)等方面,需要積累大量的經(jīng)驗(yàn)和技術(shù)儲(chǔ)備。這些都需要中國(guó)政府、企業(yè)和投資者做出長(zhǎng)期的努力和投入,以建立起一個(gè)可持續(xù)的芯片產(chǎn)業(yè)鏈。今天百度能搶在3月發(fā)布“文心一言”大模型,實(shí)際上背后已經(jīng)有了近10年在AI行業(yè)的積累,雖然效果不盡如人意,但這仍然是國(guó)內(nèi)唯一一款很快能上線的聊天大模型?!拔男囊谎浴北澈蟮腁I芯片技術(shù),也是依托百度作為曾經(jīng)全國(guó)前三的互聯(lián)網(wǎng)企業(yè)的深厚資金功底支撐才能不停迭代。

AI風(fēng)口+造芯熱潮,又會(huì)有一批企業(yè)將隨之“起飛”,“昆侖”芯或許也會(huì)隨著“文心一言”的完善成為資本熱捧的對(duì)象。不過造芯可“飛”不得,盲目入局遇到坎坷,百度是遇冷,其他企業(yè)或許就是“滅頂之災(zāi)”。

百度

百度

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國(guó)際機(jī)構(gòu)評(píng)為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡(jiǎn)單”為使命,堅(jiān)持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長(zhǎng)的全球頂級(jí)高科技公司”。

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國(guó)際機(jī)構(gòu)評(píng)為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡(jiǎn)單”為使命,堅(jiān)持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長(zhǎng)的全球頂級(jí)高科技公司”。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)行業(yè)分析師。工科背景,擅長(zhǎng)與初創(chuàng)企業(yè)打交道,帶你分析最新行業(yè)政策,解讀新聞背后的故事。