加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • “大模型”對算力的高度依賴至少造成兩個重大影響
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

“大模型”訓(xùn)練:一場AI技術(shù)和算力市場的博弈

2023/04/28
1880
閱讀需 6 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

ChatGPT作為近幾個月持續(xù)的熱點(diǎn)話題,熱度不減的背后,是人工智能內(nèi)容自動生成技術(shù)算力需求的水漲船高。一方面,ChatGPT帶動了算力需求增長,另一方面,ChatGPT又對算力支撐提出了更高的要求。

有數(shù)據(jù)顯示,ChatGPT一次模型訓(xùn)練需要的總算力消耗是3640PF-days,耗資約1200萬美元,且在運(yùn)營過程中也需要相當(dāng)大的開銷。

根據(jù)國盛證券報告,以ChatGPT在1月的獨(dú)立訪客平均數(shù)1300萬計算,其對應(yīng)芯片需求為3萬多片英偉達(dá)A100 GPU,大概需要的算力成本為8億美元,每天的電費(fèi)成本在5萬美元左右。ChatGPT獲得微軟130億美元的投資,是其高算力投入背后的信心支撐。

正是有了科技巨頭微軟從資金、未來市場,到算力基礎(chǔ)設(shè)施(Azure云)的全方位支持,OpenAI才能夠以獨(dú)立創(chuàng)業(yè)企業(yè)的身份,完成如此巨大的工程。算力要求和參數(shù)量級緊密相關(guān),參數(shù)量級也是當(dāng)前衡量大模型訓(xùn)練質(zhì)量的一個重要參考。參數(shù)量越大,模型越智能,隨之而來的開銷也就越大。這一點(diǎn)形成了GPT類型高門檻的特點(diǎn)。GPT-3之前的版本是開源的,其他創(chuàng)業(yè)者比較容易以此為基礎(chǔ)開展新的研發(fā)工作。從GPT-4開始,OpenAI開放API以字節(jié)流量收費(fèi)。不論是應(yīng)用開發(fā),還是在此基礎(chǔ)上進(jìn)行二次模型開發(fā),都存在較高門檻。

比較有趣的事情是Meta公司的LLaMA源代碼泄露。由此出現(xiàn)了所謂的“羊駝家族”(“Llama”可譯為“羊駝”)大模型,希望獲得開源資源的開發(fā)者可以在GPT-3之外獲得一個新的選擇。

“大模型”對算力的高度依賴至少造成兩個重大影響

一是這已經(jīng)不是“草根”創(chuàng)業(yè)的游戲,也不是以往互聯(lián)網(wǎng)創(chuàng)業(yè)“Copy To China”的游戲,而是“真刀真槍”的核心能力大比拼,從資金、技術(shù)到企業(yè)戰(zhàn)略定力的全方位考核。

在傳統(tǒng)工業(yè)時代,中國從加工業(yè)開始,逐漸向高價值的核心技術(shù)研發(fā)攀升,但實(shí)際上距離歐美最先進(jìn)水平還有一定距離。特別是在材料科學(xué)等需要長時間技術(shù)積累的類目上,差距依然很大。

進(jìn)入數(shù)字時代,中國產(chǎn)業(yè)界的共識變?yōu)橹苯訌暮诵募夹g(shù)研發(fā)開始。

美國與中國的科技依存度減弱已成趨勢。雖然現(xiàn)在只是芯片行業(yè)受到掣肘, 但是如果“大模型”發(fā)展成為生產(chǎn)要素,我們也一定會遇到同樣的問題。因此,中國必須擁有自己的“大模型”核心技術(shù)。中國科技企業(yè)看到這樣的必然性,對“大模型”進(jìn)行大投入也成為趨勢。

中小科技企業(yè)在沒有能力開發(fā)原生“大模型”的情況下,可以利用GPT-3或者LLaMA的開源模型進(jìn)行開發(fā)或二次開發(fā),形成自己的“大模型”。應(yīng)用開發(fā)企業(yè)很少會開發(fā)原生“大模型”,除非對其應(yīng)用的銷售市場有極高的信心,否則將屈服于巨大的算力成本壓力,轉(zhuǎn)而支付API使用費(fèi),利用現(xiàn)成模型開發(fā)相關(guān)應(yīng)用。

二是“東數(shù)西算”建設(shè)恰逢其時,可能迎來大商機(jī)。

西部地區(qū)“綠電”資源豐富,在“東數(shù)西算”整體規(guī)劃下,西部樞紐主要承擔(dān)備份存儲的工作;東部地區(qū)在智慧城市、產(chǎn)業(yè)互聯(lián)網(wǎng)和互聯(lián)網(wǎng)服務(wù)中的即時計算工作,則放在東部地區(qū)的樞紐解決?!按竽P汀睂λ懔σ缶薮螅瑬|部IDC大規(guī)模占用算力資源,有三大缺點(diǎn):成本高(東部電費(fèi)高)、排放高(東部綠電比例小)、擠占低時延需求應(yīng)用的算力資源,這為西部的算力中心創(chuàng)造了新的商機(jī)。

一方面,將“大模型”的訓(xùn)練計算放在西部地區(qū)的IDC,對當(dāng)?shù)氐?a class="article-link" target="_blank" href="/baike/1572030.html">通信網(wǎng)絡(luò)性能提升有更高要求。海量數(shù)據(jù)的吞吐是一個需要解決的問題,但解決這個問題的成本遠(yuǎn)遠(yuǎn)小于IDC使用費(fèi)差異。

另一方面,科技公司巨頭都提出了自己的ESG(環(huán)境社會責(zé)任)目標(biāo),碳排放是其中最重要的指標(biāo)。“大模型”、大算力,運(yùn)行就會產(chǎn)生大量的碳排放,對“綠色算力”的需求也就越迫切。

*本文刊載于《通信世界》

總第918期 2023年4月25日 第8期原文標(biāo)題:《ChatGPT對算力存在雙重影響

作者:野村綜研未來創(chuàng)新中心主任咨詢顧問 閔海蘭

責(zé)編/版式:王鶴迦

審核:舒文瓊

監(jiān)制:劉啟誠

 

相關(guān)推薦

電子產(chǎn)業(yè)圖譜