加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • ChatGPT背后的AI超級計(jì)算機(jī)
    • 無止境的算力需求下,如何實(shí)現(xiàn)“可持續(xù)”計(jì)算?
    • 加速計(jì)算光刻的“iPhone時刻”
    • 生成式AI需要充分的供應(yīng)鏈準(zhǔn)備
    • 寫在最后
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

獨(dú)家對話黃仁勛:關(guān)于生成式AI、算力能耗的一些追問

2023/03/27
2473
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

隨著ChatGPT的爆火,黃仁勛最近頻頻強(qiáng)調(diào):“我們正處于AI的iPhone時刻”。GTC上,他對媒體詳解了這一觀點(diǎn)的由來,在他看來——一個新的計(jì)算平臺已經(jīng)開發(fā)出來了。

過去大約每15年一波的科技潮流中,不論是PC革命、互聯(lián)網(wǎng)革命、云計(jì)算、移動云等等,每一波潮流都創(chuàng)建出了一個新的計(jì)算平臺,新的應(yīng)用程序由此產(chǎn)生,業(yè)界用一種新的方式對計(jì)算機(jī)進(jìn)行編程。而這一次,ChatGPT劃時代地“使人類語言成為新的編程方式”。

“我們只需要告訴ChatGPT想要什么,它就可以理解我們的意圖,給出令人驚嘆的結(jié)果”,黃仁勛說道,“這意味著,人們可以用任何語言‘編程’,不論是英語、中文、法語、日語……人工智能的發(fā)展正因此而變得更加通用——這是一個臨界點(diǎn)的時刻,也是非常重要的過渡?!?/p>

ChatGPT背后的AI超級計(jì)算機(jī)

毫無疑問,NVIDIA技術(shù)是這一波生成式 AI發(fā)展的基礎(chǔ),黃仁勛講述了NVIDIA如何在變革初期就已參與進(jìn)來。早在2016年,他就向OpenAI親手交付了第一臺NVIDIA DGX AI超級計(jì)算機(jī),這也是支持ChatGPT大型語言模型突破背后的引擎。

黃仁勛表示:“如果把加速計(jì)算比作曲速引擎,那么AI就是動力來源。生成式AI的非凡能力,使得企業(yè)產(chǎn)生了緊迫感,他們需要重新構(gòu)思產(chǎn)品和商業(yè)模式?!?/p>

值得一提的是,最初作為 AI 研究儀器使用的NVIDIA DGX超級計(jì)算機(jī)現(xiàn)已在世界各地的企業(yè)中全天候運(yùn)行,用于完善數(shù)據(jù)和處理 AI?!敦?cái)富》100 強(qiáng)企業(yè)中有一半都安裝了DGX AI超級計(jì)算機(jī)。

而隨著ChatGPT大型語言模型連接到辦公自動化、辦公應(yīng)用程序和生產(chǎn)力應(yīng)用程序等,AI將無所不在,而DGX 超級計(jì)算機(jī)將有望成為“現(xiàn)代AI工廠”。

無止境的算力需求下,如何實(shí)現(xiàn)“可持續(xù)”計(jì)算?

伴隨生成式AI的爆發(fā)式應(yīng)用,一個可預(yù)見的趨勢是:AI模型、數(shù)據(jù)量將越來越大,導(dǎo)致所需的算力規(guī)模也越來越大。與傳統(tǒng)計(jì)算相比,GPU的耗電量也是業(yè)界的“吐槽點(diǎn)”。那么,在這樣的趨勢下,NVIDIA如何應(yīng)對能耗問題,從而符合綠色節(jié)能的可持續(xù)發(fā)展方向?

黃仁勛告訴<與非網(wǎng)>,可持續(xù)非常重要,也是NVIDIA的關(guān)注重點(diǎn)。他指出,AI加速計(jì)算在當(dāng)今世界的計(jì)算中只占很小一部分。事實(shí)上,在過去40年的發(fā)展中,世界上絕大多數(shù)計(jì)算都是由摩爾定律驅(qū)動的。但是,在過去5年左右,摩爾定律開始急劇放緩,這是因?yàn)槲覀冊诒平锢韺W(xué)的極限,我們可以縮小晶體管,但不能縮小原子。一個隨之而來的挑戰(zhàn)就是:如果摩爾定律結(jié)束,世界會發(fā)生什么?

“現(xiàn)在,我們需要的計(jì)算量更大了。但是,性能每提高10倍,或吞吐量提高10倍,功耗就增加10倍、成本增加10倍,這是不可持續(xù)的”,黃仁勛表示,“因此,我們首要做的一件事就是加快每一個可能的工作量。”

加速計(jì)算之所以有效,就因?yàn)樗侨珬5?。它發(fā)明了新的軟件、新的算法、新的芯片、新的系統(tǒng),對于每個應(yīng)用程序域,通過執(zhí)行這樣全棧的操作,可以將計(jì)算性能顯著提升。例如在計(jì)算光刻領(lǐng)域,作為EDA工作中計(jì)算最密集的應(yīng)用程序,加速計(jì)算可以將其性能提高50倍、功耗和成本降低近10倍。

“這就是加速計(jì)算要做的事情,一項(xiàng)接一項(xiàng)工作負(fù)載、一個接一個應(yīng)用程序域”,黃仁勛表示。比如在數(shù)據(jù)中心,通過加速工作負(fù)載,就可以減少電力使用,從而可以將其轉(zhuǎn)移到新的增長中。“如果通過加速回收10倍的動力,想象一下我們有多少增長機(jī)會?”,他強(qiáng)調(diào)。

至于實(shí)現(xiàn)可持續(xù)發(fā)展的具體手段是什么?黃仁勛強(qiáng)調(diào),“第一,我們必須加快應(yīng)用程序的速度;第二就是AI?!彼忉屨f,我們今天用于仿真模擬的方法是所謂的第一原理,它基本適用于物理定律。(注:在物理中,第一原理(First Principle)是指不需要任何經(jīng)驗(yàn)設(shè)定與擬合參數(shù),只從最基本的物理定律出發(fā),就可以推出系統(tǒng)的基本性質(zhì)。)

就像小狗能夠跳起來接住拋到空中的球一樣,它能夠僅憑經(jīng)驗(yàn)就預(yù)測到球的飛行位置,訓(xùn)練AI也是如此,“我們通過教AI物理定律,可以讓AI有能力將計(jì)算量減少1萬或10萬倍。一旦AI可以利用知識、利用技能來預(yù)測物理,就可以有效節(jié)省計(jì)算量,從而節(jié)約能源”,黃仁勛指出。

加速計(jì)算光刻的“iPhone時刻”

正如上文中黃仁勛提到的計(jì)算光刻應(yīng)用,隨著當(dāng)前生產(chǎn)工藝接近物理學(xué)極限,NVIDIA將加速計(jì)算引入到計(jì)算光刻領(lǐng)域,通過cuLitho助力ASML、TSMC和Synopsys等半導(dǎo)體頭部企業(yè)加速新一代芯片的設(shè)計(jì)和制造。

據(jù)了解,TSMC、Synopsys 正在將NVIDIA cuLitho 計(jì)算光刻技術(shù)軟件庫整合到最新一代 NVIDIA Hopper架構(gòu)GPU的軟件、制造工藝和系統(tǒng)中。ASML也正在就GPU和cuLitho與NVIDIA 展開合作,并計(jì)劃在其所有計(jì)算光刻軟件產(chǎn)品中加入對 GPU 的支持。

在計(jì)算光刻領(lǐng)域引入加速計(jì)算的意義究竟是什么?

毋庸置疑,芯片產(chǎn)業(yè)幾乎是每一個行業(yè)的基礎(chǔ)。而在半導(dǎo)體制造過程中,光刻技術(shù)決定著芯片晶體管的尺寸,NVIDIA cuLitho 計(jì)算光刻技術(shù)軟件庫可為2納米及更高工藝奠定基礎(chǔ)。

類似于在攝影中將底片上的圖像曝光到相紙上一樣,光刻工藝?yán)霉庠诠?a class="article-link" target="_blank" href="/tag/%E6%99%B6%E5%9C%86/">晶圓上生成表示芯片設(shè)計(jì)的圖案。計(jì)算光刻的作用就是補(bǔ)償因衍射或光學(xué)、抗蝕劑和蝕刻鄰近效應(yīng)而導(dǎo)致的任何圖像誤差。借助OPC軟件,開發(fā)者可以利用算法和數(shù)學(xué)方法以及大量仿真工作來操控光線,從而實(shí)現(xiàn)計(jì)算光刻過程。

這個過程涉及到利用各種各樣的“假設(shè)”場景來找到正確的配置,以盡可能地提高轉(zhuǎn)印圖案的準(zhǔn)確性。例如,在光線周圍投射一些精心挑選的合適偽影,比如可以操控光線的襯線,可以在晶圓上生成更接近原始掩模的圖案。

計(jì)算光刻作為一項(xiàng)資源密集型工作,通常需要大量數(shù)據(jù)中心來處理相關(guān)計(jì)算和仿真運(yùn)行。這一過程可能需要很長的時間,即使是使用最強(qiáng)大的計(jì)算機(jī)也是如此。與此同時,開發(fā)者希望在芯片上封裝更多的晶體管,這進(jìn)一步增加了光刻的挑戰(zhàn),此外,計(jì)算工作負(fù)荷也是只增不減。計(jì)算光刻的仿真環(huán)節(jié)成為該過程最耗時的部分之一,因?yàn)楣饪踢^程中每個步驟的詳細(xì)模型都需要進(jìn)行仿真。全芯片應(yīng)用中可能有數(shù)百萬個Tile,因此必須具有超快的掩模合成計(jì)算速度。

為了實(shí)現(xiàn)所需的性能提升,將cuLitho集成到Synopsys全芯片掩模合成解決方案和Proteus ILT逆光刻技術(shù)中并進(jìn)行優(yōu)化,可在新一代NVIDIA Hopper架構(gòu)GPU上運(yùn)行。如此一來,傳統(tǒng)配置上需要40000個CPU的系統(tǒng),僅需要500個NVIDIA DGX H100節(jié)能型GPU系統(tǒng)。計(jì)算光刻工藝的所有部分都可以并行運(yùn)行,減少所需功耗并且運(yùn)行時間從數(shù)周縮短到數(shù)天。

生成式AI需要充分的供應(yīng)鏈準(zhǔn)備

在生成式AI需求爆發(fā)式增長的背景下,黃仁勛認(rèn)為,行業(yè)需要進(jìn)行充分的供應(yīng)鏈準(zhǔn)備,以滿足全球?qū)I的需求。

為了幫助企業(yè)部署處于快速發(fā)展的生成式 AI 模型,黃仁勛發(fā)布了用于 AI 視頻、圖像生成、大型語言模型部署和推薦器推理的推理平臺。這些平臺將NVIDIA的全套推理軟件與最新的 NVIDIA Ada、Hopper和Grace Hopper處理器相結(jié)合,包括用于AI視頻的NVIDIA L4 Tensor Core GPU和用于大型語言模型部署的NVIDIA H100 NVL GPU。

同時,NVIDIA AI Foundations云服務(wù)系列,也可以為需要構(gòu)建、完善和運(yùn)行自定義大型語言模型及生成式 AI 的客戶提供服務(wù),加速企業(yè)使用生成式 AI 的工作。

據(jù)黃仁勛透露,會將由八塊旗艦版A100或H100芯片集成的DGX超級AI計(jì)算系統(tǒng)通過租賃的方式開放給企業(yè),每月租金37000美元,以加速這輪大語言模型引領(lǐng)的AI浪潮。

據(jù)了解,通過與云服務(wù)供應(yīng)商合作,NVIDIA在歐美提供DGX系統(tǒng)AI超級計(jì)算機(jī)的能力;在中國,也有特別定制的Ampere和Hopper芯片(A800和H800),通過中國的云服務(wù)供應(yīng)商,比如阿里巴巴、騰訊、百度等企業(yè)提供落地能力?!拔彝耆嘈潘麄冇心芰θヌ峁╉敿壍南到y(tǒng)服務(wù),對于中國初創(chuàng)企業(yè)來說,也一定有機(jī)會來開發(fā)自己的大語言模型”,黃仁勛表示。

寫在最后

GTC期間,黃仁勛和OpenAI聯(lián)合創(chuàng)始人、首席科學(xué)家Ilya Sutskever 進(jìn)行了一場爐邊對話。Ilya Sutskeve感慨自己從業(yè)20余年,看著AI從“小透明”到震驚人類:“它還是那個神經(jīng)網(wǎng)絡(luò),只是變得更大,在更大的數(shù)據(jù)集上以不同的方式訓(xùn)練,但是訓(xùn)練的基礎(chǔ)算法都是一樣的,這是最令我驚訝的!”

黃仁勛也感慨,“在我們相識的十多年時間里,關(guān)于訓(xùn)練的模型和數(shù)據(jù)(從AlexNet訓(xùn)練到現(xiàn)在),已經(jīng)擴(kuò)大到100萬倍。在計(jì)算機(jī)科學(xué)界,當(dāng)時沒有人會相信這十年間,計(jì)算量會擴(kuò)大到100萬倍。”

但這就是一個正在發(fā)生的事實(shí)——由于生成式AI,訓(xùn)練的規(guī)模增大了很多。而業(yè)界對于生成式AI的大量推理運(yùn)用,正導(dǎo)致AI處于拐點(diǎn)。

英偉達(dá)

英偉達(dá)

NVIDIA(中國大陸譯名:英偉達(dá),港臺譯名:輝達(dá)),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達(dá),港臺譯名:輝達(dá)),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費(fèi)電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~