亚洲无码福利在线视频,亚洲a∨国产av综合av网站

當(dāng)AI成為整個科技界的主旋律時，算力拉開黃金大幕。

最大GPU提供商英偉達，業(yè)績暴漲，市值屢創(chuàng)新高。就在全世界都矚目英偉達如何繼續(xù)打造GPU帝國時，英偉達CEO黃仁勛卻在剛剛舉辦的GTC 2024上公開表示：“我們要做AI Foundry，就像臺積電在整個半導(dǎo)體供應(yīng)鏈所處的位置一樣，我們要做整個AI產(chǎn)業(yè)的代工廠。”

對標(biāo)臺積電對整個半導(dǎo)體產(chǎn)業(yè)的價值邏輯，來看英偉達對整個AI產(chǎn)業(yè)的布局，這會開啟更廣闊的未來嗎？

AI代工廠：英偉達的新故事

臺積電以芯片代工模式進入全球半導(dǎo)體市場以來，每年以高額資本支出投入研發(fā)和先進制程技術(shù)。2023年，臺積電一舉成為全球營收最高的半導(dǎo)體公司，在它身上，充分展現(xiàn)了芯片代工優(yōu)于對手的顯著優(yōu)勢，以及精準(zhǔn)業(yè)務(wù)模式長期做功的影響力。

再來看黃仁勛的最新定位，英偉達兩萬億的市值新高度，也需要他繼續(xù)引領(lǐng)轉(zhuǎn)型和尋求更大的愿景空間。

在黃仁勛的全球媒體會上，<與非網(wǎng)>就“AI代工廠的長期目標(biāo)和策略”進一步尋求了他的解讀。黃仁勛表示：“AI代工廠的目標(biāo)就是要構(gòu)建軟件AI，而不是把軟件當(dāng)做工具。很久以前，英偉達就創(chuàng)立了兩個重要的軟件，一個是Optics，也就是后來的RTX；另一個是cuDNN，這是一個AI庫。”

黃仁勛提到的這兩款軟件——RTX奠定了英偉達在專業(yè)視覺計算領(lǐng)域的地位，cuDNN（NVIDIA CUDA深度神經(jīng)網(wǎng)絡(luò)庫）則成為深度學(xué)習(xí)研究和框架開發(fā)實現(xiàn)高性能GPU加速的利器。

作為一家GPU芯片起家的硬件公司，英偉達身上的軟件色彩一直很濃厚，多種多樣的庫（library）造就了英偉達在軟件領(lǐng)域的根基。面向未來，黃仁勛又將如何構(gòu)建軟件AI的基礎(chǔ)？

黃仁勛認(rèn)為，“未來的庫應(yīng)該是微服務(wù)（Microservice）。因為未來的庫不僅用數(shù)學(xué)描述，還可以用AI來描述。從命名上，過去的庫是一系列的CU，比如CuLitho、CuDNN等，未來則會是一系列的NIM，它們是使用NVIDIA庫的一種新方法。“

而之所以構(gòu)建微服務(wù)，是因為黃仁勛看到了企業(yè)推理業(yè)務(wù)當(dāng)前的痛點，以及未來的巨大潛力。

眼下有各種各樣的模型：計算機視覺模型、機器人模型以及豐富的開源語言模型等等，這些模型極具開創(chuàng)性，但企業(yè)使用起來有難度：如何將模型部署到自己的應(yīng)用中？模型又該如何封裝和運行？

黃仁勛解釋說：“推理其實是一種復(fù)雜的計算問題，企業(yè)該如何優(yōu)化每一個AI模型？如何充分調(diào)度超級計算機的計算資源？如何才能快速高效地部署這些模型？面對這些問題，我們創(chuàng)造了用收發(fā)請求來進行軟件開發(fā)的新方法。它實質(zhì)上是把軟件都集成到一個容器中，這個容器就是NVIDIA推理微服務(wù)（NIM）?！?/p>

NIM其實是一個經(jīng)過預(yù)訓(xùn)練的AI模型，經(jīng)過封裝和優(yōu)化，可以在龐大的NVIDIA部署環(huán)境中運行。因為模型都是預(yù)訓(xùn)練好的，因此知道什么是合理的輸出。

進一步拆開NIM來看，如下圖，在NVIDIA CUDA的部署環(huán)境中，上層還包括開源模型、合作伙伴專用模型以及英偉達所創(chuàng)建的模型，例如NVIDIA MoIMIM。這些模型封裝在一起，包括對應(yīng)版本的CUDA和cuDNN，支持分布式推理的NVIDIA TensorRT LLM，以及NVIDIA Triton推理服務(wù)器等。它可以根據(jù)實際情況進行優(yōu)化部署，比如是單卡、多卡還是多節(jié)點，最終，都通過簡單易用的API來實現(xiàn)調(diào)用。

“實際上，我們就是一家‘AI代工廠’，正如臺積電為我們制造芯片一樣，我們將為整個行業(yè)代工生產(chǎn)AI“，黃仁勛提出。

他解釋說，作為‘AI代工廠’，英偉達的工作主要有三大塊：第一，發(fā)明AI模型技術(shù)，運行AI模型并對其進行封裝，也就是NIM；第二，提供模型定制開發(fā)工具，NeMo微服務(wù)可以幫助用戶整理和準(zhǔn)備數(shù)據(jù)，以便對AI進行初始訓(xùn)練。第三，提供基礎(chǔ)設(shè)施，便于實現(xiàn)模型的微調(diào)和部署，用戶可以部署在DGX cloud基礎(chǔ)設(shè)施上，也可以部署在本地，或是他們需要的任何地方。

黃仁勛透露，英偉達已經(jīng)在公司內(nèi)部部署了NIM，創(chuàng)建了各個領(lǐng)域的聊天機器人作為工作助理，其中一個最重要的聊天機器人就用于芯片設(shè)計，來幫助英偉達提升芯片設(shè)計的效率。

“這些NIM是超級復(fù)雜的軟件、性能很高。但它具備簡單的API調(diào)用形式，這個API叫做人類。人們可以訪問網(wǎng)站使用，也可以下載到本地電腦、PC，或是在其它云上、工作站、用戶自己的數(shù)據(jù)中心……當(dāng)運行這些庫時，操作系統(tǒng)會進行授權(quán)，授權(quán)費用為4500美元/GPU/年，用戶可以在上面運行任意多的模型”，黃仁勛表示。

事實上，這些微服務(wù)相當(dāng)于為英偉達的全棧計算平臺增添了新的一層，連接起了由模型開發(fā)人員、平臺提供商和企業(yè)組成的AI生態(tài)系統(tǒng)。通過這些微服務(wù)，一方面，企業(yè)可以在自己的平臺上創(chuàng)建和部署定制應(yīng)用，同時保留對知識產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)；另一方面，他們能夠在CUDA環(huán)境中，通過標(biāo)準(zhǔn)化路徑運行優(yōu)化過的定制AI模型。

這就是 “AI代工廠”的精髓：強調(diào)專業(yè)化支持和資源共享、降低產(chǎn)業(yè)門檻、為AI高效率部署提供協(xié)助。

生成式AI驅(qū)動變革，英偉達重視推理

促使黃仁勛從根本上對未來業(yè)務(wù)進行梳理和思考的，根源上看應(yīng)該是數(shù)據(jù)，是生成式AI的到來，使數(shù)據(jù)的產(chǎn)生和流轉(zhuǎn)產(chǎn)生了本質(zhì)的變化。

互聯(lián)網(wǎng)時代，我們查詢或獲取數(shù)據(jù)的方式主要是檢索，即：從數(shù)據(jù)集中檢索數(shù)據(jù)、處理數(shù)據(jù)、然后傳遞數(shù)據(jù)?！拔磥?，越來越多的數(shù)據(jù)將是基于生成的，而不是檢索獲得的。這一切其實已經(jīng)在發(fā)生，我們現(xiàn)在打開手機獲取到的信息，往往已經(jīng)是基于推薦系統(tǒng)、以一種有意義的方式組合、處理后呈現(xiàn)出來的信息，這其中用到了大量計算，是與上下文相關(guān)的、是智能的”，黃仁勛解釋說。

“未來，如果每一個像素、每一次交互都通過生成過程產(chǎn)生，每一次人機交互都是生成式的體驗，那么，這將是一個巨大的機遇“，他說道。

這也就不難理解，為什么在今年的GTC上，“推理”被黃仁勛如此高頻地提及——發(fā)布Blackwell新架構(gòu)時，花了好幾分鐘介紹了它的推理表現(xiàn)；發(fā)布微服務(wù)時，著重介紹了推理微服務(wù)。當(dāng)一家做云端生意的公司，大說特說推理業(yè)務(wù)時，是時代變了，還是時候到了？

對于企業(yè)來說，云端訓(xùn)練是一個燒錢的過程，相當(dāng)于養(yǎng)娃，各種培訓(xùn)、補習(xí)班都是在砸錢。只有云端訓(xùn)練做得差不多了，娃能用學(xué)到的技能開始賺錢了，才能慢慢產(chǎn)生收益。對于AI來說，這就是通過推理業(yè)務(wù)進入市場的過程。

從公開信息來看，Blackwell 在單芯片訓(xùn)練方面的FP8性能是其上一代架構(gòu)的2.5倍，在推理方面的FP4性能是其上一代架構(gòu)的5倍。這使得最新的Blackwell 平臺，具有對萬億參數(shù)大語言模型進行實時生成的能力。

此外，基于Blackwell和NVLink Switch新芯片，英偉達打造了一個多節(jié)點、液冷、機架級系統(tǒng)NVIDIA GB200 NVL72 。它能利用 Blackwell為萬億參數(shù)模型提供強力計算，在單個機架中可實現(xiàn)720 petaflops的AI訓(xùn)練性能和1.4 exaflops的AI推理性能。

同樣以90天訓(xùn)練GPT-MoE-1.8T參數(shù)模型為例，Hopper系統(tǒng)需要8000個GPU，能耗15MW；而Blackwell GB200 NVL72系統(tǒng)，僅需要2000個GPU，能耗4MW，GPU數(shù)量和能耗約是上一代系統(tǒng)的1/4。

相同訓(xùn)練時間下，Blackwell平臺展現(xiàn)了更高能效、可以挑戰(zhàn)極限的能力?！拔覀儽仨毰宄锢順O限，達到極限，并要超越極限，而能源效率和成本效率是首要任務(wù)”，黃仁勛說。

寫在最后

從加速計算先驅(qū)，到推動生成式AI變革，英偉達現(xiàn)在是一家全棧計算基礎(chǔ)設(shè)施公司。

正如黃仁勛在采訪中所強調(diào)，“英偉達的市場機會并不是GPU的機會，而是可以投射到整個數(shù)據(jù)中心的機會，這是每年2500億美元的市場，并以每年20%至25%的速度在增長。我對GPU的思考也不是GPU，而是GPU之外的線纜、機架、交換機……我們不只做GPU芯片，我們做的是數(shù)據(jù)中心需要的一切。”

今年的GTC，也確實呈現(xiàn)出更明確的系統(tǒng)化方向：硬件通過完整的Blackwell平臺面向數(shù)據(jù)中心、超算，軟件方面提供一系列的微服務(wù)。在“推動全球AI基礎(chǔ)設(shè)施大規(guī)模升級”的目標(biāo)之下，“AI代工廠”成為英偉達觸達用戶需求、撬動大規(guī)模市場的關(guān)鍵一步。

就像臺積電當(dāng)年首創(chuàng)Foundry模式，半導(dǎo)體產(chǎn)業(yè)從IDM（集成設(shè)備制造商）逐漸轉(zhuǎn)變?yōu)镕abless（無晶圓廠）模式，半導(dǎo)體設(shè)計進入空前繁榮期，也向更多中小型企業(yè)敞開了大門。生成式AI的未來，也將如此。

“企業(yè)IT行業(yè)正坐在一座‘金礦’上”，黃仁勛說道，“他們擁有多年來創(chuàng)建的工具和數(shù)據(jù)。如果他們能把這個‘金礦’變成 AI 助手，就能給用戶提供更多可能。

器件型號	數(shù)量	器件廠商	器件描述	ECAD模型	參考價格	更多信息
AT89C51RD2-SLSUM	1	Microchip Technology Inc	IC MCU 8BIT 64KB FLASH 44PLCC	ECAD模型下載ECAD模型	$7.41	查看
ATXMEGA128A3U-MH	1	Atmel Corporation	RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, MLF-64		$6.98	查看
ATMEGA328PB-AUR	1	Atmel Corporation	RISC Microcontroller, CMOS,	ECAD模型下載ECAD模型	$2.65	查看

器件型號

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊

ECAD模型

風(fēng)險等級

參考價格

更多信息

AT89C51RD2-SLSUM

Microchip Technology Inc

IC MCU 8BIT 64KB FLASH 44PLCC

$7.41

查看

ATXMEGA128A3U-MH

Atmel Corporation

RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, MLF-64

$6.98

查看

ATMEGA328PB-AUR

Atmel Corporation

RISC Microcontroller, CMOS,

$2.65

查看

黃仁勛：要成為AI界的“臺積電”

AI代工廠：英偉達的新故事

生成式AI驅(qū)動變革，英偉達重視推理

寫在最后

推薦器件

相關(guān)推薦