2024 年 8 月,國產(chǎn)游戲《黑神話:悟空》正式開售。作為近期熱度最高的國產(chǎn)游戲,《黑神話》憑借出色的劇情發(fā)展、場景設(shè)計(jì)和配樂成功“出圈”,不僅游戲愛好者們“人手一份”,不少已經(jīng)“戒游戲”的老玩家也選擇趁機(jī)升級(jí)電腦,換張新顯卡好好享受游戲。
盡管這種為了游戲而換顯卡的行為看起來有“沖動(dòng)消費(fèi)”的意思,但回顧近幾年的游戲史,我們不難發(fā)現(xiàn),每次現(xiàn)象級(jí)游戲走火,同時(shí)也有大量玩家為此升級(jí)顯卡。比如用豐富游戲性推動(dòng) GTX 1060 顯卡的《PUBG》和《守望先鋒》,用出色營銷和畫質(zhì)推動(dòng) RTX 時(shí)代的《賽博朋克 2077》,成為 RTX 4060“帶貨王”的《Apex》。可以說每一款成功游戲的背后,都有一張“現(xiàn)象級(jí) N 卡”。
那么問題也隨之而來——英偉達(dá)第一張游戲顯卡面世時(shí),游戲行業(yè)是怎樣的呢?1999 年,英偉達(dá)發(fā)布了其第一張游戲顯卡——GeForce 256。但在 GeForce 256 發(fā)布之前,市場上已經(jīng)存在多個(gè)顯卡(GPU)品牌,如 3dfx 的 Voodoo(巫毒)系列、Matrox(邁創(chuàng))、S3 Graphics、ATI 的 Rage 系列。
和現(xiàn)代的 GPU 一樣,這些 GPU 同樣基于 3D 加速技術(shù),但可惜的是,這些 GPU 產(chǎn)品缺乏統(tǒng)一的 3D 加速制式。這意味著游戲開發(fā)者必須針對(duì)不同顯卡優(yōu)化游戲,顯著增加了開發(fā)成本和難度。此外受產(chǎn)品性能的限制,這些 GPU 也無法支撐復(fù)雜的 3D 游戲。與此同時(shí),《古墓麗影》、《雷神之錘2》、《星際爭霸》等游戲的流行也推動(dòng)了玩家對(duì) 3D 游戲的期望。也就在這時(shí),英偉達(dá) GeForce 256 出現(xiàn)了。
GPU計(jì)算爆發(fā),都有哪些先行者?
GeForce 256 是全球首款被稱為 GPU 的產(chǎn)品,源于其首次將圖形處理的多個(gè)功能集成于單一芯片,這一行為定義了 GPU 這一概念,同時(shí)也將復(fù)雜的 3D 渲染任務(wù)從 CPU 中解放出來,賦予 GPU 專門的計(jì)算職責(zé)。從 GPU 的歷史進(jìn)程來看,這也為后來 GPU 的廣泛應(yīng)用奠定了基礎(chǔ)。
此外,GeForce 256 也將 T&L(Transform & Lighting、變換與光照)硬件加速集成到 GPU 中,使 3D 場景的變換和光照計(jì)算由 GPU 專門負(fù)責(zé)。這是圖形處理史上的重大突破,以前這類計(jì)算任務(wù)通常由 CPU 執(zhí)行,不僅效率低下,而且限制了游戲畫面的表現(xiàn)力。借助 GeForce 256,游戲畫面的復(fù)雜性和細(xì)節(jié)大幅提升,推動(dòng)了 3D 游戲時(shí)代的到來。而且 GeForce 256 出色的性能也將 GPU 這一概念帶到游戲行業(yè)之外。別著急,此時(shí)的英偉達(dá)還沒拿出 CUDA 這種改變 GPU 行業(yè)生態(tài)的大殺器。但 GeForce 256 出色的性能,確實(shí)為 GPU 在科學(xué)計(jì)算、金融分析等領(lǐng)域的應(yīng)用奠定了基礎(chǔ)。如果說 GeForce 256 開啟了 GPU 圖形運(yùn)算的時(shí)代,那英偉達(dá)在 2008 年發(fā)布的 GeForce 8800 GTX,則真正解放了 GPU 的性能。很顯然這張顯卡的性能放在現(xiàn)在早已不值一提,但這張顯卡上,英偉達(dá)提出了 CUDA(統(tǒng)一計(jì)算架構(gòu))這一概念。CUDA 的出現(xiàn)讓 GPU 不僅可以用來處理圖形運(yùn)算,還可以用來執(zhí)行、加速基于 CUDA 的通用計(jì)算,讓電腦成為真正的通用工具。
而在提出了 CUDA 后,英偉達(dá)也在 2018 年進(jìn)一步對(duì) GPU 的算力進(jìn)行細(xì)化,引入了 RT Core、Tensor Core 的概念,讓光線追蹤和專門的 ML 計(jì)算成為可能——Tensor Core 通過高效執(zhí)行大規(guī)模矩陣運(yùn)算,顯著加快了 AI 模型的訓(xùn)練和執(zhí)行速度。根據(jù)英偉達(dá)的介紹,現(xiàn)階段 RTX AI 已經(jīng)對(duì) 10 種不同的 AI 場景實(shí)現(xiàn)覆蓋,包括游戲、影視、自動(dòng)駕駛和科學(xué)計(jì)算等領(lǐng)域。深受英偉達(dá)用戶喜愛、可以顯著提高游戲 FPS 的 DLSS,就基于 Tensor Core 來實(shí)現(xiàn),可以說是廣大游戲玩家最早接觸到的真 AI 用例了。
在影視制作領(lǐng)域,RTX AI 加速渲染速度,使復(fù)雜的光線和反射效果在短時(shí)間內(nèi)完成,從而縮短了制作周期。在自動(dòng)駕駛方面,RTX GPU 處理大量圖像和傳感器數(shù)據(jù),支持實(shí)時(shí)決策,提高車輛的安全性與精準(zhǔn)性。此外,AI 還用于醫(yī)療影像處理、金融預(yù)測和科學(xué)模擬,加速數(shù)據(jù)分析和預(yù)測模型的訓(xùn)練。
不夸張的說,RTX AI 的出現(xiàn)不僅推動(dòng)了高端視覺效果和 AI 計(jì)算的融合,還降低了企業(yè)使用 AI 的門檻。它正逐漸成為各行業(yè)提升效率、創(chuàng)新業(yè)務(wù)的關(guān)鍵引擎,引領(lǐng)未來技術(shù)的發(fā)展潮流。
GPU計(jì)算驅(qū)動(dòng)AI,但AI計(jì)算不全靠GPU
但話說回來,盡管 GPU 的算力提升讓 AI 能以驚人的速度普及,現(xiàn)階段英偉達(dá)確實(shí)是 AI 算力的代名詞,以及個(gè)人 AI 計(jì)算機(jī)的唯一選擇。但這是否意味著美歐強(qiáng)勁 GPU 的設(shè)備,就無緣 AI 時(shí)代呢?
答案是否定的。在 2024 云棲大會(huì)上,阿里集團(tuán) CEO、阿里智能云董事長兼 CEO 吳泳銘表示:
生成式 AI 改變計(jì)算架構(gòu),從 CPU 主導(dǎo)的計(jì)算體系到 GPU 主導(dǎo)的 AI 計(jì)算遷移。AI 時(shí)代將是“GPU 算力為主,CPU 算力為輔”的計(jì)算模式。2024 年市場新增算力,超過 50% 的需求 AI 驅(qū)動(dòng)產(chǎn)生,這一趨勢將持續(xù)擴(kuò)大。
不可否認(rèn),即使是阿里云提供的 AI 云算力,背后也主要由 GPU 驅(qū)動(dòng)。但從另一個(gè)方面想,將 GPU 算力集中在云端,配合設(shè)備本地的 CPU、NPU 進(jìn)行混合 AI 運(yùn)算,其實(shí)也不失為一個(gè)好主意。
首先,這可以緩解算力瓶頸,提升計(jì)算靈活性。GPU 在 AI 計(jì)算中的核心地位毋庸置疑,但個(gè)人開發(fā)者和消費(fèi)者通常難以承受購買和維護(hù)大量 GPU 的成本。將 GPU 算力集中在云端,允許用戶按需租用云 GPU 資源,可以避免一次性高額投入。這種模式也提供了極大的彈性,可根據(jù)任務(wù)需要隨時(shí)擴(kuò)展或縮減算力。
其次,許多終端設(shè)備受限于尺寸和功耗,無法配備高性能 GPU。通過在云端完成復(fù)雜的 AI 運(yùn)算,并將結(jié)果傳輸至本地設(shè)備執(zhí)行簡單任務(wù),設(shè)備可以保持輕量化且功耗低。這種混合計(jì)算模式,特別適合邊緣設(shè)備和移動(dòng)終端。
而且在本地 CPU 和 NPU 的配合下,云 GPU 的計(jì)算能力可以得到最大化利用:設(shè)備本地的 NPU 可以快速處理延遲敏感的任務(wù),如語音識(shí)別和實(shí)時(shí)圖像分析;而復(fù)雜的模型訓(xùn)練和推理則交由云端 GPU 完成。這種模式有效縮短了計(jì)算響應(yīng)時(shí)間,提升了用戶體驗(yàn)。短時(shí)間來看,英偉達(dá)在 AI 算力市場的優(yōu)勢仍然巨大,但是長遠(yuǎn)來看,群狼環(huán)伺之下的 AI 市場,英偉達(dá)雙拳難敵四手。
諸如移動(dòng) PC、智能終端等英偉達(dá)的弱勢市場,很快就會(huì)被其他廠商瓜分干凈,而關(guān)鍵的服務(wù)器市場也并非高枕無憂,AMD 的 MI300 系列 AI 顯卡份額增長迅速,已經(jīng)足夠引起英偉達(dá)的警覺。不過,競爭所帶來的創(chuàng)新與發(fā)展,才是科技進(jìn)步的關(guān)鍵,隨著 AI 領(lǐng)域的競爭加劇,實(shí)際上也在推動(dòng) AI 成本的下降,讓 AI 技術(shù)得到更快、更廣泛的應(yīng)用。就像吳泳銘說的那樣:
AI 驅(qū)動(dòng)的數(shù)字世界連接著具備 AI 能力的物理世界,將會(huì)大幅提升整個(gè)世界的生產(chǎn)力,對(duì)物理世界的運(yùn)行效率產(chǎn)生革命性的影響。
一個(gè)圍繞 AI 而生的新生態(tài),此時(shí)此刻就在我們面前。