作者 | 方文三
在游戲產(chǎn)業(yè)中,存在一種明確的等級(jí)劃分:移動(dòng)游戲處于最底層,網(wǎng)絡(luò)在線游戲位于中間位置,而主機(jī)游戲則處于最高級(jí)別。
當(dāng)前,在人工智能的浪潮推動(dòng)下,曾經(jīng)作為輔助戰(zhàn)場的GPU,已經(jīng)轉(zhuǎn)變成為主要戰(zhàn)場。
《黑神話》帶飛整個(gè)換機(jī)潮
據(jù)京東官方數(shù)據(jù),8月20日,《悟空》游戲正式推出之日,搭載英偉達(dá)40系顯卡的游戲筆記本電腦銷售額同比實(shí)現(xiàn)了100%的增長;
電腦組件整體品類銷售額同比提升了120%,其中顯卡品類銷售額同比激增200%,而組裝機(jī)品類銷售額同比增幅超過了150%。
尤其是高端型號(hào)如RTX 4070及以上的產(chǎn)品供不應(yīng)求,甚至 RTX 4060 Ti和4060系列的銷售也有明顯增長。
這一現(xiàn)象不僅刺激了個(gè)人玩家對(duì)顯卡的升級(jí)需求,還帶動(dòng)了商業(yè)場所如網(wǎng)吧等的硬件升級(jí)。
根據(jù)部分網(wǎng)絡(luò)用戶的意見以及官方先前提供的測試工具分析,眾多玩家在顯卡方面遭遇了挑戰(zhàn),許多舊款英偉達(dá)和AMD顯卡均出現(xiàn)了崩潰現(xiàn)象。
若期望以高幀率順暢體驗(yàn)游戲,似乎唯有更換顯卡,從而引發(fā)新一輪的設(shè)備更新浪潮。
顯而易見,顯卡的問世并不僅僅是為了游戲,然而游戲無疑是推動(dòng)顯卡技術(shù)進(jìn)步的主要力量。
作為顯卡核心的GPU芯片,自然也將與這一現(xiàn)象產(chǎn)生緊密的聯(lián)系。
GPU技術(shù)推動(dòng)游戲性能革新
作為圖形處理的核心硬件,GPU在推動(dòng)游戲產(chǎn)業(yè)持續(xù)創(chuàng)新方面扮演著至關(guān)重要的角色。
從最初的像素游戲到現(xiàn)今的3A級(jí)大作,GPU技術(shù)的每一次飛躍均引發(fā)了游戲畫面與玩法的革命性變革。
英偉達(dá)全景光追和DLSS3技術(shù)的應(yīng)用,讓游戲的圖形表現(xiàn)和性能體驗(yàn)達(dá)到了前所未有的高度。
英偉達(dá)官方表示,幾乎所有GeForce RTX 40系列GPU的幀率都超過60FPS并支持全景光線追蹤技術(shù),同時(shí)借助DLSS 3,所有其他選項(xiàng)都可以獲得提升。
對(duì)于GeForce RTX 4060,可以通過調(diào)整一些設(shè)置或使用NVIDIA app的一鍵設(shè)置優(yōu)化,可以獲得60FPS的幀率。
此外,黑悟空背后的圖形引擎技術(shù)功不可沒,主要得益于英偉達(dá)和虛幻5引擎的貢獻(xiàn)。
它展現(xiàn)了極為復(fù)雜的場景細(xì)節(jié),在虛幻5技術(shù)的加持下,場景復(fù)雜度從傳統(tǒng)的數(shù)千萬級(jí)別多邊形數(shù)量提升至數(shù)億級(jí)別。
特別是UE5中首次推出的Lumen和Nanite技術(shù),為游戲場景帶來了逼真的光影效果和復(fù)雜的場景細(xì)節(jié)。
黑神話熱潮下國產(chǎn)GPU也暴露出現(xiàn)存問題
在性能方面,與國際大廠如英偉達(dá)相比,國產(chǎn)GPU仍存在一定差距。
以摩爾線程的 MTT S80 為例,雖然硬件規(guī)格上與RTX 3060相當(dāng),但軟件層面的缺陷限制了其性能發(fā)揮,在一些關(guān)鍵的游戲特性上也無法支持。
自《黑神話》服務(wù)器開啟以來,眾多玩家反映游戲啟動(dòng)后遭遇黑屏和程序崩潰的問題。
值得慶幸的是,摩爾線程發(fā)布了v270.80版本的驅(qū)動(dòng)程序,玩家目前能夠在較低的圖像設(shè)置下確保游戲的基本運(yùn)行。
在此之前,摩爾線程已經(jīng)實(shí)施了十余次關(guān)鍵的驅(qū)動(dòng)更新,逐步釋放了其3D圖形處理能力。
然而,在一些核心游戲功能方面,摩爾線程所采用的MUSA架構(gòu)尚未能提供支持。
GPU突圍之路還得靠自己
國產(chǎn)GPU領(lǐng)域,國內(nèi)企業(yè)正以迅猛的速度發(fā)展,并在若干關(guān)鍵領(lǐng)域逐漸取代進(jìn)口產(chǎn)品。
在服務(wù)器、人工智能、消費(fèi)電子產(chǎn)品等市場,華為、昆侖芯、沐曦、景嘉微等國內(nèi)廠商推出的專用或通用GPU產(chǎn)品已贏得眾多重要客戶。
摩爾線程公司更是直接進(jìn)軍桌面GPU市場,期望通過消費(fèi)級(jí)顯卡開拓新的市場空間。
盡管面臨英偉達(dá)、AMD、英特爾三大行業(yè)巨頭的市場主導(dǎo)地位,國產(chǎn)GPU制造商長期扮演著替代品的角色。
由于起步較晚、核心知識(shí)產(chǎn)權(quán)差距較大以及需要巨額資金投入,國產(chǎn)GPU在初始階段普遍選擇兼容現(xiàn)有生態(tài)系統(tǒng),缺乏獨(dú)立的核心技術(shù)。
今年三月,英偉達(dá)發(fā)布了限制性政策,禁止通過轉(zhuǎn)譯層在非英偉達(dá)GPU上運(yùn)行CUDA軟件。
這一舉措對(duì)國內(nèi)部分GPU制造商無疑構(gòu)成了不利影響。
在美國的指示下,英偉達(dá)與AMD被迫停止向中國供應(yīng)A100和H100等高端GPU型號(hào),轉(zhuǎn)而提供專為中國市場設(shè)計(jì)的H20等產(chǎn)品。
相較于原版產(chǎn)品,所謂的“特供版”在性能上顯得較為遜色。
在一些科技媒體的性能評(píng)估中,H20的總體計(jì)算能力僅相當(dāng)于H100的20%。
此外,由于額外的硬件配置,其計(jì)算能力的成本也有所增加。
在缺乏自主生態(tài)系統(tǒng)的情況下,國內(nèi)GPU制造商想要進(jìn)軍高端市場仍然面臨巨大挑戰(zhàn)。
審視國內(nèi)現(xiàn)狀,國產(chǎn)游戲引擎在3A級(jí)游戲領(lǐng)域與國際知名引擎如Unity3D、UE5等競爭尚存差距,國產(chǎn)引擎主要在移動(dòng)端、Web端等輕量級(jí)游戲娛樂領(lǐng)域?qū)さ冒l(fā)展契機(jī)。
若國產(chǎn)引擎無法在潛力巨大的游戲產(chǎn)業(yè)中占據(jù)一席之地,鑒于其需要長期且高額的研發(fā)投入,將面臨諸多挑戰(zhàn)。
因此,擁有高校背景的研發(fā)團(tuán)隊(duì)在持續(xù)的技術(shù)研發(fā)方面可能享有更多優(yōu)勢。
建立生態(tài)體系將事關(guān)重要
隨著AI領(lǐng)域大型模型在2023年的突破性進(jìn)展,作為這些模型核心推動(dòng)力的GPU需求激增。英偉達(dá)公司因此在2023年實(shí)現(xiàn)了125%的收入增長;
而2024年第一季度的財(cái)報(bào)顯示,其收入增長更是達(dá)到了262%,以驚人的速度將其他芯片制造商遠(yuǎn)遠(yuǎn)拋在身后。
以英偉達(dá)的CUDA生態(tài)系統(tǒng)為例,它被廣泛認(rèn)為是公司的核心競爭優(yōu)勢之一。
以說,若無CUDA,許多程序員將難以在GPU硬件平臺(tái)上進(jìn)行開發(fā)工作。其軟件生態(tài)系統(tǒng)已經(jīng)深入影響到人工智能、科學(xué)研究等多個(gè)領(lǐng)域。
試圖繞過英偉達(dá)構(gòu)建的生態(tài)系統(tǒng),可能會(huì)導(dǎo)致即便擁有大量GPU卡,也只能發(fā)揮出有限的計(jì)算能力,面臨性能瓶頸。
此外,在編程開發(fā)過程中,可能會(huì)遇到缺乏適當(dāng)應(yīng)用開發(fā)工具的困境。
因此,在當(dāng)前形勢下,我們的首要任務(wù)并非立即與英偉達(dá)展開競爭,而是應(yīng)利用市場環(huán)境和中國市場的特點(diǎn),優(yōu)先構(gòu)建起大型模型的市場基礎(chǔ)。
然而,當(dāng)前國內(nèi)制造商普遍遭遇相似的挑戰(zhàn):系統(tǒng)架構(gòu)整體布局不足,軟件生態(tài)系統(tǒng)脆弱,市場影響力有限。
盡管在個(gè)別領(lǐng)域取得了一定進(jìn)展,但在整體戰(zhàn)略上,難以構(gòu)成對(duì)英偉達(dá)的真正威脅。
各制造商都在自己的領(lǐng)域內(nèi)努力開拓,但彼此之間缺乏協(xié)作與整合。
因此,盡管在某些技術(shù)參數(shù)上可能超越了英偉達(dá),但在全面體系的競爭中,仍然無法形成有效的合力。最令人憂慮的是技術(shù)生態(tài)的碎片化現(xiàn)象。
由于缺乏統(tǒng)一的開發(fā)平臺(tái)和標(biāo)準(zhǔn),國內(nèi)技術(shù)生態(tài)宛如一幅拼湊的拼圖,開發(fā)者在使用國產(chǎn)GPU時(shí),面臨的兼容性問題和學(xué)習(xí)成本均顯著增加。
國內(nèi)GPU正加速發(fā)展中
中國GPU市場規(guī)模持續(xù)擴(kuò)大,自2020年至2023年,市場規(guī)模從345億元增長至457億元、608億元,進(jìn)而達(dá)到807億元,年均增長率約為33%。
預(yù)計(jì)至2024年,市場規(guī)模將進(jìn)一步增至1073億元。
鴻蒙操作系統(tǒng)的成功,不僅得益于政策的扶持,更關(guān)鍵的是它恰好迎合了從移動(dòng)設(shè)備向物聯(lián)網(wǎng)技術(shù)轉(zhuǎn)型的變革時(shí)期。
當(dāng)前,GPU行業(yè)也正經(jīng)歷類似的變革期,大型模型的興起正在重塑整個(gè)產(chǎn)業(yè)格局,為中國企業(yè)提供了必須把握的機(jī)遇。
盡管國際品牌在市場上占據(jù)主導(dǎo)地位,但近年來,國產(chǎn)GPU也取得了顯著的進(jìn)步。
例如,上海武桐樹高新技術(shù)有限公司推出了WT-X201、WT-X202、WT-X205等國產(chǎn)GPU產(chǎn)品,并依托上海武創(chuàng)大智高新技術(shù)集團(tuán)的全方位產(chǎn)業(yè)生態(tài)體系,為客戶提供更優(yōu)質(zhì)的服務(wù)平臺(tái)。
景嘉微在軍工領(lǐng)域取得了一定成就,芯動(dòng)科技專注于高性能GPU的研發(fā),壁仞科技主要致力于人工智能推理和訓(xùn)練,而摩爾線程則專注于圖形處理器的開發(fā)。
該智算中心作為全國型N節(jié)點(diǎn)萬卡訓(xùn)練場,其單體算力達(dá)到6.7EFLOPS(FP16),這也驗(yàn)證了壁仞科技宣稱的產(chǎn)品能夠適用于千卡集群建設(shè)方案,并且能夠擴(kuò)展至萬卡規(guī)模的互聯(lián)技術(shù)的實(shí)施能力。
摩爾線程針對(duì)其AI旗艦產(chǎn)品夸娥(KUAE),推出了一整套解決方案,包括夸娥集群管理平臺(tái)和夸娥大模型服務(wù)平臺(tái)。
這些解決方案旨在解決萬卡數(shù)據(jù)中心在大量算力卡高速互聯(lián)的同時(shí),如何保持穩(wěn)定運(yùn)行以及高效計(jì)算資源調(diào)配的問題。
同時(shí),摩爾線程也成功簽約了青海零碳產(chǎn)業(yè)園萬卡集群項(xiàng)目、青海高原夸娥萬卡集群項(xiàng)目、廣西東盟萬卡集群項(xiàng)目。
燧原科技與智譜AI合作推出了大模型編程助手一體機(jī),基于云燧i20推理加速卡,為軟件開發(fā)企業(yè)提供一系列人工智能生成內(nèi)容(AIGC)功能。
沐曦科技利用其曦思N100,與眸瑞科技聯(lián)合發(fā)布了首個(gè)AI模型“貼圖超分”技術(shù)。
目前,摩爾線程構(gòu)建了MUSA生態(tài),以兼容CUDA,并提供幾乎所有組件與CUDA的對(duì)應(yīng)關(guān)系。
壁仞科技的BIRENSUPA平臺(tái)、沐曦科技的MXMACA平臺(tái)也都在通過兼容性來削弱英偉達(dá)CUDA的市場主導(dǎo)地位,并且通過開源方式吸引開發(fā)者參與,共同構(gòu)建生態(tài)系統(tǒng)。
結(jié)尾:
唯有激發(fā)更多包括3A級(jí)單機(jī)游戲在內(nèi)的GPU應(yīng)用場景和市場,方能為GPU的研發(fā)及技術(shù)突破注入更多資金與技術(shù)人才,而不僅僅依賴于大型人工模型。
產(chǎn)業(yè)發(fā)展的挑戰(zhàn)在于如何協(xié)調(diào)外部力量與內(nèi)部動(dòng)力、成本與創(chuàng)新、自主性與全球化之間的關(guān)系。
這是一條需要不斷審視策略、如同在獨(dú)木橋上保持平衡的路徑,然而,這也是通往對(duì)岸的唯一可行之路。
部分資料參考:中國電子報(bào):《黑神話:悟空》爆火,GPU接住這“潑天”的流量了么?,鎂客網(wǎng):國產(chǎn)GPU,需要一部“黑神話”,武桐樹:《黑神話:悟空》背后的力量——頂尖GPU如何重塑西游世界的視覺盛宴,水熊優(yōu)保:黑神話悟空出圈爆火,背后的真相你想不到,黃金時(shí)代2035:《黑神話:悟空》與國產(chǎn)顯示GPU五小龍,天天IC:《黑神話:悟空》揭了GPU的老底,topcpu:摩爾線程發(fā)布新驅(qū)動(dòng),黑神話悟空表現(xiàn)提高了3倍,數(shù)據(jù)猿:國產(chǎn)GPU廠商要如何殺出一條血路?,鋅財(cái)經(jīng):喧囂背后,國產(chǎn)GPU距離“平替”英偉達(dá)還有多遠(yuǎn)?