作者:Arm 首席執(zhí)行官 Rene Haas
人工智能 (AI) 具有超越過去一個(gè)世紀(jì)所發(fā)生的所有變革性創(chuàng)新的潛力,它在醫(yī)療保健、生產(chǎn)力、教育等領(lǐng)域?yàn)樯鐣?huì)帶來的益處將超乎我們的想象。為了運(yùn)行這些復(fù)雜的 AI 工作負(fù)載,全球數(shù)據(jù)中心所需的計(jì)算量需要以指數(shù)級(jí)規(guī)模進(jìn)行擴(kuò)展。然而,這種對(duì)計(jì)算無止盡的需求也揭示了一個(gè)嚴(yán)峻的挑戰(zhàn):數(shù)據(jù)中心需要龐大的電力來驅(qū)動(dòng)AI這一突破性技術(shù)。
當(dāng)今的數(shù)據(jù)中心已經(jīng)消耗了大量的電力——全球每年需要 460 太瓦時(shí) (TWh) 電力進(jìn)行支持,這個(gè)數(shù)字等同于整個(gè)德國(guó)的用電量。而 AI 的興起預(yù)計(jì)將在 2030 年把該數(shù)字提高三倍,意味著將超過印度這一世界上人口最多國(guó)家的總耗電量。
未來的 AI 模型將持續(xù)變得更大、更智能,在帶動(dòng)對(duì)更多計(jì)算能力的需求的同時(shí),對(duì)電力的需求也會(huì)增加,從而成為良性循環(huán)的一部分。而找到降低這些大型數(shù)據(jù)中心電力需求的方法對(duì)于實(shí)現(xiàn)社會(huì)性突破和兌現(xiàn) AI 的承諾至關(guān)重要。
換言之,沒有電力就無法實(shí)現(xiàn) AI,企業(yè)需要重新思考如何應(yīng)對(duì)能效問題的方方面面。
重新構(gòu)思 AI 的未來——一個(gè)由 Arm 平臺(tái)驅(qū)動(dòng)的未來
Arm 最初的產(chǎn)品就是為使用電池的設(shè)備而設(shè)計(jì)的,并推動(dòng)了移動(dòng)電話的變革。因此,深植于 Arm 的能效 DNA能使業(yè)界重新思考應(yīng)如何構(gòu)建芯片來滿足 AI 日益增長(zhǎng)的需求。
在典型的服務(wù)器機(jī)架中,僅計(jì)算芯片就可以消耗超過 50% 的電力預(yù)算。工程團(tuán)隊(duì)正在尋找各種可以降低該數(shù)字的方法,每一瓦特的減少都至關(guān)重要。
正因?yàn)榇耍蜃畲蟮?AI 頭部云服務(wù)提供商們轉(zhuǎn)而采用 Arm 技術(shù)來降低功耗。與同行業(yè)中的其他產(chǎn)品相比,Arm 最新的 Arm Neoverse CPU 是面向云數(shù)據(jù)中心,性能最高、最節(jié)能的處理器。Neoverse 為頭部云服務(wù)提供商提供了定制芯片的靈活性,以優(yōu)化其苛刻的工作負(fù)載,同時(shí)提供領(lǐng)先的性能和能效。每一瓦特的節(jié)省都可以用來實(shí)現(xiàn)更多的計(jì)算。這也正是為什么亞馬遜云服務(wù) (AWS)、微軟、Google 和甲骨文 (Oracle) 現(xiàn)在都通過 Neoverse 技術(shù),處理其通用計(jì)算和基于 CPU 的 AI 推理和訓(xùn)練。Neoverse 平臺(tái)正在成為云數(shù)據(jù)中心領(lǐng)域的事實(shí)標(biāo)準(zhǔn)。
從近期的行業(yè)內(nèi)的發(fā)布來看:
- 基于 Arm 架構(gòu)的 AWS Graviton:與其他同行業(yè)產(chǎn)品相比,Amazon Sagemaker 的 AI 推理性能提高了 25%,Web 應(yīng)用程序提高了 30%,數(shù)據(jù)庫(kù)提高了 40%,效率則提升了 60%。
- 基于 Arm 架構(gòu)的 Google Cloud Axion:與傳統(tǒng)架構(gòu)相比,其性能和能效分別提高了 50% 和 60%,可為基于 CPU 的 AI 推理和訓(xùn)練、YouTube、Google 地球等服務(wù)提供支持。
- 基于 Arm 架構(gòu)的 Microsoft Azure Cobalt:性能高出同類產(chǎn)品 40%,并為 Microsoft Teams 等服務(wù)提供支持,與 Maia 加速器的耦合驅(qū)動(dòng) Azure 的端到端 AI 架構(gòu)。
- Oracle Cloud 采用基于 Arm 架構(gòu)的 Ampere Altra Max:與傳統(tǒng)同類產(chǎn)品相比,每機(jī)架服務(wù)器的性能提高 2.5 倍,能耗降低 2.8 倍,并用于生成式 AI 推理模型,諸如摘要、大語言模型訓(xùn)練的數(shù)據(jù)的標(biāo)記化,以及批量推理用例。
顯然,Neoverse 極大地提升了云端通用計(jì)算的性能和能效。此外,合作伙伴也發(fā)現(xiàn)在加速計(jì)算方面,Neoverse 也能帶來同樣的益處。大規(guī)模 AI 訓(xùn)練需要獨(dú)特的加速計(jì)算架構(gòu),例如,NVIDIA Grace Blackwell 平臺(tái) (GB200) 結(jié)合了 NVIDIA 的 Blackwell GPU 架構(gòu)與基于 Arm 架構(gòu)的 Grace CPU。這種基于 Arm 技術(shù)的計(jì)算架構(gòu)可實(shí)現(xiàn)系統(tǒng)級(jí)設(shè)計(jì)優(yōu)化,與面向大語言模型的 NVIDIA H100 GPU 相比,可帶來 25 倍的能耗降低,并將每個(gè) GPU 的性能提高 30 倍。這些優(yōu)化能夠帶來顛覆性的性能和節(jié)能效果,而這一切都得益于 Neoverse 所帶來的前所未有的芯片定制靈活性。
隨著基于Arm 架構(gòu)的部署持續(xù)擴(kuò)大,這些企業(yè)將可以節(jié)省高達(dá) 15% 的數(shù)據(jù)中心總能耗。這些巨幅的節(jié)省可以用來在相同的功率范圍內(nèi)驅(qū)動(dòng)額外的 AI 運(yùn)算,而不會(huì)增加能源負(fù)擔(dān)。換言之,這些節(jié)能相當(dāng)于可以額外運(yùn)行 20 億次 ChatGPT 查詢,驅(qū)動(dòng)四分之一的日常網(wǎng)絡(luò)搜索流量,為 20% 的美國(guó)家庭提供照明,或?yàn)榕c哥斯達(dá)黎加面積相仿的國(guó)家進(jìn)行供電。這對(duì)改善能源消耗和環(huán)境可持續(xù)性產(chǎn)生了驚人的影響。
Arm CPU 正在從根本上推動(dòng) AI 變革,并造福地球。Arm 架構(gòu)是未來 AI 計(jì)算的基石。