算力升維賽打響,阿里亮出新王牌。
在2022云棲大會上,阿里云智能總裁張建鋒宣布,阿里平頭哥自研云原生處理器倚天710已大規(guī)模部署應(yīng)用,成為中國首個云上大規(guī)模落地的自研CPU。
作為阿里首款自研服務(wù)器CPU,倚天710自去年10月推出以來已落地了數(shù)據(jù)庫、大數(shù)據(jù)、視頻編解碼等多個場景。張建鋒說,應(yīng)用倚天710云實例,算力性價比提升超30%,單位算力功耗降低60%,未來兩年20%的新增算力將使用自研CPU。
阿里云智能總裁張建鋒
當(dāng)下,算力成為像水力、電力一樣重要的生產(chǎn)要素,云計算已融入到人們生產(chǎn)生活的方方面面。如何進(jìn)一步提高算力效率以滿足數(shù)字化轉(zhuǎn)型需求?這成為全球科技公司關(guān)注的議題。
芯片、操作系統(tǒng)和上層應(yīng)用的原生融合已是大勢所趨,未來十年,軟硬件一體化的自研技術(shù)體系或?qū)⒊蔀樗懔酝黄频年P(guān)鍵??v觀阿里技術(shù)發(fā)展脈絡(luò),其已從軟件深入到硬件,并涉足技術(shù)門檻極高的通用CPU領(lǐng)域。
在當(dāng)下CPU領(lǐng)域,流片不再稀奇,能規(guī)?;涞氐?ldquo;好用”處理器卻不多。倚天710的規(guī)?;涞?zé)o疑再度刷新互聯(lián)網(wǎng)公司造芯的天花板水平。
那么倚天710是如何在推出一年多快速落地的?這又如何影響阿里乃至算力產(chǎn)業(yè)的發(fā)展道路?本文對此進(jìn)行了深入探討。
自研CPU大規(guī)模落地,性價比提升30%
2022年科技圈的主題是產(chǎn)業(yè)落地,在2022云棲大會現(xiàn)場,關(guān)于倚天710的新消息印證了這一趨勢。
創(chuàng)立于中國廣州的匯量科技是一家營銷SaaS企業(yè),為全球超95個國家客戶提供服務(wù)。匯量科技首席AI官朱小強(qiáng)說:“隨著廣告模型結(jié)構(gòu)不斷升級,在線推理模型請求參數(shù)變多,我們對CPU性能和內(nèi)網(wǎng)帶寬要求更高,倚天710云實例很好地滿足了我們業(yè)務(wù)升級的需求,實現(xiàn)了降本與增效。”據(jù)悉,其在引入倚天710云實例后,CPU性能和內(nèi)網(wǎng)帶寬均實現(xiàn)提升,綜合性價比提升40%以上。
在去年10月的2021阿里云棲大會上,倚天710正式推出,這是阿里第一顆為云而生的CPU,使阿里成為繼亞馬遜、華為后,全球第三家擁有自研Arm服務(wù)器芯片的云計算廠商。
倚天710單片容納高達(dá)600億個晶體管,在全球權(quán)威CPU基準(zhǔn)測試集SPECint2017上,倚天710的分?jǐn)?shù)達(dá)到440,超出業(yè)界標(biāo)桿20%,能效比優(yōu)于業(yè)界標(biāo)桿50%以上,能有效幫助數(shù)據(jù)中心節(jié)能減排。
在倚天710推出不久后的2021年“天貓雙11”,技術(shù)立馬遭遇極限考驗。
眾所周知,“天貓雙11”創(chuàng)造了全社會一年的流量高峰,高并發(fā)對算力的性能、穩(wěn)定性要求極高。阿里將淘寶核心交易系統(tǒng)遷移至基于倚天710的實例,根據(jù)其官方數(shù)據(jù),這一替換使得算力性價比提升了30%。
電商業(yè)務(wù)的應(yīng)用只是一個開始。阿里在全球管理著超過150萬臺服務(wù)器,隨著自研CPU的誕生,其已在阿里數(shù)據(jù)中心規(guī)?;渴穑M(jìn)而支持存儲、數(shù)據(jù)庫、大數(shù)據(jù)、視頻云等多個行業(yè)。
今年,倚天710的落地步伐加快,通過阿里云輸出,倚天710提供的算力也從內(nèi)部走向了外部各行各業(yè)。據(jù)稱,中國一些知名的科學(xué)計算、智能手機(jī)行業(yè)和互聯(lián)網(wǎng)等領(lǐng)域的企業(yè)在遷移至倚天710云實例后,性價比均得到了顯著提升。
這意味著倚天真正成為中國首個云上大規(guī)模應(yīng)用的自研CPU,倚天710不僅能用,而且好用。
攻克落地難題,芯云融合潛力巨大
倚天710的成功絕不輕易。
當(dāng)下,科技企業(yè)涌入硬件創(chuàng)新賽道漸成趨勢,但選擇征戰(zhàn)通用處理器技術(shù)的玩家屈指可數(shù)。
近年來,Arm陣營在英特爾、AMD主導(dǎo)的x86服務(wù)器市場劃開了一道口子。Arm于2018年推出了專為云數(shù)據(jù)中心打造的服務(wù)器處理器,而基于Arm架構(gòu),目前只有亞馬遜等幾家大公司及少數(shù)獨(dú)立CPU公司推出了頂級性能的云端通用處理器。
研發(fā)一顆高性能的通用服務(wù)器芯片本身就極具技術(shù)挑戰(zhàn),但這僅僅是系列挑戰(zhàn)的開始。要真正實現(xiàn)芯片的大規(guī)模應(yīng)用落地,還要克服眾多技術(shù)難題。
在這個過程中,技術(shù)團(tuán)隊需要針對場景做深度優(yōu)化,讓其適配不同的軟件及應(yīng)用生態(tài)。比如,需要提供多語言和多操作系統(tǒng)遷移工具,并且“打樣”最佳實踐,讓用戶愿意嘗試,以最小的工作量完成遷移適配。
阿里技術(shù)團(tuán)隊在操作系統(tǒng)層面做了大量優(yōu)化,完成主流業(yè)務(wù)關(guān)鍵組件的完全適配,用戶進(jìn)行業(yè)務(wù)遷移需要改動的代碼量是——0。
能做到這樣的極致效果,背后是倚天710為云而生的設(shè)計理念。為云而生,當(dāng)然更易被云所用。
云場景經(jīng)常有高并發(fā)、高性能和高能效的算力需求,因此倚天710被設(shè)計成可提供極致物理核性能的處理器,并且通過單個物理核獨(dú)享緩存,有效提升性能穩(wěn)定性和可預(yù)期度,讓使用倚天710云實例的計算服務(wù),能持續(xù)輸出更穩(wěn)定算力。
生于云、用于云,倚天710云實例的大規(guī)模應(yīng)用,證明了阿里所選擇的這條芯云深度融合的算力攻堅之路,走得通,行得遠(yuǎn)。
算力升維賽打響,阿里亮出新王牌
知名行研機(jī)構(gòu)IDC預(yù)測,未來五年全球算力規(guī)模增速將超50%,到2025年整體達(dá)到3300EFlops(每秒33萬億億次浮點運(yùn)算)。
算力需求的爆發(fā),對技術(shù)提出更高挑戰(zhàn)。
回顧現(xiàn)代算力產(chǎn)業(yè)發(fā)展歷程,從大型機(jī)、小型機(jī)、PC、移動終端到云計算,背后,人們對算力的需求也從早期僅需發(fā)個信息,變?yōu)榘l(fā)圖文、看視頻、實時通話等。在可以預(yù)見的未來,自動駕駛、元宇宙、人工智能需求將推動新一波算力升維賽。
算力產(chǎn)業(yè)正進(jìn)入一個軟件定義、硬件加速的新階段。這場算力升維賽,既比拼從底層硬件到上層IaaS、PaaS、SaaS的數(shù)據(jù)傳輸和計算效率,又比拼云與大量和多樣化的邊緣、端側(cè)的協(xié)同融合能力。
面向這一趨勢,從本次阿里云棲大會我們看到,阿里的新王牌,正是“飛天+CIPU+倚天710”驅(qū)動的一個全新的計算體系。
追溯整個體系的起點,還要從2009年飛天的第一行代碼說起。
彼時,國內(nèi)依舊沒有自己的算力系統(tǒng),IOE(IBM小型機(jī)、Oracle數(shù)據(jù)庫、EMC存儲)架構(gòu)下企業(yè)只能不斷擴(kuò)大采購規(guī)模。飛天的誕生讓算力成為一種可在線獲取的資源,分布式替代了傳統(tǒng)集中式架構(gòu),也從而拉開了中國企業(yè)自研云計算的序幕。
2013年,飛天調(diào)度的服務(wù)器數(shù)量突破5000臺大關(guān),標(biāo)志著早期的算力底座正式落成。基于此,阿里云成功應(yīng)對十多年“雙11”和“12306”春運(yùn)購票等極限并發(fā)場景挑戰(zhàn),不斷拓展云計算的性能邊界,連續(xù)多年穩(wěn)居亞太第一、全球前三。
隨著數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,企業(yè)對上云提出了強(qiáng)算力、低時延、高帶寬的新需求,僅靠軟件及系統(tǒng)層面的優(yōu)化已無法滿足。因此,阿里開始深入硬件,從神龍到CIPU,完成系列突破。
CIPU發(fā)布于2021年6月,是為阿里云飛天操作系統(tǒng)設(shè)計的專用處理器。CIPU相當(dāng)于是云計算的CPU,在上面跑的是飛天云操作系統(tǒng),進(jìn)而形成了云上的統(tǒng)一虛擬資源池,并供客戶使用云上算力。無論是分布式應(yīng)用還是AI場景測試中,“CIPU+飛天”都展現(xiàn)出了更優(yōu)越的性能。
今天,倚天710云實例再次升級“CIPU+飛天”,通過芯片、操作系統(tǒng)、計算架構(gòu)以及上層應(yīng)用的協(xié)同優(yōu)化,云計算的整體性能和性價比均得到大幅提升。
算力攻堅13年,阿里已成長為實打?qū)嵉挠部萍脊?。張建鋒說,阿里云將堅持技術(shù)長征,面向下一代體系去構(gòu)建第二技術(shù)曲線,抓住未來技術(shù)的定義權(quán)。