加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 自研CPU大規(guī)模落地,性價比提升30%
    • 攻克落地難題,芯云融合潛力巨大
    • 算力升維賽打響,阿里亮出新王牌
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

阿里自研CPU大規(guī)模應(yīng)用!芯云合體重塑算力體系

2022/11/04
1332
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

算力升維賽打響,阿里亮出新王牌。

在2022云棲大會上,阿里云智能總裁張建鋒宣布,阿里平頭哥自研云原生處理器倚天710已大規(guī)模部署應(yīng)用,成為中國首個云上大規(guī)模落地的自研CPU。

作為阿里首款自研服務(wù)器CPU,倚天710自去年10月推出以來已落地了數(shù)據(jù)庫、大數(shù)據(jù)、視頻編解碼等多個場景。張建鋒說,應(yīng)用倚天710云實例,算力性價比提升超30%,單位算力功耗降低60%,未來兩年20%的新增算力將使用自研CPU。

阿里云智能總裁張建鋒

當(dāng)下,算力成為像水力、電力一樣重要的生產(chǎn)要素,云計算已融入到人們生產(chǎn)生活的方方面面。如何進(jìn)一步提高算力效率以滿足數(shù)字化轉(zhuǎn)型需求?這成為全球科技公司關(guān)注的議題。

芯片、操作系統(tǒng)和上層應(yīng)用的原生融合已是大勢所趨,未來十年,軟硬件一體化的自研技術(shù)體系或?qū)⒊蔀樗懔酝黄频年P(guān)鍵??v觀阿里技術(shù)發(fā)展脈絡(luò),其已從軟件深入到硬件,并涉足技術(shù)門檻極高的通用CPU領(lǐng)域。

在當(dāng)下CPU領(lǐng)域,流片不再稀奇,能規(guī)?;涞氐?ldquo;好用”處理器卻不多。倚天710的規(guī)?;涞?zé)o疑再度刷新互聯(lián)網(wǎng)公司造芯的天花板水平。

那么倚天710是如何在推出一年多快速落地的?這又如何影響阿里乃至算力產(chǎn)業(yè)的發(fā)展道路?本文對此進(jìn)行了深入探討。

自研CPU大規(guī)模落地,性價比提升30%

2022年科技圈的主題是產(chǎn)業(yè)落地,在2022云棲大會現(xiàn)場,關(guān)于倚天710的新消息印證了這一趨勢。

創(chuàng)立于中國廣州的匯量科技是一家營銷SaaS企業(yè),為全球超95個國家客戶提供服務(wù)。匯量科技首席AI官朱小強(qiáng)說:“隨著廣告模型結(jié)構(gòu)不斷升級,在線推理模型請求參數(shù)變多,我們對CPU性能和內(nèi)網(wǎng)帶寬要求更高,倚天710云實例很好地滿足了我們業(yè)務(wù)升級的需求,實現(xiàn)了降本與增效。”據(jù)悉,其在引入倚天710云實例后,CPU性能和內(nèi)網(wǎng)帶寬均實現(xiàn)提升,綜合性價比提升40%以上。

在去年10月的2021阿里云棲大會上,倚天710正式推出,這是阿里第一顆為云而生的CPU,使阿里成為繼亞馬遜、華為后,全球第三家擁有自研Arm服務(wù)器芯片的云計算廠商。
倚天710單片容納高達(dá)600億個晶體管,在全球權(quán)威CPU基準(zhǔn)測試集SPECint2017上,倚天710的分?jǐn)?shù)達(dá)到440,超出業(yè)界標(biāo)桿20%,能效比優(yōu)于業(yè)界標(biāo)桿50%以上,能有效幫助數(shù)據(jù)中心節(jié)能減排。
 

在倚天710推出不久后的2021年“天貓雙11”,技術(shù)立馬遭遇極限考驗。

眾所周知,“天貓雙11”創(chuàng)造了全社會一年的流量高峰,高并發(fā)對算力的性能、穩(wěn)定性要求極高。阿里將淘寶核心交易系統(tǒng)遷移至基于倚天710的實例,根據(jù)其官方數(shù)據(jù),這一替換使得算力性價比提升了30%。

電商業(yè)務(wù)的應(yīng)用只是一個開始。阿里在全球管理著超過150萬臺服務(wù)器,隨著自研CPU的誕生,其已在阿里數(shù)據(jù)中心規(guī)?;渴穑M(jìn)而支持存儲、數(shù)據(jù)庫、大數(shù)據(jù)、視頻云等多個行業(yè)。

今年,倚天710的落地步伐加快,通過阿里云輸出,倚天710提供的算力也從內(nèi)部走向了外部各行各業(yè)。據(jù)稱,中國一些知名的科學(xué)計算、智能手機(jī)行業(yè)和互聯(lián)網(wǎng)等領(lǐng)域的企業(yè)在遷移至倚天710云實例后,性價比均得到了顯著提升。

這意味著倚天真正成為中國首個云上大規(guī)模應(yīng)用的自研CPU,倚天710不僅能用,而且好用。

攻克落地難題,芯云融合潛力巨大

倚天710的成功絕不輕易。

當(dāng)下,科技企業(yè)涌入硬件創(chuàng)新賽道漸成趨勢,但選擇征戰(zhàn)通用處理器技術(shù)的玩家屈指可數(shù)。

近年來,Arm陣營在英特爾AMD主導(dǎo)的x86服務(wù)器市場劃開了一道口子。Arm于2018年推出了專為云數(shù)據(jù)中心打造的服務(wù)器處理器,而基于Arm架構(gòu),目前只有亞馬遜等幾家大公司及少數(shù)獨(dú)立CPU公司推出了頂級性能的云端通用處理器。

研發(fā)一顆高性能的通用服務(wù)器芯片本身就極具技術(shù)挑戰(zhàn),但這僅僅是系列挑戰(zhàn)的開始。要真正實現(xiàn)芯片的大規(guī)模應(yīng)用落地,還要克服眾多技術(shù)難題。

在這個過程中,技術(shù)團(tuán)隊需要針對場景做深度優(yōu)化,讓其適配不同的軟件及應(yīng)用生態(tài)。比如,需要提供多語言和多操作系統(tǒng)遷移工具,并且“打樣”最佳實踐,讓用戶愿意嘗試,以最小的工作量完成遷移適配。

阿里技術(shù)團(tuán)隊在操作系統(tǒng)層面做了大量優(yōu)化,完成主流業(yè)務(wù)關(guān)鍵組件的完全適配,用戶進(jìn)行業(yè)務(wù)遷移需要改動的代碼量是——0。

能做到這樣的極致效果,背后是倚天710為云而生的設(shè)計理念。為云而生,當(dāng)然更易被云所用。

云場景經(jīng)常有高并發(fā)、高性能和高能效的算力需求,因此倚天710被設(shè)計成可提供極致物理核性能的處理器,并且通過單個物理核獨(dú)享緩存,有效提升性能穩(wěn)定性和可預(yù)期度,讓使用倚天710云實例的計算服務(wù),能持續(xù)輸出更穩(wěn)定算力。

生于云、用于云,倚天710云實例的大規(guī)模應(yīng)用,證明了阿里所選擇的這條芯云深度融合的算力攻堅之路,走得通,行得遠(yuǎn)。
 

算力升維賽打響,阿里亮出新王牌

知名行研機(jī)構(gòu)IDC預(yù)測,未來五年全球算力規(guī)模增速將超50%,到2025年整體達(dá)到3300EFlops(每秒33萬億億次浮點運(yùn)算)。

算力需求的爆發(fā),對技術(shù)提出更高挑戰(zhàn)。

回顧現(xiàn)代算力產(chǎn)業(yè)發(fā)展歷程,從大型機(jī)、小型機(jī)、PC、移動終端到云計算,背后,人們對算力的需求也從早期僅需發(fā)個信息,變?yōu)榘l(fā)圖文、看視頻、實時通話等。在可以預(yù)見的未來,自動駕駛、元宇宙、人工智能需求將推動新一波算力升維賽。

算力產(chǎn)業(yè)正進(jìn)入一個軟件定義、硬件加速的新階段。這場算力升維賽,既比拼從底層硬件到上層IaaS、PaaS、SaaS的數(shù)據(jù)傳輸和計算效率,又比拼云與大量和多樣化的邊緣、端側(cè)的協(xié)同融合能力。

面向這一趨勢,從本次阿里云棲大會我們看到,阿里的新王牌,正是“飛天+CIPU+倚天710”驅(qū)動的一個全新的計算體系。
 

追溯整個體系的起點,還要從2009年飛天的第一行代碼說起。

彼時,國內(nèi)依舊沒有自己的算力系統(tǒng),IOE(IBM小型機(jī)、Oracle數(shù)據(jù)庫、EMC存儲)架構(gòu)下企業(yè)只能不斷擴(kuò)大采購規(guī)模。飛天的誕生讓算力成為一種可在線獲取的資源,分布式替代了傳統(tǒng)集中式架構(gòu),也從而拉開了中國企業(yè)自研云計算的序幕。

2013年,飛天調(diào)度的服務(wù)器數(shù)量突破5000臺大關(guān),標(biāo)志著早期的算力底座正式落成。基于此,阿里云成功應(yīng)對十多年“雙11”和“12306”春運(yùn)購票等極限并發(fā)場景挑戰(zhàn),不斷拓展云計算的性能邊界,連續(xù)多年穩(wěn)居亞太第一、全球前三。

隨著數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,企業(yè)對上云提出了強(qiáng)算力、低時延、高帶寬的新需求,僅靠軟件及系統(tǒng)層面的優(yōu)化已無法滿足。因此,阿里開始深入硬件,從神龍到CIPU,完成系列突破。

CIPU發(fā)布于2021年6月,是為阿里云飛天操作系統(tǒng)設(shè)計的專用處理器。CIPU相當(dāng)于是云計算的CPU,在上面跑的是飛天云操作系統(tǒng),進(jìn)而形成了云上的統(tǒng)一虛擬資源池,并供客戶使用云上算力。無論是分布式應(yīng)用還是AI場景測試中,“CIPU+飛天”都展現(xiàn)出了更優(yōu)越的性能。

今天,倚天710云實例再次升級“CIPU+飛天”,通過芯片、操作系統(tǒng)、計算架構(gòu)以及上層應(yīng)用的協(xié)同優(yōu)化,云計算的整體性能和性價比均得到大幅提升。

算力攻堅13年,阿里已成長為實打?qū)嵉挠部萍脊?。張建鋒說,阿里云將堅持技術(shù)長征,面向下一代體系去構(gòu)建第二技術(shù)曲線,抓住未來技術(shù)的定義權(quán)。

平頭哥

平頭哥

平頭哥半導(dǎo)體有限公司于2018年9月宣布成立,是阿里巴巴集團(tuán)的全資半導(dǎo)體芯片業(yè)務(wù)主體。平頭哥擁有端云一體全棧產(chǎn)品系列,涵蓋數(shù)據(jù)中心人工智能芯片、處理器IP授權(quán)等,實現(xiàn)芯片端到端設(shè)計鏈路全覆蓋。

平頭哥半導(dǎo)體有限公司于2018年9月宣布成立,是阿里巴巴集團(tuán)的全資半導(dǎo)體芯片業(yè)務(wù)主體。平頭哥擁有端云一體全棧產(chǎn)品系列,涵蓋數(shù)據(jù)中心人工智能芯片、處理器IP授權(quán)等,實現(xiàn)芯片端到端設(shè)計鏈路全覆蓋。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜