作者 | 包永剛
編輯 | 王川
CIPU成武林爭霸焦點的背后,是對下一代云計算標準定義權的爭奪。
暗流涌動的云計算市場,正在醞釀一場“華山論劍”,這場對決的關鍵正是炙手可熱的新型云數據中心專用處理器。
這場對決,氣氛正在變得熱烈,前有英偉達讓DPU(Data Processing Unit)概念一炮而紅,后有英特爾與谷歌合作,祭出IPU(Infrastructure Processing Unit)強勢接招。
本周,阿里云帶著新發(fā)布的CIPU(Cloud infrastructure Processing Units)處理器,以強者的姿態(tài)闖入了云計算3.0時代“華山論劍”的武林大會。
實際上,功能上看,CIPU、DPU、IPU、CIPU大抵相仿,都是為新型云數據中心設計的專用處理器。阿里云認為,未來CIPU將替代CPU成為云計算的管控和加速中心。
同一本武功秘籍,卻生出了三套武功。這場“論劍”的輸贏,絕不止在功夫上見高低。
云計算巨頭們真正在爭奪的,是下一代云計算標準的定義權,成為新時代的“武林盟主”。
阿里云的加入,讓這場武林大會變得更加有趣。
畢竟,中國工程院院士、清華大學鄭緯民教授對阿里云最新發(fā)布的CIPU也贊賞有佳,他認為,“CIPU完全打破上一代計算架構,是在基礎技術上實現了世界領先的云數據中心專用處理器。”
CIPU,將如何打開云計算的新戰(zhàn)場?
阿里云智能總裁張建鋒發(fā)布CIPU
云計算正邁入3.0時代,IPU/DPU/CIPU成新戰(zhàn)場
CIPU、IPU、DPU對于大部分人而言是新概念,但對于全球領先的云服務提供商們,已然成為了必爭之地。
因為,這一全新的處理器已經成為了大型云服務提供商們進入云計算3.0時代的關鍵。
阿里云智能總裁張建鋒認為,過去十多年,云計算技術經歷了兩個發(fā)展階段:第一階段是分布式和虛擬化技術替代了大型機,滿足了當時企業(yè)所需的算力規(guī)模;第二階段出現了資源池化技術,以阿里巴巴為例,通過計算存儲分離架構,將計算、存儲、網絡資源分別池化,突破了規(guī)模和穩(wěn)定性的瓶頸,提供了超大規(guī)模的云計算服務。
“隨著數據密集型計算場景的普及,用戶對低時延、高帶寬的需求也越來越高,傳統(tǒng)以CPU為中心的計算體系架構無法適應這一趨勢。為了解決這一問題,阿里云相關研發(fā)團隊早在2015年就開始技術攻關,不斷深入計算、網絡、存儲核心技術,深入垂直整合,才演進出以CIPU為中心的全新架構形態(tài),云計算開始進入第三階段。” 張建鋒同時表示。
傳統(tǒng)以CPU為中心的云計算架構中,CPU不僅需要承擔計算任務,還要負責邏輯控制,隨著數據密集型計算越來越多,這種架構會導致計算和網絡傳輸的時延大,并且無法提供高帶寬,研發(fā)全新的CIPU//IPU/DPU加速計算芯片,才能滿足越來越多數據密集型計算需求成為了業(yè)界共識,這也成了云計算巨頭們的新戰(zhàn)場。
中科馭數CEO鄢貴海說:“DPU誕生的背景是帶寬與計算性能的增速失調。CPU的性能從5-10年前每年30%的增幅,到三年前大概只有每年不到3%的性能增幅。而網絡帶寬每年依舊還有35%左右的增長。處理性能和帶寬增速的比例從原來的大概1:1,變成了現在的1:10左右。”
大禹智芯CEO李爽指出,“當有10倍以上的差距時,就需要思考新的架構。DPU實際上是架構轉移。”
可以看到,無論是傳統(tǒng)芯片巨頭,還是云服務提供商,還有初創(chuàng)公司,都在近幾年涌入了這一賽道。據雷峰網了解,全球頭部的云服務提供商都在自研DPU。但阿里云自研的CIPU,優(yōu)勢突出。
2、CIPU有何獨特之處?
與CPU和GPU這類通用計算芯片有著顯著區(qū)別,DPU/IPU/CIPU是典型的應用驅動型芯片。既然是應用驅動型芯片,軟硬件的融合以及對應用場景的理解就至關重要。
阿里云虛擬化技術負責人蔣林泉說,“CIPU是我們根據業(yè)務定義的芯片,向上接入飛天云操作系統(tǒng),將全球數百萬臺服務器連成一臺超級計算機,向下對數據中心的計算、存儲、網絡資源快速云化并進行硬件加速。我們自研的CIPU能夠更精準解決云操作系統(tǒng)中管理、控制、調度,以及部分核心業(yè)務加速的問題。”
CIPU架構示意圖
那CIPU是IPU和DPU的綜合體嗎?阿里云技術產品負責人蔣江偉認為,“這種說法對,也不對。如果單拿出一個IPU或者DPU,它沒有類似飛天這樣的操作系統(tǒng),其實沒那么大價值。CIPU天然需要跟云計算操作系統(tǒng)才能產生一個價值。”
多位業(yè)界人士也對雷峰網表示,DPU作為應用驅動的芯片,與云計算服務提供商基礎架構的融合程度是DPU成功的關鍵。實際上,不同的云服務提供商底層軟硬件架構不同,所以外部芯片設計公司設計的DPU/IPU很難與云服務提供商完美適配,像阿里云這樣體量足夠大的云服務提供商自研CIPU優(yōu)勢明顯。
但相比同樣是云服務提供商自研的芯片,比如AWS,阿里云的CIPU又有何獨特之處?
蔣林泉認為:“我們都邁入了類似的新階段,但在不同的市場里,我們看到的風景不太一樣。首先,產品的性能上,CIPU無論是計算、網絡、存儲的性能都遠超其它產品,這是因為國內客戶對性能和性價比的追求非常極致,也與我們對垂直技術棧的深入有關。另一方面,我們與海外云服務提供商面向的客戶也有明顯不同,國外有很多成熟的企業(yè)用戶,而國內有許多中小客戶,他們更需要普惠的服務。”
當然,要證明CIPU在實際應用中帶來的價值,數據是最為直觀的體現。要知道,在擁有CIPU和飛天操作系統(tǒng)的新一代云計算架構體系下,阿里云的計算、網絡、存儲的性能實現了全面飛躍。
計算層面,CIPU能夠快速接入不同類型資源的神龍計算平臺,帶來算力的“0”損耗,以及硬件級安全的加固隔離。
體現在不同的場景中,主流通用計算場景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%。大數據和AI 場景下,AI深度學習場景訓練性能提升30%,Spark計算性能提升30%。
CIPU與網絡的結合,基礎帶寬從100G升級至200G,網絡時延從22us降低至16us,RDMA協(xié)議下更可低至5.5us。
特別值得一提的是,CIPU能夠對高帶寬物理網絡進行硬件加速,通過建設大規(guī)模的eRDMA分布式高性能網絡,讓一般只有在超算里才能使用的“貴族化”技術RDMA在阿里云中普惠化。
CIPU與存儲的結合,對存算分離架構的塊存儲接入進行硬件加速,云盤存儲IOPS最高可達300萬,長尾時延降低50%,全面超越市面上所有云產品,云端能提供比本地更安全可靠且高性能的存儲能力。
CIPU帶來的云計算核心三要素計算、存儲、網絡性能的全面提升,不僅會對云、對數據中心內部產生影響,也會改變傳統(tǒng)計算機終端、以及軟件應用分發(fā)的形態(tài)。同時也意味著,云計算正在進入下一個時代。
阿里云認為,新一代的云計算要從數據中心的內部做體系化創(chuàng)新,從以往的以CPU為中心的體系架構,進入以CIPU為中心的體系架構。
3、CIPU之爭背后,是下一代云計算標準的定義權爭奪
云計算體系架構的變化,也將引發(fā)下一代云計算標準的定義權之爭。過去的經驗告訴我們,只有業(yè)界的佼佼者才能擁有定義標準的權利。
“今天我們可以清晰得看到,阿里云做到了軟硬件完美結合,成為‘飛天+CIPU’支撐的云計算技術體系”,張建鋒說,“阿里云核心技術一直走在世界前列,這個新型體系是技術長征路上的新的里程碑,這個新型的技術體系正在定義下一代云計算架構。”
阿里云有這樣的底氣,關鍵在于過去13年核心技術的自研,構建出了自研芯片、服務器、計算、存儲、網絡等軟硬一體的新型計算體系架構。2003年圖靈獎得主Alan Kay曾說過,只要你是真正認真對待軟件的人,就應該自己做硬件,才能夠獲得差異化的體驗。
操作系統(tǒng)和軟件是離最終用戶最近的產品,只有對它有深刻的認知,才能提供有差異化和有競爭力的產品。
阿里云正是選擇了這樣的自研之路,首先自研了中國唯一的云操作系統(tǒng)——飛天,將遍布全球的上百萬臺服務器連接成一臺超級計算機,單集群可達10萬臺規(guī)模,千億級文件數,EB級別存儲空間。
有了云操作系統(tǒng)飛天,想要進一步提升就需要由上而下,從系統(tǒng)到軟件再到硬件掌握核心技術。這又回到了計算、存儲和網絡三大要素。
在計算層,為了解決服務器長久以來的虛擬化性能損耗的問題,阿里云自主研發(fā)了神龍架構。在存儲層,阿里自研的分布式存儲系統(tǒng)盤古,采用了分布式系統(tǒng)先進的容錯架構和柔性平臺設計,大幅提高了存儲系統(tǒng)的可靠性和安全性。網絡層,阿里云自研的絡神韻網絡支撐起百萬級的用戶業(yè)務部署,讓更多能夠人體驗到云計算帶來的高效便捷服務。
阿里云還通過自研數據庫PolarDB,進一步提升可用性、并發(fā)處理、彈性能力,能夠高效應對“雙11”般的流量洪峰。
在此基礎上,阿里云去年發(fā)布了自研的磐久服務器和龍蜥操作系統(tǒng),磐久服務器采用了最新型的模塊化設計,帶來了服務器交付效率提升50%。龍蜥操作系統(tǒng)性能大幅提升的同時,支持x86、ARM、龍芯(LoongArch)等多種芯片架構和計算場景,也讓阿里云成為全球支持CPU種類最多的云廠商。
去年阿里云發(fā)布的倚天710 CPU,由于是針對云計算設計的產品,更是能夠帶來業(yè)界領先的極致性能。今年發(fā)布的CIPU,是阿里云自然而然的選擇,更是認真對待軟件走向硬件自研的正確路徑。
過去多年的自研,已經讓阿里云站在了云計算領域的山峰。最新發(fā)布的自研產品CIPU,讓阿里云擁有了承接上層飛天操作系統(tǒng)和底層計算、網絡、存儲的最強連接,再一次打破數據中心瓶頸,帶領數據中心從以CPU為中心轉向以CIPU為中心,推動云計算向3.0時代邁進。
在云計算的新階段,阿里云將擁有定義下一代云計算標準的實力,有機會站上全球云計算領域之巔。