加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

日本得意的CPU+GPU異構(gòu)式超算,在中國早已不新鮮

2017/04/06
22
閱讀需 34 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

 

日前,有媒體發(fā)布了《除了圓珠筆頭,中國還有哪些核心技術(shù)沒掌握?答案令人震驚……》一文,并在網(wǎng)絡(luò)上廣泛傳播。文章中介紹了很多中國在諸多科技領(lǐng)域的短板,說明了在精密儀器、數(shù)控機床等領(lǐng)域中國依然和國際頂尖水平有較大差距。但文章存在一些明顯的謬誤,比如介紹了幾項有關(guān)超算的內(nèi)容,但這幾項技術(shù)卻并非中國還未掌握的核心技術(shù)。


日本在 CPU+GPU 異構(gòu)式超算方面技術(shù)成果非常有限
《除了圓珠筆頭,中國還有哪些核心技術(shù)沒掌握?答案令人震驚……》一文中稱:

“cpu/gpu 異構(gòu)式超算系統(tǒng)的提倡者兼此平臺程序軟件的先驅(qū)開發(fā)者,超級計算機界最高峰學(xué)術(shù)賞 sidney fernbach award 的新科得主——東京工業(yè)大學(xué)全球科學(xué)信息計算中心 prof.satoshi matsuoka;隨著后續(xù)軟體資源的快速配套和并行集群計算技術(shù)的加速發(fā)展,cpu/gpu 異構(gòu)式超算已經(jīng)成為整個 hpc 界的事實標(biāo)準(zhǔn)體系,從最早的 tsubame1.2 到連續(xù) green500 測試頭名的 tsubame-kfc,目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者,matsuoka 博士也因此獲得了象征超級計算機領(lǐng)域個人最高榮譽的 sidney fernbach award”

拋開文章中非常拗口的表達(dá)方式不談,該文章中的內(nèi)容很容易誤導(dǎo)讀者,以為日本在 cpu/gpu 異構(gòu)式超算方面有很高的成就。那么,實際情況又是怎么樣呢?

CPU+GPU 異構(gòu)式超算系統(tǒng)僅僅是異構(gòu)式超算系統(tǒng)的一個選項,而日本 matsuoka 博士是 CPU+GPU 異構(gòu)式超算系統(tǒng)的提倡者,而之后的完善和實現(xiàn)是全球眾多工程師、公司合力的結(jié)果,比如中國國防科大、美國英偉達(dá)公司等都參與其中。

就 CPU+GPU 異構(gòu)式超算的技術(shù)成果來說,中國有天河 1A,美國有泰坦。相比之下,日本在 CPU+GPU 異構(gòu)式超算方面卻沒有性能與泰坦相似的 CPU+GPU 異構(gòu)式超算系統(tǒng),根本沒能建成哪怕一臺性能達(dá)到神威太湖之光十分之一的 cpu/gpu 異構(gòu)式超算。即便是日本最新建的超算 Oakforest-PACS,也使用的是 Intel 的眾核加速器,而非美國英偉達(dá)公司的 GPGPU。


日本新超算 Oakforest-PACS

 


CPU+GPU 異構(gòu)式超算并非高不可攀


異構(gòu)計算要使用不同類型的處理器來處理不同類型的計算任務(wù)。常見的計算單元包括 CPU、GPGPU、GPDSP、ASIC、FPGA 和其它類型的眾核處理器等。采用異構(gòu)計算架構(gòu)的超算會使用至少 2 種類型的處理器,其中異構(gòu)計算架構(gòu)中通用 CPU 負(fù)責(zé)邏輯復(fù)雜的調(diào)度和串行任務(wù),加速器負(fù)責(zé)并行度高的任務(wù),實現(xiàn)計算加速。

具體來說,采用異構(gòu)計算架構(gòu)的超算在運算中既使用處理器,又使用 GPU 或眾核芯片等加速器。中國天河 2 號、美國泰坦都采用異構(gòu)計算架構(gòu)。

而根據(jù)使用的加速器不同,異構(gòu)超算也有多種類型。

比如美國超算泰坦、中國的天河 1A,就是 CPU+GPGPU。

中國超算天河 2 號就是 CPU+眾核處理器。

中國天河 2A 超算則是 CPU+GPDSP。由于美國對中國四家超算中心禁售 Intel 至強 PHI 計算卡,升級之后的天河 2A 采用自主研發(fā)的矩陣 2000 來替代 Intel 的計算卡,在更換加速器之后,變成了 CPU+GPDSP,這是全球首創(chuàng)。

此外,也可以直接使用經(jīng)過有著特殊設(shè)計的眾核芯片,比如神威太湖之光,這也是全球首創(chuàng),國外間諜對中國這款眾核芯片非常感興趣。原因就在于這款眾核芯片憑借設(shè)計理念的先進(jìn)性,以落后美國 Intel 公司 2 代的制造工藝,實現(xiàn)了與美國 Intel 公司最先進(jìn)計算卡相似的性能。

從中可以看出,CPU+GPU 異構(gòu)體系只是異構(gòu)超算體系的一個選項,而非什么高不可攀的黑科技。而且無論是中國天河 2A 的 CPU+GPDSP,還是神威太湖之光的眾核異構(gòu)體系目前都是全球唯一,而且性能無與倫比。

 


文中“目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者”不符合客觀事實
文章中稱:“cpu/gpu 異構(gòu)式超算已經(jīng)成為整個 hpc 界的事實標(biāo)準(zhǔn)體系”,“目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者”。但這與客觀事實不相符。


舉例來說,如上圖所示:2016 年 TOP500 前 10 的超算依次為:

神威太湖之光,中國,性能 93P;

天河 2 號,中國,性能 33P;

泰坦,美國,性能 17P;

紅杉,美國,性能 17P;

科里,美國,性能 14P;

Oakforest-PACS,日本,13P;

京,日本,性能 10P;

代恩特峰,瑞士,性能 9P;

米拉,美國,性能 8P;

三一,美國,性能 8P。

在這當(dāng)中,紅杉、米拉、三一、京都是屬于同構(gòu)體系超算,壓根就不是異構(gòu)體系超算,更遑論 cpu/gpu 異構(gòu)式超算。

而天河 2 號、科里、Oakforest-PACS 采用的是 CPU+眾核加速器,雖然屬于異構(gòu)超算體系,但并非 cpu+gpu 異構(gòu)式超算。

神威太湖之光在技術(shù)上獨樹一幟,將管理核心與加速器合二為一,屬于眾核異構(gòu)超算。

在全球性能最強的 10 臺超算中,只有泰坦和代恩特峰使用了英偉達(dá)的 GPGPU,屬于 cpu/gpu 異構(gòu)式超算。

從中可以看出,“cpu/gpu 異構(gòu)式超算已經(jīng)成為整個 hpc 界的事實標(biāo)準(zhǔn)體系”,“目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者”這種說法是站不住腳的。

過度鼓吹被淘汰技術(shù)并不可取
文章中稱:“NEC 喧布已開發(fā)完成最新型 SX 系列矢量超級計算機——SX-ACE 這臺采用 sun 架構(gòu)的矢量超算雖然其總體運算能力(130TFLOPS)排不進(jìn)世界前 5,但卻具備世界第一的單核性能(64GFLOPS)和世界第一的單核內(nèi)存帶寬(64GB/s),并利用獨到的工業(yè)設(shè)計實現(xiàn)緊湊化與低耗能”。


首先要明確的是,日本比較推崇向量機,SX-ACE 其實是向量機,中國在幾十年前也曾經(jīng)做過,比如已經(jīng)有不少年月的國內(nèi)首臺銀河億次機就是向量機。因而向量機對于中國來說并非什么沒有掌握的技術(shù)。

現(xiàn)在中國不做向量機,并非沒有掌握該技術(shù)而做不了,而是完全是不屑于做。因為這種向量機完全早過時了,完全是被淘汰的設(shè)計,性能低就不說了,還有成本高,應(yīng)用范圍窄的缺點,更要命的是可擴展性也不好。

對于日本的 SX-ACE,國內(nèi)從事高性能計算機的資深工程師表示:這機器現(xiàn)在大概已不存在了吧 ..... 我說大概不存在,主要是目前很少有人再去推崇向量機;第二就是這臺機器的性能參數(shù)并不突出,不值得耗費時間精力去關(guān)注。

最后要補充的是 SX-ACE 很多技術(shù)其實源自美國 SUN 公司,比如其 SPARC 處理器,就是 SUN 公司的遺產(chǎn)。

 


中國在超算技術(shù)上領(lǐng)先日本
在 2011 年,日本超算京曾經(jīng)位列 TOP500 第一。但由于日本經(jīng)濟在廣場協(xié)議之后一直保持在低迷的狀態(tài),加上超算本來就屬于偏向國家工程的項目,相對較少的建造量和昂貴的價格都很難讓私人公司通過超算獲取高額利潤,在研發(fā)成本過于高昂的情況下,使得日本 NEC、日立等大公司先后退出超算研發(fā)領(lǐng)域,唯有富士通還在苦苦支撐。

而在超算研發(fā)經(jīng)費的撥付上,日本政府相當(dāng)吝嗇。而且還曾發(fā)生過這樣一件事——數(shù)位日本科學(xué)家聯(lián)名向政府申請超算研發(fā)經(jīng)費,結(jié)果遭到日本政客反問:“當(dāng)老二有什么不好?”

也正是因此,由于長時間缺乏經(jīng)費,導(dǎo)致日本在超算技術(shù)上缺乏大型工程的磨礪。對于此,日本官方也是心知肚明。在 2016 年,日本文部科學(xué)省發(fā)表了后續(xù)基本設(shè)計方針:“在發(fā)展方針中,日本文部科學(xué)省不再追求世界第一的計算速度,而是將目標(biāo)由加快計算速度轉(zhuǎn)向了加強節(jié)能及便捷功能”。但從曾經(jīng)追求計算性能最強超算,到如今的追求最節(jié)能超算,想必日本從事超算建設(shè)的工程師們心中除了無奈只有苦笑吧。

在美國鹽湖城 SC16 全球超算大會期間召開的第 14 屆 HPC Connection Workshop 中外超算高峰論壇(HPCC)上,日本理化所 Mitsuhisa Sato 透露了日本發(fā)展 E 級超算的“旗艦 2020 計劃”,宣布將在 2017 年 4 月投入運營 Post K 超級計算機,其系統(tǒng)峰值性能約為 25P, 1000P 超算的升級計劃被排到了 2020 年。

不過,技術(shù)發(fā)展有其規(guī)律,是一步一個腳印迭代演進(jìn)的,大躍進(jìn)式一口吃成一個胖子的做法并不可取。而且日本的超算建設(shè)十有八九無法按時完成,舉例來說,如今已將近 2017 年 4 月份了,日本理化所計劃中投入運營的 25P 超算尚無音訊。何況日本最新的 Oakforest-PACS 也只有 13P,從 13P 迅速跨越到 1000P,這中間的技術(shù)擴跨度實在是太大,從處理器到互聯(lián)網(wǎng)絡(luò)都有質(zhì)的飛越,如果不謀求從美國獲取技術(shù),這對于日本來說未必不是一個挑戰(zhàn)。


目前,中國三家單位同時開展了 1000P 超算的原型機研制,并計劃在 2020 年建成 1000P 超算??紤]到中國在過去幾年中在超算上技術(shù)成果斐然,先后研制出曙光 6000、天河 1 號、天河 2 號、神威太湖之光等性能優(yōu)異的超算,中國很有可能領(lǐng)先日本完成 1000P 超算的建設(shè)。

更多最新行業(yè)資訊,歡迎點擊與非網(wǎng)《今日大事要聞》

相關(guān)推薦

電子產(chǎn)業(yè)圖譜