近日,中國(guó)自主研發(fā)的超級(jí)計(jì)算機(jī)“神威·太湖之光”在 2017 國(guó)際高性能計(jì)算大會(huì)上再次蟬聯(lián)世界超算冠軍,拿下了中國(guó)國(guó)產(chǎn)超算系統(tǒng)在世界計(jì)算機(jī)冠軍寶座上的首個(gè)三連冠,再加上之前天河二號(hào)六次奪冠的輝煌歷史,中國(guó)超算在世界舞臺(tái)十分耀眼。
但是,聚光燈下的超算雖然“跑”得快、性能好,在應(yīng)用上卻有短板。
“借船出海”不是常勝之策
在“神威·太湖之光”橫空出世之前,中國(guó)超算天河二號(hào)曾是世界高性能計(jì)算領(lǐng)域的“霸主”。它六次問鼎世界 TOP500,廣泛應(yīng)用于天氣氣候、生物醫(yī)藥、新材料等科研領(lǐng)域。但卻也遭受“詬病”,天河系列的處理器來自美國(guó)——天河一號(hào)是英特爾的 CPU 加上英偉達(dá)的 GPU;天河二號(hào)是英特爾的 GPU 加上英特爾的眾核處理器。
“買來的芯片技術(shù)成熟、作用發(fā)揮快,雖不失為一種發(fā)展的策略,但是技術(shù)的自主可控?zé)o法實(shí)現(xiàn)。”清華大學(xué)計(jì)算機(jī)系博士后甘霖 7 月 28 日在接受科技日?qǐng)?bào)記者采訪時(shí)表示,2015 年美國(guó)宣布對(duì)華核心處理器禁運(yùn)的一系列措施也直接導(dǎo)致天河系里的發(fā)展受阻。
“天河二號(hào)通過‘借船出海’超越美國(guó)的泰坦等超級(jí)計(jì)算機(jī),但是在涉及國(guó)防安全等關(guān)鍵領(lǐng)域,國(guó)家對(duì)自主可控已經(jīng)提出明確的要求。”甘霖表示,關(guān)鍵技術(shù)受制于人,雖然可以“師夷長(zhǎng)技”,卻在應(yīng)用層面大打折扣。
中國(guó)芯讓超算絕地“反擊”
中國(guó)超算在“神威·太湖之光”問鼎世界后為何備受振奮?背后的原因是,面對(duì)美國(guó)禁售的單方“制裁”,中國(guó)超算全面采用自主研制的中國(guó)芯——“申威 26010”異構(gòu)眾核處理器實(shí)現(xiàn)絕地“反擊”,公眾的認(rèn)識(shí)也從“單純以速度取勝”轉(zhuǎn)化為“自主可控、峰值速度、持續(xù)性能、綠色指標(biāo)、應(yīng)用等方面實(shí)現(xiàn)了全面突破”。
國(guó)家計(jì)算流體力學(xué)實(shí)驗(yàn)室利用基于“神威·太湖之光”開發(fā)的“航天飛行器統(tǒng)一算法數(shù)值模擬”軟件,完成了多組天宮一號(hào)飛行器隕落飛行狀態(tài)的大規(guī)模并行計(jì)算。使用 16384 個(gè)處理器(太湖之光整機(jī)的 1/8)在 20 天內(nèi)完成常規(guī)需要 12 個(gè)月的計(jì)算任務(wù),計(jì)算結(jié)果與風(fēng)洞實(shí)驗(yàn)結(jié)果符合較好。而且,與航天領(lǐng)域息息相關(guān)的材料學(xué)也需要通過模擬計(jì)算哪些元素的加入能達(dá)到最有效果。
現(xiàn)在,太湖之光的峰值運(yùn)算性能達(dá)到每秒 12.54 億億次。這意味著,太湖之光 1 分鐘的計(jì)算能力,相當(dāng)于全球 72 億人同時(shí)用計(jì)算器不間斷計(jì)算 32 年。顯然,中國(guó)超算的硬件能力并非“徒有虛名”,那么,如此超強(qiáng)的能力究竟有沒有用武之地?
“中層斷檔”限制應(yīng)用擴(kuò)增
2016 年,在太湖之光上“奔跑”著的一個(gè)應(yīng)用項(xiàng)目獲得“戈登·貝爾”獎(jiǎng),實(shí)現(xiàn)了我國(guó)在世界高性能應(yīng)用領(lǐng)域 29 年來零的突破。
該項(xiàng)目“千萬核可擴(kuò)展全球大氣動(dòng)力學(xué)全隱式模擬”是使用了超過一千萬個(gè)核來完成一次氣候的數(shù)值仿真。其特殊之處在于算法——一個(gè)新的“全隱式”計(jì)算方法,這個(gè)算法的計(jì)算效率比當(dāng)前國(guó)際上同類問題最高水平提升了近一個(gè)數(shù)量級(jí)。“戈登·貝爾”獲獎(jiǎng)團(tuán)隊(duì)負(fù)責(zé)人、中科院軟件所研究員楊超曾表示,算法和性能是團(tuán)隊(duì)獲獎(jiǎng)的主要原因。
高性能計(jì)算實(shí)現(xiàn)應(yīng)用的落地絕非超級(jí)計(jì)算機(jī)的一己之力就能完成。它更像是一個(gè)鏈條,由中間層的軟件串聯(lián)起上游的應(yīng)用場(chǎng)景和下游的機(jī)器硬件。清華大學(xué)教授、國(guó)家超級(jí)計(jì)算無錫中心主任楊廣文在接受科技日?qǐng)?bào)記者采訪時(shí)表示,從事計(jì)算機(jī)研究的人因?yàn)椴皇煜?yīng)用而設(shè)計(jì)不出更好的算法及應(yīng)用軟件,而做軟件應(yīng)用的人因?yàn)榍啡庇?jì)算機(jī)能力而造不出高質(zhì)量的軟件……即便技術(shù)成熟、需求旺盛,只要軟件缺乏,超算的能力就無法施展。
而且,中國(guó)面臨更大的問題在于,不只是軟件落后,軟件生態(tài)與國(guó)外也有一定的差距。甘霖舉例說:太湖之光的眾核處理器相當(dāng)于 1000 萬只螞蟻在協(xié)調(diào)一致、同時(shí)拉動(dòng)重物,如果一只螞蟻“犧牲”了,這只螞蟻的任務(wù)量就需要軟件分配給其他仍在工作的螞蟻,以保證計(jì)算合理進(jìn)行。這個(gè)看似簡(jiǎn)單的步驟需要通用軟件來控制,形成容錯(cuò)和糾錯(cuò)的機(jī)制。雖然中國(guó)也有,但不及國(guó)外成熟的軟件。在太湖之光上運(yùn)行的大部分程序,先前都需要針對(duì)太湖之光的硬件特點(diǎn)進(jìn)行代碼修改以實(shí)現(xiàn)優(yōu)化,這種調(diào)優(yōu)的過程要依靠軟件工具。
“雖手握‘戈登·貝爾’獎(jiǎng),但要全面提升我國(guó)超算應(yīng)用水平仍任重道遠(yuǎn)。”楊廣文講得很直接。這類似于剛剛脫離實(shí)驗(yàn)室,功效可以預(yù)見,實(shí)施仍待檢驗(yàn)。楊廣文認(rèn)為,要做好超算的應(yīng)用,需要科研人員有“工匠精神”。
從硬件到軟件,中國(guó)奮起直追,不斷發(fā)力,從跟跑追到并跑。在國(guó)家層面,國(guó)家重大科技專項(xiàng)中多個(gè)項(xiàng)目都在資助超算支持下的領(lǐng)域應(yīng)用,投入持續(xù)加大。楊廣文表示,系統(tǒng)的政策、項(xiàng)目與人才支持會(huì)促使超算的研發(fā)反哺產(chǎn)業(yè)發(fā)展,促進(jìn)國(guó)家產(chǎn)業(yè)轉(zhuǎn)型與升級(jí)。
量子計(jì)算與超算不存在競(jìng)爭(zhēng)關(guān)系
在“2017 年國(guó)際大數(shù)據(jù)與 E 級(jí)計(jì)算研討會(huì)”上,楊廣文曾透露,“神威·太湖之光”新一代百億億次超算的研制已經(jīng)列入國(guó)家“十三五”規(guī)劃,目前高性能計(jì)算重點(diǎn)專項(xiàng)支持了“神威”“天河”“曙光”三臺(tái)原型機(jī)的研制,有望在 2020 年左右推出首臺(tái)國(guó)產(chǎn)百億億級(jí)次超級(jí)計(jì)算機(jī)。
從十億億級(jí)提高到百億億級(jí)面臨著巨大挑戰(zhàn)。楊廣文向科技日?qǐng)?bào)記者表示,計(jì)算能力的提升導(dǎo)致功耗越來越大,采用低功耗芯片設(shè)計(jì)、高效的制冷技術(shù)、對(duì)整個(gè)系統(tǒng)管理的優(yōu)化管理是目前正在著手攻克的難題。
與新興的量子計(jì)算機(jī)相比,甘霖認(rèn)為,下一代超級(jí)計(jì)算機(jī)與其在幾十年內(nèi)不存在競(jìng)爭(zhēng)關(guān)系。相較于傳統(tǒng)計(jì)算機(jī) 1 比特只能由 0 或 1 的兩種表示,量子計(jì)算機(jī)依靠量子的不確定性,實(shí)現(xiàn)量子表示的多態(tài)表達(dá),比如量子比特可能有多種狀態(tài)的表達(dá),有可能使量子計(jì)算機(jī)在同一規(guī)模下比傳統(tǒng)計(jì)算機(jī)的能力要強(qiáng)很多,但成型時(shí)間的不確定性就給這種可能性增加了更多未知數(shù)。
“量子計(jì)算機(jī)要想成熟起來,肯定要有一個(gè)成熟的算法,而且這個(gè)算法得能夠模擬應(yīng)用,與量子不確定性匹配起來,才能產(chǎn)生期望的效果。”甘霖表示,這也導(dǎo)致只有特定的應(yīng)用領(lǐng)域是量子計(jì)算機(jī)適合的。
“在下一代超算的發(fā)展與競(jìng)爭(zhēng)中,中國(guó)不僅要贏得速度之戰(zhàn),更重要的是贏得應(yīng)用之戰(zhàn)!”楊廣文說,國(guó)產(chǎn)應(yīng)用軟件的滯后和人才的缺乏,嚴(yán)重制約了超算的發(fā)展。以“致用”為終極目標(biāo),“神威·太湖之光”團(tuán)隊(duì)將進(jìn)一步組織國(guó)內(nèi)外優(yōu)勢(shì)力量,共同打造國(guó)產(chǎn)芯片生態(tài)環(huán)境,加強(qiáng)應(yīng)用軟件開發(fā),特別要在氣象氣候服務(wù)、先進(jìn)制造、生命健康、大數(shù)據(jù)分析等重點(diǎn)應(yīng)用領(lǐng)域做足功課,突破應(yīng)用瓶頸,補(bǔ)齊中國(guó)超算應(yīng)用短板。
更多最新行業(yè)資訊,歡迎點(diǎn)擊與非網(wǎng)《今日大事要聞》!