云端AI芯片,已經(jīng)成為兵家必爭之地。
據(jù)ABI Research統(tǒng)計(jì),從全球市場發(fā)展來看,這塊“大蛋糕”將在2024年達(dá)到191億美元的規(guī)模。
因此,全球范圍內(nèi)的主要芯片玩家們紛至沓來,早早地開始布局于此:
經(jīng)過數(shù)年時(shí)間的發(fā)展,由于英偉達(dá)GPU擁有豐富的產(chǎn)品線、強(qiáng)大的軟件生態(tài)等優(yōu)勢,目前在云端AI芯片市場處于“一家獨(dú)大”的局面。
但與此同時(shí),GPU對于云端AI芯片也并非完美,存在著功耗大、價(jià)格昂貴等問題。
相對的,FPGA和ASIC因其低功耗、可編程等優(yōu)勢,使得一些國外的新晉廠商采取異構(gòu)計(jì)算打法切入,推出了更加適合云端通用計(jì)算的AI芯片。例如:
Cerebras Systems、Graphcore、Habana(已被英特爾收購)、Wave Computing等。
隨著云計(jì)算和AI的結(jié)合不斷深入,云端AI芯片的市場潛力不容小覷。在國外科技巨頭持續(xù)發(fā)力云端AI芯片之時(shí),中國公司也敏銳地嗅到了這一市場方向,與美國同行們幾乎同時(shí)起步。
隨著深度學(xué)習(xí)的不斷發(fā)展,AI越來越多地滲入到數(shù)據(jù)中心來,滲透率將高達(dá)25%-30%,是一個(gè)非常龐大的市場。這就是被市場看作中國芯片黑馬——燧原科技所提出的觀點(diǎn)。
他們僅耗時(shí)18個(gè)月,便一次性流片成功,打造了國產(chǎn)AI云端訓(xùn)練芯片——邃思??芍^是在中國芯片界一戰(zhàn)成名。
而就在最近,量子位收到了一張來自燧原科技的邀請函。
起初小編未太在意。
但定睛一看,燧原科技貌似要有大動作了!
從一張邀請函中引發(fā)的猜想
初看這份邀請函,最先映入眼簾的便是“芯云長天”這個(gè)醒目的標(biāo)題。
先從“芯云”二字入手:
“芯”應(yīng)當(dāng)是指芯片。
“云”則是云端之意。
畢竟燧原科技位居“云端AI芯片”玩家之列,這種解釋應(yīng)當(dāng)是沒錯(cuò)了。
而“長天”二字,原意為:遼闊的天空。
結(jié)合前面的“芯”、“云”二字,應(yīng)當(dāng)是希望在云端AI芯片的天地中大展宏圖。
再來看下邀請函中的第二個(gè)細(xì)節(jié)。
標(biāo)題文字背后的這些曲線,似乎也有點(diǎn)文章,像是許多條收斂曲線。
咦?把這些元素規(guī)整一下,線索來了。
看來想要求解答案,還得從燧原科技的“起點(diǎn)”著手。
公開資料顯示,燧原科技是于2018年3月19日,在上海正式成立。
在成立1個(gè)月之后,拿到種子輪融資的燧原科技,便馬上進(jìn)入到了研發(fā)芯片的階段。
而僅僅過了20個(gè)月,也就是在2019年12月,就發(fā)布了自研的第一款云端AI訓(xùn)練芯片邃思DTU,去年9月又宣布其云端訓(xùn)練加速卡“云燧T10”落地商用。
這種速度著實(shí)是有些驚人了。
要知道,業(yè)界設(shè)計(jì)一款GPU/CPU,從設(shè)計(jì)到最后的量產(chǎn),平均要耗時(shí)3年甚至更久。
更何況,邃思DTU還是從無到有地設(shè)計(jì)了全新的架構(gòu)、處理器和指令集。
而且這款芯片不僅僅是研發(fā)周期短,技術(shù)指標(biāo)也是十分亮眼:
單卡單精度(FP32)算力達(dá)20TFLOPS
半精度及混合精度 (BF16/FP16)算力80TFLOPS
最大功耗為225W
12nm工藝,2.5D先進(jìn)封裝
而在邃思DTU的基礎(chǔ)上,燧原科技分別又在云端訓(xùn)練和推理兩大陣營,發(fā)布了其自研產(chǎn)品。
訓(xùn)練方面,分別是面向云端數(shù)據(jù)中心的AI訓(xùn)練加速卡云燧T10和基于OCP(開放計(jì)算項(xiàng)目)OAM(開放加速模組)標(biāo)準(zhǔn)設(shè)計(jì)的AI訓(xùn)練加速模組云燧T11。
在推理方面,燧原科技所推出的產(chǎn)品,則是云燧i10。
它是一款面向云端數(shù)據(jù)中心的高性能人工智能推理加速卡,可廣泛應(yīng)用于計(jì)算機(jī)視覺、自然語言處理、語音識別與合成、知識圖譜等多類型云端推理場景。
除了硬件上的產(chǎn)品,燧原科技在軟件方面也推出了馭算——計(jì)算及編程平臺。
據(jù)公開資料顯示,馭算支持主流深度學(xué)習(xí)框架,并針對邃思芯片進(jìn)行了特定優(yōu)化。
整個(gè)平臺不僅包括常用的算子加速庫,還可以為數(shù)據(jù)中心大規(guī)模訓(xùn)練集提供調(diào)度機(jī)制。
1張?jiān)贫擞?xùn)練芯片、2款云端訓(xùn)練產(chǎn)品、1款云端推理產(chǎn)品,再加1個(gè)計(jì)算/編程平臺。
這就是燧原科技在成立三年多時(shí)間內(nèi)解鎖的成就。
而從這一路發(fā)展的路徑來看,燧原科技最先攻堅(jiān)的云端AI芯片中,屬于最艱難的部分——訓(xùn)練芯片。講真,有被硬核到。
好了,挖完第二條線索,我們繼續(xù)。目光暫且移至邀請函的上方,最為醒目的便是這個(gè)半圓了。
雖然單看這個(gè)形狀猜不出太多深層的含義,但直觀其顏色和質(zhì)感,是那種黑科技硬核感沒錯(cuò)了。
但俗話說的好:“站得高,看得遠(yuǎn)”。把“鏡頭”抬高一些!真正的第三條線索,它來了!
與前方綿延的山脈連在一起看,這不就是個(gè)數(shù)字“2”嗎?
現(xiàn)在再結(jié)合剛才半圓的黑科技質(zhì)感,莫非是……最硬核的芯片要有到動作?
再大膽的猜測,莫非是要把邃思DTU來個(gè)升級?若真如此,那可將會是一個(gè)“連鎖反應(yīng)”。
因?yàn)樽詈诵牡脑贫薃I芯片升級,其訓(xùn)練等產(chǎn)品自然也會在性能上有大幅度的提升。
同時(shí),對大規(guī)模算法模型的支持能力也會顯著增強(qiáng);而更進(jìn)一步的,內(nèi)存、寬帶等屬性也得跟上升級的步伐。
但比這些更具意義的一點(diǎn)會是:
在國內(nèi),這將會成為首個(gè)實(shí)現(xiàn)二次迭代的云端訓(xùn)練芯片。
這是因?yàn)樾酒姆N類眾多,不同芯片的技術(shù)門檻也不一樣,AI芯片亦是如此。
而國產(chǎn)AI云端訓(xùn)練芯片,也正如文章開始講述的那樣,由于GPU等芯片的成熟,這個(gè)高端細(xì)分領(lǐng)域卻一直是處于一片空白的狀態(tài)。
也正如此,國產(chǎn)AI云端訓(xùn)練芯片用“一片藍(lán)海”來形容也是不足為過的。
若是邃思DTU真的能夠完成二次迭代,除了解鎖“全國首個(gè)”之外,更長遠(yuǎn)的角度來看,更是能讓業(yè)界看到中國AI芯片設(shè)計(jì)的高水準(zhǔn)。
以上便是量子位“從一張邀請函引發(fā)猜想”的故事。
在第一代訓(xùn)練產(chǎn)品“云燧T10”發(fā)布的18個(gè)月后,上述對于新品的各種猜測,是否會成真,一切答案將在7月7日的產(chǎn)品發(fā)布會中揭曉,讓我們拭目以待!
— 完 —
金磊 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號 QbitAI