作者 |??程茜,編輯?|??Panken
用全國產(chǎn)封裝供應(yīng)鏈搞定Chiplet異構(gòu)集成,這家創(chuàng)企已經(jīng)率先完成產(chǎn)品驗(yàn)證,對話北極雄芯創(chuàng)始人。
又有一家“清華系”前沿芯片創(chuàng)企浮出水面。
本月初,國內(nèi)Chiplet芯片設(shè)計(jì)創(chuàng)企北極雄芯宣布完成新一輪超億元融資。這是繼去年10月獲得1.5億元天使輪融資后,北極雄芯拿下的又一筆億級融資。韋豪創(chuàng)芯、中芯熙誠、訊飛創(chuàng)投、豐年資本、正為資本均在其股東陣容。
這家2021年7月成立的年輕創(chuàng)企,在今年2月推出了國內(nèi)首款基于異構(gòu)Chiplet集成的智能處理芯片“啟明930”,成為國內(nèi)第一家流片成功Chiplet異構(gòu)集成AI芯片的公司。
▲啟明930實(shí)物(左)、啟明930板卡(右)
北極雄芯的創(chuàng)始人、首席科學(xué)家馬愷聲,是清華大學(xué)交叉信息研究院助理教授、博士生導(dǎo)師。圖靈獎得主、中科院院士、清華大學(xué)交叉信息研究院院長姚期智,現(xiàn)任北極雄芯的首席科學(xué)顧問。
過去四年,馬愷聲帶領(lǐng)團(tuán)隊(duì)在架構(gòu)拆分設(shè)計(jì)、高速互聯(lián)接口、國產(chǎn)供應(yīng)鏈封裝等各項(xiàng)Chiplet基礎(chǔ)技術(shù)研發(fā)層面取得了一系列成功。
英偉達(dá)A100、AMD MI300、特斯拉D1、蘋果M1 Ultra等經(jīng)典AI芯片產(chǎn)品均采用了Chiplet架構(gòu)?;贑hiplet架構(gòu)的高性能解決方案,能夠有效降低云邊端AI芯片的設(shè)計(jì)門檻,潛在市場規(guī)模巨大。而馬愷聲對此積累頗深。
近日,芯東西與這位國內(nèi)Chiplet領(lǐng)域的前沿學(xué)者進(jìn)行了一場深度對話,不僅回顧了其如何前瞻性地選擇在Chiplet賽道創(chuàng)業(yè),還解讀了北極雄芯背后的核心技術(shù)積累。
01.用Chiplet架構(gòu)解決行業(yè)痛點(diǎn)三年積累迎來產(chǎn)業(yè)風(fēng)口
馬愷聲與Chiplet的緣分,是在加入清華后開始的。
2018年,從賓夕法尼亞州立大學(xué)畢業(yè)后,馬愷聲進(jìn)入清華大學(xué)交叉信息核心技術(shù)研究院,成為其中除量子芯片外主攻應(yīng)用芯片研發(fā)的“第一人”。在這里,眾多專家專注于研究AI在不同行業(yè)的應(yīng)用,所涉及的場景及算法差異性極大,而馬愷聲負(fù)責(zé)底層硬件支持?!鞍凑彰?-3年做一款A(yù)I芯片的進(jìn)度,我得做幾十年?!瘪R愷聲說,這樣的研發(fā)速度,對于飛速發(fā)展的AI行業(yè)而言,只能是杯水車薪。
恰巧在這時,電動汽車的滑板底盤技術(shù)給了他靈感。
所謂滑板底盤,就是將電動車的制動、懸架、電動傳動、電池等部件以模塊化形式集成,這樣不同車型可以根據(jù)需求組裝相應(yīng)模塊。
無獨(dú)有偶。蘇州芯片創(chuàng)企貝塔微打造的工具,可以低成本快速批量生產(chǎn)芯片,與半導(dǎo)體產(chǎn)業(yè)頭部玩家德州儀器的電源管理芯片DC-DC、AC-DC搶市場。
在這些啟發(fā)下,馬愷聲開始集中琢磨一個問題:怎么能快速、低成本的做芯片,還能滿足AI+各行各業(yè)的需求。
Chiplet,就這樣闖進(jìn)了馬愷聲的研究主線。
Chiplet常被譯為“芯?!?、“小芯片”,通過將一整顆SoC的功能模塊解耦,分別設(shè)計(jì)制造采用不同制程工藝的chiplets,再通過2.5D/3D先進(jìn)封裝技術(shù)集成在一起。這種異構(gòu)集成的設(shè)計(jì)理念,不僅有助于降低芯片研發(fā)成本,而且能夠有效緩解各行業(yè)算力需求方在差異化需求、性能、成本、算法迭代周期、供應(yīng)鏈保障等各方面的核心痛點(diǎn)。
嗅到巨大商業(yè)價(jià)值后,2019年,馬愷聲意氣風(fēng)發(fā)地率領(lǐng)團(tuán)隊(duì)投入Chiplet研發(fā)。
早期依托于西安交叉信息核心技術(shù)研究院的孵化支持,團(tuán)隊(duì)完成了啟明910、啟明920等幾代AI加速模塊的研發(fā);2021年7月,北極雄芯公司成立并獲得圖靈創(chuàng)投、SEE Fund、紅杉等天使輪投資,馬愷聲正式踏上創(chuàng)業(yè)之路。
2022年初,Intel、AMD等國際半導(dǎo)體產(chǎn)業(yè)巨頭成立Chiplet產(chǎn)業(yè)聯(lián)盟發(fā)布UCIe 1.1規(guī)范,Chiplet在市場上的關(guān)注度漸起。
一切開始步入正軌。
02.主攻云邊端AI推理智能駕駛成重點(diǎn)突破口
理想很豐滿,現(xiàn)實(shí)卻很骨感。
“在芯片領(lǐng)域,大家都很保守,你不把(產(chǎn)品)跑通,客戶看不到產(chǎn)品就會選擇觀望,不會貿(mào)然采用Chiplet路線?!瘪R愷聲說。
實(shí)際操作中,不同場景的需求并不收斂,如何在不同場景的硬件需求中找到最大交集?如何有效的解耦其中共性的部分以及差異化的部分?這是做Chiplet無法繞開的一大難題。
帶著這樣的思考,馬愷聲聯(lián)合團(tuán)隊(duì)深挖潛在客戶需求,綜合考慮Chiplet的技術(shù)特性和經(jīng)濟(jì)效益后,北極雄芯將選擇先從云邊端AI推理入手,以AI加速和智能駕駛為重點(diǎn)場景突破口,先做出具有代表性的Chiplet架構(gòu)芯片,再通過方案授權(quán)或聯(lián)合研發(fā)等方式向其它行業(yè)拓展。
▲Chiplet技術(shù)演示(圖源:北極雄芯官網(wǎng))
例如在智能駕駛領(lǐng)域,單一芯片很難同時兼顧不同檔次車型在產(chǎn)品差異化、迭代周期、成本控制上的需求;AI推理加速方面,市場對高性能算力的需求將從“通用化”向“專用化”轉(zhuǎn)變。這些趨勢都與Chiplet架構(gòu)將大型SoC芯片的模塊拆分成芯粒的技術(shù)路線相契合。
“無論是人工智能服務(wù)器,還是智能駕駛高性能計(jì)算平臺,我們看到的均是千億級別的潛在市場,并且認(rèn)為Chiplet架構(gòu)在其中能夠提供獨(dú)特的商業(yè)價(jià)值?!瘪R愷聲對Chiplet的商業(yè)價(jià)值及市場前景非常樂觀。
03.兩年半跑通首顆Chiplet芯片筑起三大核心技術(shù)壁壘
“從設(shè)計(jì)、制造、互聯(lián)、封裝、工具鏈等全部跑通,在這件事上,我們應(yīng)該是國內(nèi)第一家?!瘪R愷聲談道。今年2月,北極雄芯發(fā)布了首個基于Chiplet架構(gòu)的“啟明930”芯片,可用于AI推理、工業(yè)智能等不同場景。
啟明930基于12nm工藝,采用了北極雄芯自研的第三代“MUSE”核心架構(gòu)NPU,搭配北極雄芯構(gòu)筑的完整算法、編譯、軟件工具鏈體系,使得自研NPU在主流AI模型應(yīng)用上的平均芯片利用率超過70%。
這是首個基于Chiplet異構(gòu)集成并完成流片及國產(chǎn)封裝全鏈路成功驗(yàn)證的高性能計(jì)算SoC,中央控制芯粒采用RISC-V CPU核心,同時可通過高速接口搭載多個功能型芯粒,做到8~20T的算力靈活拓展,支持主流AI算子。
目前,啟明930已與多家AI下游場景合作伙伴進(jìn)行測試。
由于基于全國產(chǎn)基板材料以及2.5D封裝,啟明930的成本更加可控。北極雄芯還提供了與其芯片配套的基礎(chǔ)驅(qū)動、框架支持、應(yīng)用層全棧式的應(yīng)用部署工具。
“把十幾個小芯粒封裝在一起,并且部署相應(yīng)的任務(wù),這塊芯片能跑通,是一個非常復(fù)雜的工程?!瘪R愷聲感慨道,“如何在架構(gòu)定義層面進(jìn)行縱向拆解?需要支持哪些算法?在哪個模塊做?IP如何集成?如何實(shí)現(xiàn)高速互聯(lián)通訊?如何解決應(yīng)力問題?如何解決供電散熱材料?”……最后,北極雄芯聯(lián)合將近10家廠商一起才跑通了啟明930。
據(jù)他回憶:“啟明930從研發(fā)、流片、回片,折騰了將近兩半年的時間?!?,因?yàn)橹皬奈从腥送暾脑趪a(chǎn)供應(yīng)鏈跑通全部。
在這背后,北極雄芯積累了三大核心技術(shù)。
一是“拆”,明確Chiplet的拆解與定義;二是“連”,解決Chiplet的互連與通信;三是“封”,負(fù)責(zé)Chiplet與封裝優(yōu)化。
其中,基于芯粒劃分方法學(xué),能降低跨芯粒數(shù)據(jù)通信負(fù)擔(dān);采用低“芯粒稅”的架構(gòu)定義,可以降低芯粒化帶來的面積負(fù)擔(dān);內(nèi)部Chiplet-Actuary成本模型,能實(shí)現(xiàn)高性價(jià)比復(fù)用。
▲北極雄芯對于Chiplet的拆解與定義
北極雄芯自主研發(fā)的PBLink D2D互連接口,能實(shí)現(xiàn)高速高帶寬與低延時的芯粒通信,同時符合國內(nèi)《芯?;ヂ?lián)接口標(biāo)準(zhǔn)》及車規(guī)級D2D接口標(biāo)準(zhǔn)。
在封裝方面,為了促進(jìn)供應(yīng)鏈國產(chǎn)化,低線數(shù)的PBLink D2D接口可以滿足國內(nèi)基板的層數(shù)要求(≤8層),多芯粒與封裝協(xié)同布局同步優(yōu)化封裝利用率等。
04.預(yù)告芯片量產(chǎn)路線圖下一代Chiplet產(chǎn)品正在緊密研發(fā)
基于產(chǎn)學(xué)研結(jié)合的多年積累,北極雄芯已經(jīng)完成了首個基于Chiplet異構(gòu)集成芯片的試生產(chǎn)驗(yàn)證,并向下游客戶交付了首個隱私安全計(jì)算芯粒產(chǎn)品。
北極雄芯也陸續(xù)與經(jīng)緯恒潤、海星智駕、山東云海國創(chuàng)等多家下游場景方達(dá)成戰(zhàn)略合作,致力于共同推動Chiplet在智能駕駛、AI服務(wù)器等各行業(yè)場景的應(yīng)用。
馬愷聲認(rèn)為,Chiplet的市場發(fā)展已經(jīng)很清晰,他預(yù)計(jì)到2030年,超過一半的高性能AI計(jì)算芯片以及智能駕駛相關(guān)主控芯片均會采用Chiplet架構(gòu)。
市場研究機(jī)構(gòu)Omdia的數(shù)據(jù)也顯示,到2024年Chiplet的市場規(guī)模將達(dá)到58億美元,2035年市場規(guī)模將進(jìn)一步擴(kuò)大到570億美元。
目前北極雄芯正投入下一代高性能通用型芯粒以及AI計(jì)算芯粒的研發(fā)。據(jù)馬愷聲透露,其下一代產(chǎn)品預(yù)計(jì)將于2024年回片測試成功并開始小規(guī)模量產(chǎn),預(yù)計(jì)將率先在部分高性能計(jì)算、商專車、低速無人駕駛等場景實(shí)現(xiàn)小批量使用,并按節(jié)奏逐步進(jìn)入乘用車智能駕駛領(lǐng)域。
面向未來,當(dāng)下蓬勃發(fā)展的大模型、機(jī)器人產(chǎn)業(yè),也讓馬愷聲看到了Chiplet落地應(yīng)用的諸多機(jī)遇。
不同于此前人形機(jī)器人的傳統(tǒng)控制算法,現(xiàn)在人形機(jī)器人采用端到端控制,基于模型輸出電機(jī)怎么轉(zhuǎn)的指令。
這樣一來,機(jī)器人的每個自由度都是一個電機(jī),每個電機(jī)都需要一套模型,模型的計(jì)算速度要更快,才能讓機(jī)器人收到反饋、做指令更靈活。
此外,大模型包含訓(xùn)練和推理的需求,可能兩年之后,隨著產(chǎn)業(yè)發(fā)展較為成熟,推理需求將進(jìn)一步被釋放出來。
在這些機(jī)遇中,基于國內(nèi)尚有差距的供應(yīng)鏈、工藝等,如何做出高性價(jià)比的系統(tǒng),是北極雄芯要做的事。這些擁有巨大潛力的應(yīng)用場景的出現(xiàn),也為馬愷聲繼續(xù)探索Chiplet增添了更多動力。
05.拆解Chiplet發(fā)展三大攔路虎發(fā)布國產(chǎn)供應(yīng)鏈Chiplet互聯(lián)標(biāo)準(zhǔn)
對于國內(nèi)Chiplet發(fā)展面臨的挑戰(zhàn),馬愷聲重點(diǎn)談及三個環(huán)節(jié)。
首先是生產(chǎn)制造環(huán)節(jié),如何盡可能基于國內(nèi)自主可控的供應(yīng)鏈實(shí)現(xiàn)Chiplet芯片的量產(chǎn),擺脫受制于國外先進(jìn)制程的枷鎖,用國內(nèi)成熟制程工藝技術(shù)實(shí)現(xiàn)滿足需求的性能。
其次是如何拆分芯片模塊,并通過不同工藝制程生產(chǎn),使其商業(yè)化達(dá)到最優(yōu)。
還有封測環(huán)節(jié),國內(nèi)封裝基本材料與國外存在差距,先進(jìn)封裝的量產(chǎn)成本高,因此做Chiplet既要考慮通過國產(chǎn)封裝供應(yīng)鏈來優(yōu)化芯粒、接口設(shè)計(jì),還要考慮成本。
難題擺在眼前,北極雄芯也在積極推進(jìn)Chiplet接口標(biāo)準(zhǔn)的制定。
早在2020年,其團(tuán)隊(duì)即與國內(nèi)上下游共同建立了中國Chiplet產(chǎn)業(yè)聯(lián)盟(CCLL),專注于Chiplet架構(gòu)在各領(lǐng)域應(yīng)用的前沿探索。今年年初,交叉信息核心技術(shù)研究院牽頭、中國Chiplet產(chǎn)業(yè)聯(lián)盟共同起草的《芯粒互聯(lián)接口標(biāo)準(zhǔn)》ACC 1.0高速串口標(biāo)準(zhǔn)與《車規(guī)級芯粒互連接口標(biāo)準(zhǔn)》ACC_RV 1.0正式發(fā)布。
下載鏈接:http://accchiplet.iiisct.com/
相比于UCIe標(biāo)準(zhǔn),ACC標(biāo)準(zhǔn)更關(guān)注針對國產(chǎn)供應(yīng)鏈的優(yōu)化,適合對供應(yīng)鏈自主可控程度要求高、量產(chǎn)成本敏感的下游領(lǐng)域,能滿足其商業(yè)落地的需求。
馬愷聲坦言,雖然UCIe已經(jīng)發(fā)布一段時間,但市場上至今還沒有相對成熟的支持所有頻點(diǎn)的滿足標(biāo)準(zhǔn)的產(chǎn)品,而真正下場做各個“芯?!钡钠髽I(yè)更是寥寥無幾。
他認(rèn)為,標(biāo)準(zhǔn)應(yīng)該先讓大家能用起來,基于各場景的真實(shí)商業(yè)需求以及國內(nèi)相關(guān)供應(yīng)鏈的完備程度來制定標(biāo)準(zhǔn)。往后看,北極雄芯計(jì)劃進(jìn)一步投入高速互聯(lián)芯粒接口等Chiplet基礎(chǔ)技術(shù)的研發(fā)。
在這個過程中,他將Chiplet的發(fā)展和工藝進(jìn)步看作“正交”關(guān)系,在工藝制程發(fā)展受光刻機(jī)等關(guān)鍵設(shè)備及半導(dǎo)體材料制約的情況下,接下來10-15年內(nèi),Chiplet或許會貢獻(xiàn)出不一樣的東西。
06.結(jié)語:高性能計(jì)算Chiplet需求漸起國內(nèi)新生勢力挑起大梁
北極雄芯希望在Chiplet產(chǎn)業(yè)中扮演怎樣的角色?馬愷聲用一句話加以概括:“北極雄芯希望基于國產(chǎn)化的供應(yīng)鏈,用最大的自主可控程度,做出不錯的系統(tǒng)應(yīng)用?!?/p>
如今北極雄芯的核心研發(fā)團(tuán)隊(duì),已經(jīng)聚集了有中興、華為、紫光、英特爾、Cadence、Marvell等國內(nèi)外知名半導(dǎo)體企業(yè)背景,擁有不同工藝多款芯片成功流片經(jīng)驗(yàn)的一批芯片人才。
隨著系統(tǒng)級芯片集成進(jìn)入后摩爾時代,加上國內(nèi)先進(jìn)制程供應(yīng)受阻,基于Chiplet的創(chuàng)新思路成為國內(nèi)半導(dǎo)體產(chǎn)業(yè)發(fā)展的重要途徑。在時代浪潮中,北極雄芯致力于成為基于Chiplet架構(gòu)定制化高性能計(jì)算解決方案的領(lǐng)航者,從AI在各領(lǐng)域落地的實(shí)際應(yīng)用需求出發(fā),協(xié)助各行業(yè)“用小芯片,做大芯片”。
在今年9月14日-15日舉行的2023全球AI芯片峰會期間,馬愷聲教授將對Chiplet架構(gòu)在AI芯片中的商業(yè)價(jià)值進(jìn)行進(jìn)一步的深入解讀,分享推動Chiplet架構(gòu)在國內(nèi)的商業(yè)化落地以及創(chuàng)造新的高性能計(jì)算范式,并介紹北極雄芯在Chiplet領(lǐng)域的拓展及實(shí)踐。