人類文明的進步,與“光”的使用密不可分。19 世紀晚期,英國物理學家丁達爾向人們揭示了光的全反射原理,這也解釋了光為何能在彎曲的水流或玻璃棒里向前傳播。自此,人們就開始了對光傳輸介質的探尋。
上世紀中葉,高錕發(fā)表名為《光頻率介質纖維表面波導》的論文。他創(chuàng)造性的提出,使用基于石英的玻璃纖維作為光傳輸介質,可以進行長距離的信息傳輸。由此,光纖逐漸登上歷史舞臺。和電纜相比,光纖在性能、可靠性、安全性等很多方面都有極大的提升,這也使得光纖成為了現(xiàn)代文明主要的通信介質之一,并引發(fā)了一系列通信行業(yè)的根本性變革。
在半導體領域,當前芯片間的主要互聯(lián)方式還是基于電氣連接。隨著距離的增加,數(shù)據傳輸帶寬會急劇下降,而由此帶來的能耗則會大幅上升。下圖就展示了芯片內部、芯片與電路板、電路板之間等不同維度下,數(shù)據傳輸帶來的帶寬損失與能耗增長。可以看到,即使在板級通信時采用光纜傳輸,相比芯片內部的傳輸速度和能效仍然下降了 4 個數(shù)量級。
為了解決這個問題,業(yè)界已經開始探尋能否在芯片互聯(lián)時使用光傳輸代替電傳輸,從而極大提升數(shù)據帶寬、減少傳輸能耗、并延長數(shù)據傳輸?shù)木嚯x。在這其中,硅光子芯片技術正在獲得越來越多的關注。
近日,一家名為 Ayar Labs 的初創(chuàng)公司展示了一款名為 TeraPHY 的光學收發(fā)器。這個光學收發(fā)器以芯粒(chiplet)的形式集成在英特爾 Stratix10 FPGA 上,可以達到 2Tbps 的數(shù)據帶寬,傳輸距離最高可達 2 公里,而傳輸功耗則不超過每比特 1pJ(10 的 -12 次方)。
?
動圖,左側是兩個光子芯粒,中間是 Stratix10
相比之下,目前 FPGA 使用的 PAM4 收發(fā)器速率最高為 58Gbps,NRZ 收發(fā)器最高速率為 30Gbps,而當前電氣收發(fā)器的路線圖也只不過安排到了 112Gbps。也就是說,這種光學收發(fā)器至少可以取得近 20 倍的性能提升,傳輸距離和功耗更不可同日而語,而這也將 FPGA 收發(fā)器的性能帶到了一個全新的高度。
Ayar Labs 與光子芯片
Ayar Labs 成立于 2015 年,總部位于美國加州。它是 MIT 的孵化企業(yè),創(chuàng)始團隊大都來自 MIT、UC Berkeley 等美國頂尖高校。Ayar Labs 先后獲得了英特爾資本、格羅方德(GlobalFoundries)以及洛克希德馬丁等公司的數(shù)千萬美元戰(zhàn)略投資。
Ayar Labs 專攻的主要領域就是芯片級的光子傳輸,前文提到的 TeraPHY 就是該公司目前的主打產品。TeraPHY 的研發(fā)主要得到了美國國防高級研究計劃局(DARPA)的項目支持。
在 2019 年的 HotChips 大會上,Ayar Labs 正式推出了 TeraPHY,并在前不久正式對這個光學收發(fā)器的性能進行了在線演示。在接下來的文章中,我將詳細介紹 TeraPHY 的技術細節(jié),特別是它的光學數(shù)據傳輸方式,以及它是如何與 FPGA 進行異構集成的。
Ayar Labs 在 2019 年 HotChips 大會的講稿幻燈片,已上傳至知識星球“老石談芯 - 進階版”,請在文末掃碼進入星球查看。
TeraPHY:光電轉換的奧秘
光學收發(fā)器 TeraPHY 最重要的技術創(chuàng)新,在于它解決了光信號的“調制”和“解調”兩個主要問題。這其中具體的物理學細節(jié)在本文不再贅述,下一段中,我嘗試簡單介紹其中的主要原理,不感興趣的同學可以直接略過這部分。
簡言之,它利用了類似于定向耦合器的原理,當兩個光傳輸介質足夠靠近時,其中一個介質里的能量就能耦合到另一個。此時如果在一個介質上加入電場,就可以改變光在這個介質中的傳播速度,從而控制光波的相位。通過這個過程,電信號的變化就轉變成了光信號的變化。之后當兩個介質里的光再次耦合時,由于光波的干涉原理,就會產生不同振幅。如果把波峰看成 1,波谷看成 0,那光波的不同振幅就可以解碼成由 0 和 1 組成的數(shù)字信號,也就完成了光到電的轉換。這個過程就是著名的馬赫 - 曾德爾干涉儀的工作原理。
Ayar Labs 發(fā)明了一種環(huán)形諧振器(microring resonator),來實現(xiàn)上述的過程。相比馬赫 - 曾德爾干涉儀,這種環(huán)形諧振器的尺寸要小 100 倍,能效高 50 倍,數(shù)據傳輸密度也要高 25-50 倍。通過使用這種裝置,可以實現(xiàn) 25Gbps 到 100Gbps 的傳輸帶寬。
此外,由于不同波長的光在同一介質里傳輸時不會相互影響,可以采用多種不同的波長代表不同的比特位,這樣就實現(xiàn)了一定程度上的并行數(shù)據傳輸。
下圖展示了 TeraPHY 單個通道的收發(fā)過程,可以看到,這里采用了四種不同波長的光。在發(fā)送端,利用環(huán)形諧振器將不同比特位的數(shù)據分別調制到這四種光波上,并利用光纖進行傳輸。在接收端,再利用環(huán)形諧振器進行解調,將不同波長的光信號轉化成相應的電信號。
值得注意的是,為了提供穩(wěn)定的初始光源,Ayar Labs 還開發(fā)了一款名為 SuperNova 的激光源,它能夠提供最多 256 種波長的光波,等效 8.192Tbps 的數(shù)據帶寬。
?
SuperNova 激光源
在 HotChips19 大會上,Ayar Labs 公布了一個 TeraPHY 的測試芯片設計。在發(fā)送端,包含 5 個光學宏單元,每個宏單元支持 16 個通道,每通道 25Gbps 帶寬,共計 2Tbps。
?
發(fā)送端光學宏單元的芯片版圖和架構圖
在接收端則包含 3 個宏單元,共計 1.2Tbps 帶寬。
?
接收端光學宏單元的芯片版圖和架構圖
光學芯粒與 FPGA 的異構集成
TeraPHY 剛面世時,它被同構集成到一個 RISC-V CPU 芯片中,并代替了原有的 CPU IO 收發(fā)器。然而,這種同構設計的靈活性十分有限,例如,如果需要把 TeraPHY 用于其他芯片系統(tǒng),則需要重新設計和生產整個芯片。
在芯粒(chiplet)設計大行其道的今天,將 TeraPHY 做成芯粒就成為了非常合理的選擇。在之前的文章中,曾詳細介紹過英特爾的 EMIB 技術。EMIB 最大的優(yōu)點在于它降低了系統(tǒng)的制造復雜度,并降低了不同硅片與芯粒間的傳輸延時。由于無需制造覆蓋整個芯片的硅中介層、以及遍布在硅中介層上的大量硅通孔,EMIB 只需使用較小的硅橋在硅片間進行互聯(lián)就可以滿足硅片間的互聯(lián)需求。同樣的,由芯片 I/O 至封裝引腳的連接和普通封裝技術相比并未變化,因而無需再通過 TSV 或硅中介層進行走線。對于模擬器件(如收發(fā)器)而言,由于不存在通用的中介層,因此對高速信號的干擾明顯降低。
英特爾的 Stratix10 FPGA 中就使用了 EMIB 技術集成了不同速率的收發(fā)器和高帶寬存儲器(HBM)。此外,EMIB 還能用來連接多個 FPGA 硅片,通過這種方法,英特爾制造出了目前世界上最大的 FPGA – Stratix10 GX 10M。
這樣,Ayar Labs 就將 TeraPHY 做成了芯粒的形式,它使用了格羅方德的 45 納米 RF SOI CMOS 工藝制造,在光學輸出端包含 10 個光學宏單元,最高傳輸速率可達 2.56Tbps。
在電氣連接端,使用了名為 AIB(Advanced Interface Bus)的物理層協(xié)議。AIB 是英特爾推出的一個異構互聯(lián)的開放物理層協(xié)議,關于它的技術細節(jié)在本文不再詳述,它的技術白皮書已上傳至知識星球“老石談芯進階版”,文末掃碼進入星球查看并參與討論。
最后,TeraPHY 與 FPGA 硅片之間通過 EMIB 進行互聯(lián),并完成芯片封裝,這也就是所謂的多芯片封裝:Multi-Chip Package(MCP)。
這是又一個使用 EMIB 進行快速異構集成的典型實例。通過使用這種方式,不用重新制造完整的芯片,只需要將現(xiàn)有的 FPGA 芯片與芯粒進行互聯(lián)和封裝即可,極大提升了產品的靈活性,也大大降低了制造風險與成本。
在 Ayar Labs 最新發(fā)布的在線演示中,他們使用這個集成了光學收發(fā)器的 FPGA 進行了數(shù)據傳輸演示,并在 8 個光學鏈路下得到了 2Tbps 的數(shù)據吞吐量。Ayar Labs 預計將在未來達到超過 100Tbps 的吞吐量,同時每比特的傳輸功耗不超過 1pJ。
?
集成光學收發(fā)器的 Stratix10 FPGA 測試板卡,圖片來自 Ayar Labs
結語
制造玻璃的石英和制造芯片的半導體材料都源于沙子。正是這種取之不盡、用之不竭的材料,成為了推動人類文明進步的重要基石。而“點石成金”的背后,則是無數(shù)研究者的不斷鉆研與創(chuàng)新。如今,光和電在 FPGA 里進行融合,并進一步擴展了數(shù)據傳輸?shù)那熬?。老石相信,這樣的技術創(chuàng)新還會不斷涌現(xiàn),并繼續(xù)推動技術和文明向前進步。