MRAM 在速度、耐久性、功耗這些方面具有不可替代的優(yōu)越性。因此,MRAM 是實現(xiàn)存算一體的理想存儲器之一。
隨著物聯(lián)網(wǎng)應(yīng)用和諸如機器學(xué)習(xí)、計算機視覺、自然語言處理等人工智能應(yīng)用的興起,處理器需要更加頻繁地對存儲器進行訪問與數(shù)據(jù)傳輸。傳統(tǒng)的馮諾依曼計算機體系架構(gòu)依賴總線進行存儲器與處理器之間數(shù)據(jù)傳輸,在面對這類數(shù)據(jù)密集型應(yīng)用時往往難以兼顧低延時與高能效。這一數(shù)據(jù)傳輸瓶頸現(xiàn)象常被描述為“內(nèi)存墻”和“功耗墻”。存內(nèi)計算技術(shù)通過更緊密地將處理器與存儲器進行結(jié)合,有望克服這一性能瓶頸。
近年來,新型非易失性存儲器(NVM)技術(shù)的出現(xiàn),克服了基于早期存儲器存內(nèi)計算方案在易失性、集成度、成本效益等問題,極大地提升了存內(nèi)計算處理的性能。磁性隨機存儲器(MRAM)作為新型NVM的一種,具有接近零的靜態(tài)功耗,較高的讀寫速度,與互補金屬氧化物半導(dǎo)體(CMOS)工藝相兼容等優(yōu)點,在車用電子與穿戴設(shè)備等領(lǐng)域已實現(xiàn)商業(yè)化應(yīng)用,被認(rèn)為是最有希望的下一代存儲器之一。STT-MRAM和SOT-MRAM已在各種PIM架構(gòu)中得到利用,目前MRAM技術(shù)的發(fā)展趨向于在先進技術(shù)節(jié)點提供更高的寫入速度和更低的功耗。
MRAM的歷代發(fā)展
磁性隨機存儲器(MRAM)是一種基于自旋電子學(xué)的新型信息存儲器件,其核心結(jié)構(gòu)由一個磁性隧道結(jié)和一個訪問晶體管構(gòu)成。MTJ 呈現(xiàn)“三明治”結(jié)構(gòu),兩層磁性固定層和自由層之間夾著一層隧穿層。這其中,鐵磁層材料一般使用 CoFeB,隧穿層材料則為 MgO。固定層的磁化方向是不變的,而自由層的磁化方向可以被改變。當(dāng)固定層和自由層磁化方向一致時,稱為“平行狀態(tài)”,MTJ 的隧道磁阻(Tunnel Magnetoresist-ance,TMR) 為低; 當(dāng)磁化方向不一致時,稱為“反平行狀態(tài)”,TMR 為高。數(shù)據(jù)的寫入通過切換自由層的磁化方向?qū)崿F(xiàn),讀取則通過使電流通過結(jié)來測量磁阻大小實現(xiàn)。訪問晶體管的柵極與字線相連,形成“1T1M”的結(jié)構(gòu)來實現(xiàn)存儲單元的選擇。由于 MTJ 翻轉(zhuǎn)電流的不對稱性,晶體管的寫入驅(qū)動電流也有不對稱性。它具有極快的開關(guān)速度、近乎為零的泄露功耗、極高的可靠性等顯著優(yōu)點,是實現(xiàn)存算一體化技術(shù)的理想器件之一。
與大部分其它半導(dǎo)體存儲器技術(shù)不同,MRAM中的數(shù)據(jù)以一種磁性狀態(tài)(而不是電荷)存儲,并且通過測量電阻來感應(yīng),不會干擾磁性狀態(tài)。采用磁性狀態(tài)存儲有兩個主要優(yōu)點:(1)磁場極性不像電荷那樣會隨著時間而泄漏,因此即使在斷電的情況下,也能保持信息;(2)在兩種狀態(tài)之間轉(zhuǎn)換磁場極性時,不會發(fā)生電子和原子的實際移動,這樣也就不會有所謂的失效機制。在MRAM中使用的磁阻結(jié)構(gòu)非常類似于在硬盤中使用的讀取方式。
MRAM結(jié)構(gòu)圖
在 1972 年,MRAM的基本概念首次被提出,其存儲單元是利用各向異性磁阻的特性(AMR:Anisotropic Magneto- resistance)制作出的三層結(jié)構(gòu)。受當(dāng)時技術(shù)的限制,還不具備實用性價值,到了 1988 年,巨磁阻效應(yīng)( GMR:GiantMagneto- resistance)的發(fā)現(xiàn),MRAM 的實用性才得以實現(xiàn)。但由于 GMR 材料和 MOS 管串聯(lián)的鏈路中,阻抗低,分壓能力低,靠提高尺寸來增大寫性能對面積的要求非常高,這導(dǎo)致 GMR 在實際應(yīng)用中仍然存在困難。直到 1995 年,提出了隧穿磁阻效應(yīng)(TMR:Tunneling Magneto- resistance),讀寫速度和集成度才得以提高,將MRAM推向了實用性。依據(jù)兩種不同的寫入方式可以將 MRAM 技術(shù)劃分為兩代。
第一代 MRAM 的寫入方式是磁場寫入式。它利用導(dǎo)體中流過的正反兩個電流方向產(chǎn)生磁化感應(yīng),使得 STT 存儲單元的 MTJ 自由層相對固定層磁化方向為同向和反向兩個方向,從而表現(xiàn)出高低兩種大小的阻抗?fàn)顟B(tài)用于存取數(shù)字邏輯“1”和“0”。由于這種寫入方式需要足夠強的磁場感應(yīng),因此需要足夠大的寫入電流,即需要利用高壓來進行寫,這導(dǎo)致了功耗的增大。同時隨著工藝尺寸的縮減以及MTJ 結(jié)尺寸的降低,相鄰 STT 存儲單元的可靠性問題變得嚴(yán)重,通過增大間距減小相互干擾則會降低MRAM 的集成度。因此,可靠性和集成度之間是一對矛盾。
第二代 MRAM 的寫入方式是自旋轉(zhuǎn)移矩寫入式。它是利用自旋轉(zhuǎn)移矩(spin - transfer torque)效應(yīng)誘導(dǎo)磁性材料發(fā)生磁化翻轉(zhuǎn),即利用流過隧道結(jié)中不同方向的自旋極化電流,驅(qū)動軟磁體磁化方向的改變,實現(xiàn) MTJ 結(jié)高低阻抗?fàn)顟B(tài)的寫入。這種寫入方式的存儲器,稱之為自旋轉(zhuǎn)移矩磁隨機存儲器(STT-MRAM:Spin Transfer Torque MRAM)。與第一代 MRAM 依靠磁場寫入的方式不同,這種方式是依靠自旋轉(zhuǎn)移矩效應(yīng),它利用電流來完成磁性薄膜的磁化方向翻轉(zhuǎn),繼而實現(xiàn)不同的阻抗?fàn)顟B(tài)。這種方式,最大的優(yōu)勢是降低了對寫電壓的要求,從而也降低了功耗,并且避免了磁場感應(yīng)引起的串?dāng)_問題,有效提高了集成度。因此對磁存儲器研究自然的過渡到了對自旋轉(zhuǎn)移矩磁隨機存儲器的研究。
第三代MRAM的自旋道矩磁隨機存儲器(SOT-MRAM),電流通過底層重金屬,產(chǎn)生自旋流并注入到自由層中,利用自旋軌道矩使自由層的磁化方向產(chǎn)生擾動,并結(jié)合多種方式讓磁化方向產(chǎn)生確定性的翻轉(zhuǎn)。相比于自旋轉(zhuǎn)移矩的存儲技術(shù),基于自旋軌道矩的存儲技術(shù)具有對稱的讀寫能力、分離可優(yōu)化的讀寫路徑、亞納秒的快速操作速度和低寫入功耗等優(yōu)點。
MRAM在存算一體上展現(xiàn)出的優(yōu)勢
到目前為止,多種存儲器介質(zhì)被研究用于構(gòu)建存算一體系統(tǒng),包括基于電荷存儲原理的傳統(tǒng)存儲器和基于電阻存儲原理的新型存儲器。傳統(tǒng)存儲器主要包括 SRAM、DRAM和 Flash。其中 SRAM 和 DRAM 是易失性器件,頻繁的刷新并不利于降低功耗。而 Flash 雖然是非易失性的,但是隨著讀寫次數(shù)增加,浮柵氧化層會逐漸失效,反復(fù)讀寫可靠性很低。因此,各種基于電阻改變的新型存儲器是實現(xiàn)存算一體的有效載體。
這其中主要包括相變存儲器 ( Phase Change Memory,PCM )、電阻記憶存儲器 ( Resistive Random Access Memory,RRAM)和磁性隨機存儲器 ( Magnetic Random Access Memory,MRAM) 。PCM 和 RRAM 基于原子層級重構(gòu)來改變阻值,優(yōu)點是有較大的阻值窗口,而缺點則是讀寫速度和讀寫可靠性要劣于MRAM。MRAM則是基于對電子“自旋”的控制,可以達到理論上的零靜態(tài)功耗,同時具有高速和非易失性以及近乎無限的寫入次數(shù)。MRAM 在速度、耐久性、功耗這些方面具有不可替代的優(yōu)越性。因此,MRAM 是實現(xiàn)存算一體的理想存儲器之一。
MRAM當(dāng)前的應(yīng)用及未來預(yù)估
隨著自旋轉(zhuǎn)移矩 MRAM (STT-MRAM) 的發(fā)明,MRAM 邁出了商業(yè)化的重要一步。
第一個商業(yè)化的磁隨機存儲器產(chǎn)品是飛思卡爾半導(dǎo)體公司(FreescaleSemiconductor)于2006 年生產(chǎn) 的4 Mb 容量Toggle-MRAM ,該部門是Everspin 的前身。之后Everspin 公司推出了具有SRAM 速度和 閃存結(jié)構(gòu)的非易失的Toggle-MRAM ,其16 位32Mb并行MRAM 具有最高35 ns 的寫入周期時間,工作溫度范圍為-40~125°C ,適用于工業(yè)和汽車應(yīng)用。Everspin 在 2012 年就生產(chǎn)出了首個商業(yè)級的 64Mbit 的 STT-MRAM 存儲器芯片并在2017年大批量生產(chǎn)了256Mb DDR3 STT-MRAM,并于2017年集成了40 nm CMOS,并在2019年批量生產(chǎn)了28 nm CMOS上的1Gb DDR4 STT-MRAM。
霍尼韋爾(Honeywell)和Cobham(前身為Aeroflex)等其他公司也推出了自己的MRAM 產(chǎn)品,它們同樣使用Toggle-MRAM 單元和SRAM 結(jié)構(gòu)。其中霍尼韋爾采用特殊抗輻照的150 nm 絕緣體上硅(silicon oninsulator,SOI)CMOS 技術(shù),使其MRAM 產(chǎn)品在衛(wèi)星和其他航天應(yīng)用中具有很高的可靠性和輻射抗性。
東芝公司在 2014 年的美國檀香山開幕的國際會議上“2014 Symposia on VLSI Technology and Circuits(以下稱 VLSI Symposia)”用 STT-MRAM 代替 SRAM,使得微處理器中的高速緩存功耗降低了近 60%。日本超低壓元器件技術(shù)研究聯(lián)盟(LEAP)在 VLSI Symposia 上同樣實現(xiàn)了用 STT-MRAM 對傳統(tǒng) SRAM的替換。傳統(tǒng)的 STT-MRAM 單純采用蝕刻技術(shù)來制造,但這種技術(shù)會由于 MTJ尺寸的偏差導(dǎo)致性能偏差。因此,為解決 MTJ 制造工藝中的尺寸偏差問題,LEAP研究出了全新的蝕刻技術(shù),顯著降低了 MTJ 制造過程中尺寸不均勻的問題。
高通正在加速研究 STT-MRAM 技術(shù)。2015 年項目研究員 Seung H. Kang 發(fā)布了一款 8Mbit 混合 STT-MRAM 的SOC 芯片 。在沒有軟錯誤的情況下,工作頻率可以達到 500MHZ。在 40nm 工藝下,適用于混合STT-MRAM 的 SOC,若工藝尺寸可以降到 28nm,那么其性能可以與SRAM 相媲美。
2017-2020年的MRAM的公開芯片情況
在過去幾年里,包括臺積電、英特爾、三星、SK海力士等晶圓代工廠和IDM,相繼大力投入MRAM 研發(fā)。
此外不少創(chuàng)新公司,如 Everspin,Avalanche, Crocus, Spin Transfer Technology 也已能夠提供 MRAM 樣品。整體上,STT-MRAM 已經(jīng)在 2×nm 節(jié)點的嵌入式存儲市場準(zhǔn)備就緒。
華為與 SNIA(全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會)在2015 年共同舉辦的存儲技術(shù)峰會上,Albert Fert(2007 年諾貝爾物理學(xué)獎獲得者)表示:在存儲技術(shù)底層是依靠核心技術(shù)和理論突破存儲瓶頸。自旋轉(zhuǎn)移矩技術(shù)取得了重大突破,基于 DMI 效應(yīng)的方式使得 STT-MRAM 存儲單元可以縮放到幾納米,顯著的提高了磁存儲器的集成度和性能。
特邀作者: 劉家倫北京航空航天大學(xué) 集成電路科學(xué)與工程學(xué)院