?
眾所周知,微處理器(CPU)在現(xiàn)代計(jì)算設(shè)備里是核心,是大腦,但是對(duì)于大多人來(lái)說(shuō),CPU 只不過(guò)就是一個(gè)名詞、一個(gè)符號(hào)或者代表著某一項(xiàng)參數(shù),是名副其實(shí)的“幕后”英雄。雖然在本文中陸續(xù)展示了點(diǎn)滴的代表性產(chǎn)品、與之相關(guān)的重要人物及其事跡,但是更多的無(wú)名英雄,依舊是很少被人認(rèn)知贊美的。
回顧歷史,1971 年 11 月 15 日,全球第一款微處理器“Intel 4004”從 Intel 公司誕生,時(shí)至今日已走過(guò) 45 年的歲月,它改變了人類的思維方式、生活方式和提升了工作效率和生活品質(zhì),那么將來(lái)的發(fā)展趨勢(shì)如何呢?
在解答這個(gè)問(wèn)題之前,首先瀏覽下面的畫卷。
1. 圖解 CPU 發(fā)展史簡(jiǎn)
由圖可見(jiàn),經(jīng)過(guò)了以上 40 多年的發(fā)展,如今,CPU 就象一匹脫韁的野馬,正以異乎尋常的速度向前發(fā)展,在大大小小的媒體上,市場(chǎng)充斥著與之相關(guān)的聲音:頻率提升、功耗降低、新品發(fā)布、人機(jī)大戰(zhàn)、操作系統(tǒng)的升級(jí)等等。如果說(shuō)顯卡、聲卡的更新是技術(shù)上的創(chuàng)新,那么 CPU 的升級(jí)換代就是技術(shù)上的革命!
因此,不禁要問(wèn) CPU 將來(lái)的發(fā)展方向是什么?到底能夠跑多快?它的發(fā)展還會(huì)帶給人們哪些變革?或許下面的內(nèi)容會(huì)給出一些答案!
2. 總趨勢(shì)分析
在最初研發(fā) CPU 的時(shí)候,人們就對(duì)其寄予厚望,要求微處理器要具備如下的要素:體積小重量輕、可靠性高、價(jià)格低廉、應(yīng)用面廣泛的特點(diǎn)??梢哉f(shuō)現(xiàn)在的 CPU 都符合這些要求,所以要想更貼切的把握 CPU 的發(fā)展趨勢(shì),有必要對(duì) CPU 的各個(gè)方面做一個(gè)比較全面的分析。
縱觀 CPU 的發(fā)展史,可以概括為如下:
(1) 位數(shù)越來(lái)越大
早期 CPU 和現(xiàn)在的 CPU 的一個(gè)重要的差別就是位數(shù)的巨大差異。CPU 位數(shù)的發(fā)展歷程如下:
4 位:Intel 4004;
8 位:Intel 8080/8085、Motorola6800/6802、ROCKWELL6502;
16 位:Intel 8086/8088、Motorola 68000;
32 位:Intel 80386/80486;
64 位:Intel Itanium 和 AMD K8。
有些古董級(jí)位數(shù)的 CPU,估計(jì)有些人是見(jiàn)所未見(jiàn)的,更不必說(shuō)使用過(guò)了,比如想要見(jiàn)識(shí) 4004 的身影,恐怕只能去博物館或者翻翻地下室、閣樓的抽屜,也許拆開一些比較老的便攜式計(jì)算器,會(huì)有所收獲的。
從上面的數(shù)據(jù)來(lái)看,CPU 位數(shù)增高是一個(gè)必然趨勢(shì),那么為什么要增高 CPU 的位數(shù)呢?增高位數(shù)到底有哪些好處呢?
首先回答第一個(gè)問(wèn)題:CPU 要處理更多更復(fù)雜的數(shù)據(jù),這就需要提高 CPU 的數(shù)據(jù)帶寬。
解決這個(gè)問(wèn)題,目前只有兩種行之有效的辦法:
其一、提高 CPU I/O 端口的頻率。
其二、加大 CPU 數(shù)據(jù)傳輸端口的寬度。
就第一種辦法而言,無(wú)疑是兩種做法中最簡(jiǎn)單的。但是提高頻率便要對(duì)生產(chǎn)技術(shù)提高多個(gè)數(shù)量等級(jí),而這無(wú)疑又增加生產(chǎn)成本和延長(zhǎng)了生產(chǎn)周期。那么如果采用第二種方法會(huì)如何呢?
采用后者看起來(lái)就好多了:CPU I/O 接口帶寬增加處理的數(shù)據(jù)隨之增多,多個(gè)周期內(nèi)可完成的任務(wù)在一個(gè)周期就可以完成了!
這個(gè)答案是顯而易見(jiàn)的,如果二者兼顧,那么則更加完美了!
?
(2) 封裝越來(lái)越小
對(duì)于用戶而言,對(duì) CPU 使用什么封裝技術(shù)并不在意,因?yàn)殛P(guān)注的重點(diǎn)在于新品 CPU 的接口形式,比如大家都很喜歡小巧的、使用靈活的接口,這是常識(shí):畢竟體積小,所占空間就小;用手指可以直接完成的安裝,比借助工具來(lái)完成的更加方便。
在過(guò)去,大多數(shù)人已經(jīng)對(duì)頻繁變更 CPU 的接口形式所帶來(lái)的額外投入感到厭煩。其實(shí)封裝正是在促使 CPU 接口轉(zhuǎn)型的重要原因之一。最為典型的例子就是賽楊從 SOLT1 到 SOCKET370 的轉(zhuǎn)型了。在轉(zhuǎn)型 PPGA 封裝的賽楊后去除了沒(méi)有多大必要的 PCB 板,有效的減少了成本。還有一個(gè)更重要的原因就是采用 PPGA 封裝制造,賽楊可以使制造難度下降一個(gè)等級(jí)。
所以說(shuō)封裝小型化,將是未來(lái) CPU 封裝的主導(dǎo)思想!當(dāng)然小型化的實(shí)現(xiàn),離不開高度集成,高度集成是工藝改進(jìn)的必然結(jié)果。
(3) 速度越來(lái)越快
一直以來(lái),大家最關(guān)心的恐怕就要數(shù) CPU 的速度了。速度的大小標(biāo)志著 CPU 運(yùn)算能力的高低。
自從 1971 年 Intel4004,頻率只有 1MHz,而 2001 年的 P4 頻率高達(dá) 2.0G,2008 年的 Core i7 最低主頻是 2.8GHz,2016 年的最新 CPU,主頻高達(dá) 3.0G,的在 45 年間,頻率居然增長(zhǎng)了 3000 倍。
速度提升了,運(yùn)算能力自然大大提升,帶給人們的感受也是有目共睹的。不過(guò)雖然速度是提高 CPU 性能的法寶之一,但是單憑無(wú)止境的提速是很難使 CPU 有一個(gè)質(zhì)的飛躍的。不過(guò)工藝的發(fā)展證明:對(duì) CPU 而言速度是重要的,但它并不是萬(wàn)能的!
(4) CACHE 越來(lái)越小
CACHE 一直是 CPU 中不可低估的元素。那么 CACHE 究竟是怎樣工作的呢?首先主存當(dāng)中保存著所有要用的數(shù)據(jù),而 CACHE 中保存著的部分?jǐn)?shù)據(jù)是主存中數(shù)據(jù)的副本。
當(dāng) CPU 訪問(wèn)主存時(shí),首先檢查 CACHE。
如果要存取的數(shù)據(jù)已經(jīng)在 CACHE 中,CPU 就可以很快的完成訪問(wèn),稱作“命中”。反之,如果數(shù)據(jù)不在 CACHE 中 CPU 就必須從主存中提取。
看來(lái) CACHE 可以有效的增加 CPU 讀取數(shù)據(jù)的速度,那么為何不把主存當(dāng)中的所有數(shù)據(jù)都放入如 CACHE 中呢?換句話說(shuō),就是為什么不增大 CACHE 的容量來(lái)多容納一些數(shù)據(jù)呢?
其實(shí)答案很簡(jiǎn)單,這就關(guān)系到上面所說(shuō)的命中的問(wèn)題。CACHE 中存儲(chǔ)的數(shù)據(jù)不但是主存中的副本而且是隨機(jī)性的數(shù)據(jù)。這就是說(shuō)即便 CACHE 里面有數(shù)據(jù)也不一定是 CPU 要訪問(wèn)的。如果 CACHE 很大 CPU 在里面又尋找不到所需要的數(shù)據(jù),就造成了未命中的情況??梢哉f(shuō)這一段時(shí)間就白白浪費(fèi)了。
既然如此,如果使用小容量 CACHE 會(huì)如何呢?結(jié)果是這樣的:
即便是沒(méi)有找到所需要的數(shù)據(jù),尋找數(shù)據(jù)浪費(fèi)的時(shí)間也要比大 CACHE 少得多。但是可能大家也注意到了,使用小 CACHE 的話 CPU 的命中率會(huì)大大降低。因此可以得出如下的結(jié)論:CACHE 不是越大越好。所以說(shuō)大 CACHE 并不是未來(lái) CPU 緩存的發(fā)展方向。
補(bǔ)充一點(diǎn):實(shí)際上 CPU 的性能和 CACHE 的大小是呈負(fù)指數(shù)二項(xiàng)式增長(zhǎng)。這就是說(shuō)當(dāng) CPU 的 CACHE 的大小到達(dá)一定的水平后,如果不及時(shí)更新 CACHE 搜索算法和 CACHE 的輪換算法,CPU 性能將沒(méi)有本質(zhì)上的提高!
?
(5) 制作工藝尺寸越來(lái)越小
CPU 的“制作工藝”指的是在生產(chǎn) CPU 過(guò)程中,要進(jìn)行加工各種電路和電子元件,精度越高,生產(chǎn)工藝越先進(jìn)。在同樣的材料中可以制造更多的電子元件,連接線也越細(xì),提高 CPU 的集成度,CPU 的功耗也越小。
制造工藝的“微米”和“納米”是指 IC 內(nèi)電路與電路之間的距離。制造工藝的趨勢(shì)是向密集度愈高的方向發(fā)展。密度愈高的 IC 電路設(shè)計(jì),意味著在同樣大小面積的 IC 中,可以擁有密度更高、功能更復(fù)雜的電路設(shè)計(jì)。微電子技術(shù)的發(fā)展與進(jìn)步,主要是靠工藝技術(shù)的不斷改進(jìn),使得器件的特征尺寸不斷縮小,從而集成度不斷提高,功耗降低,器件性能得到提高。
芯片制造工藝在 1995 年以后,從 0.5μm、0.35μm、0.25μm、0.18μm、0.15μm、0.13μm、90nm、65nm、45nm、32nm,22nm,一直發(fā)展到目前最新的 14nm。
可以說(shuō),現(xiàn)在 CPU 的制作工藝,已經(jīng)從無(wú)“微”不至,到了“無(wú)納諸侯”的境界了!
(6) 電壓和功耗越來(lái)越低
從 CPU 發(fā)展歷史來(lái)看,這個(gè)結(jié)論是顯而易見(jiàn)的,而且是將來(lái)的發(fā)展方向。
當(dāng)然電壓、功耗是和生產(chǎn)工藝及集成度密切相關(guān)的。回想第一臺(tái)計(jì)算機(jī)問(wèn)世時(shí)的情形:體積龐大,數(shù)以萬(wàn)計(jì)的管件堆置在一起;有一個(gè)專門發(fā)電單元為之發(fā)電;散發(fā)出的熱量使它所在的房屋,變成了一個(gè)大烤爐。即便是這樣其運(yùn)算能力也沒(méi)有現(xiàn)今手頭上的便攜式的計(jì)算器強(qiáng)。
低頭看一下現(xiàn)在手里的筆記本電腦或臺(tái)式機(jī),即便是 10 幾年前的“老爺機(jī)”:1GHz 的功耗也只有 54W,這點(diǎn)兒熱量,“取暖”都是問(wèn)題,更不必說(shuō)“烤爐”了。能源短缺是人類面臨的重要問(wèn)題,新一代 CPU 在這方面已經(jīng)為人類起了典范的作用!功耗下降了,自然就不需要很大的電壓了。在計(jì)算機(jī) CPU 芯片小型化以后,使用過(guò)的最高電壓是 5V。
然后,這種降壓的趨勢(shì)一直延續(xù)了下來(lái):5V?1.65V(賽楊 2)? 1.3V (C3)。
雖然下降的幅度不算是很大,但是要知道 1.X 伏特的電壓已經(jīng)是很小了。即便是再有下降的空間,這樣的空間也不算是很大了。所以說(shuō)就是只下降了 0.05V 也是一個(gè)重大的進(jìn)步!
對(duì)于臺(tái)式機(jī)和便攜式機(jī)而言,省電、低耗、超低電壓的 CPU 必將成為它們的首選!
(7) RISC 指令結(jié)構(gòu)當(dāng)?shù)?br />
關(guān)于這一點(diǎn),先從 RISC 指令結(jié)構(gòu)和 X86 指令集說(shuō)起。
在 1978 年 Intel 公司推出了代號(hào)為 8086 的 16 位處理器,與此同時(shí)還推出了一款代號(hào)為 8087 的數(shù)學(xué)協(xié)處理器。因?yàn)楫?dāng)時(shí)這兩種芯片在指令集上相互兼容,所以人們將其統(tǒng)稱為 X86 指令集。
隨著時(shí)代的發(fā)展 Intel 陸續(xù)推出了更新型號(hào)的 CPU,但它們都有一個(gè)共同的特點(diǎn)就是仍然兼容原來(lái)的 X86 指令集。所以在 Intel 的后續(xù)產(chǎn)品上,就看到了諸如以 286、386、486、586 等以 X86 形式命名的 CPU 產(chǎn)品。但是當(dāng) AMD 的 K8 出現(xiàn)時(shí),則表明 X86 已經(jīng)是夕陽(yáng)西下了,RISC 處理器隆重登場(chǎng)。
RISC 優(yōu)越的性能完全得益于短指令:因?yàn)?RISC 處理器所處理的都是等長(zhǎng)的短指令,這樣一來(lái)就大大簡(jiǎn)化了解碼器的設(shè)計(jì),省去了許多微碼結(jié)構(gòu)。同時(shí) RISC 極大的簡(jiǎn)化了每一個(gè)時(shí)鐘周期的任務(wù),這樣一來(lái)由于每一個(gè)時(shí)鐘周期所要完成的任務(wù)相對(duì)較少,它就可以盡量縮短時(shí)鐘的脈沖間隔,從而提高 CPU 工作頻率。
所以在同等的制造技術(shù)下,它的時(shí)鐘頻率就高于 CISC 處理器。RISC 處理器的性能之所以高人一籌就是基于以上的原因。
摩爾定律,讓科學(xué)家和工程師們可以預(yù)料到未來(lái) CPU 發(fā)展的大致情況。毫無(wú)疑問(wèn),高性能、低能耗、高速度和低成本是未來(lái)的發(fā)展方向。
3. 摩爾定律失效后,硅芯片將何去何從?
摩爾定律自從 1965 年提出以來(lái),該定律一直生效。不過(guò)近年來(lái)業(yè)界一直預(yù)測(cè)該定律即將失效。早在 2000 年,《麻省理工科技評(píng)論》就硅技術(shù)在大小和速度上的極限提出了警告。
目前,全球半導(dǎo)體行業(yè),不再基于每?jī)赡陮?shí)現(xiàn)性能翻倍的概念來(lái)制定硅芯片研發(fā)計(jì)劃,原因是成本問(wèn)題:無(wú)力承擔(dān)跟上性能提升步伐所需購(gòu)買的超復(fù)雜制造工具和工藝成本。此外,當(dāng)前的制造技術(shù),可能無(wú)法再像原來(lái)那樣大幅度縮小硅晶體管。事實(shí)上,晶體管都已經(jīng)變得非常微小了,以至于可能無(wú)法遵循通常的物理定律,那么,是否意味著科技驅(qū)動(dòng)的指數(shù)級(jí)變化時(shí)代即將走到盡頭了嗎?
回答是:不。
即便硅芯片正在接近物理和經(jīng)濟(jì)成本上的極限,也還有其它的方法繼續(xù)驅(qū)動(dòng)計(jì)算性能的指數(shù)級(jí)增長(zhǎng),比如:采用新材料來(lái)打造芯片和以新方式定義計(jì)算本身。目前,已經(jīng)出現(xiàn)了與晶體管速度無(wú)關(guān)的技術(shù)進(jìn)步,如:深度學(xué)習(xí)驅(qū)動(dòng)的更加聰明的軟件,以及通過(guò)利用云資源實(shí)現(xiàn)更強(qiáng)計(jì)算能力的技術(shù)。而這只是未來(lái)計(jì)算創(chuàng)新的冰山一角。
因此,2016 年福布斯發(fā)布文章稱:即便摩爾定律失效,硅芯片逼近物理和經(jīng)濟(jì)成本上的極限,也還有其它的創(chuàng)新方法和技術(shù)繼續(xù)驅(qū)動(dòng)計(jì)算性能的指數(shù)級(jí)增長(zhǎng),比如:內(nèi)存中運(yùn)算、量子計(jì)算、分子電子學(xué)、神經(jīng)形態(tài)計(jì)算等等。
以下便是有望驅(qū)動(dòng)計(jì)算性能繼續(xù)飛速增長(zhǎng)的幾項(xiàng)新興技術(shù):
(1) 內(nèi)存中計(jì)算
縱觀在整個(gè)計(jì)算史,處理最緩慢的一部分就是從硬盤獲取數(shù)據(jù)。很多的處理性能都浪費(fèi)在了等待數(shù)據(jù)到達(dá)上。相比之下,內(nèi)存中計(jì)算則將大量的數(shù)據(jù)放在 RAM,使得數(shù)據(jù)可以馬上在 RAM 中進(jìn)行處理。結(jié)合新型的數(shù)據(jù)庫(kù)、分析技術(shù)和系統(tǒng)設(shè)計(jì),它能夠大大提升性能和整體成本。
所以“吃掉”RAM,也許是 CPU 的趨勢(shì)之一。
(2) 基于石墨烯的微芯片
石墨烯為一個(gè)分子那么厚,導(dǎo)電性能比任何其它人類已知的材料都要強(qiáng)。它能夠卷入到微小的管子中,也能夠結(jié)合其它材料使用,能夠在更小的空間里驅(qū)動(dòng)電子以更快的速度運(yùn)動(dòng)。它在這方面甚至要?jiǎng)龠^(guò)最下的硅晶體管。這將會(huì)將針對(duì)微處理器的摩爾定律的適用時(shí)間再延長(zhǎng)幾年。
石墨烯的分子結(jié)構(gòu)圖
(3) 量子計(jì)算
普通計(jì)算機(jī)中的 2 位寄存器在某一時(shí)間僅能存儲(chǔ) 4 個(gè)二進(jìn)制數(shù)(00、01、10、11)中的一個(gè),而量子計(jì)算機(jī)中的 2 位量子位(qubit)寄存器可同時(shí)存儲(chǔ)這四個(gè)數(shù),因?yàn)槊恳粋€(gè)量子比特可表示兩個(gè)值。
理論上,量子計(jì)算機(jī)將能夠以數(shù)百萬(wàn)倍于當(dāng)前技術(shù)的速度解決各類非常復(fù)雜的問(wèn)題,如分析基因數(shù)據(jù)或者測(cè)試飛機(jī)系統(tǒng)。谷歌研究人員去年宣布,他們已經(jīng)開發(fā)了一種新的量子比特方式來(lái)檢測(cè)和防范錯(cuò)誤。
?
(4) 分子電子學(xué)
瑞典隆德大學(xué)研究人員利用納米技術(shù)打造了“生物計(jì)算機(jī)”,通過(guò)沿著納米觀人工路徑同時(shí)移動(dòng)多個(gè)蛋白絲,該款計(jì)算機(jī)能夠進(jìn)行平行計(jì)算。
這種生物計(jì)算機(jī)比循序運(yùn)行的傳統(tǒng)電子計(jì)算機(jī)更加快速,且節(jié)能 99%,制造和使用成本也低于傳統(tǒng)計(jì)算機(jī)和量子計(jì)算機(jī)。它進(jìn)行商用的時(shí)間可能也將早于量子計(jì)算機(jī)。
(5) DNA 數(shù)據(jù)存儲(chǔ)
將數(shù)據(jù)轉(zhuǎn)換成 base 4,你就可以將它編碼到合成 DNA 上。
為什么要那么做呢?
DNA 存儲(chǔ)數(shù)據(jù)模型圖
很簡(jiǎn)單:一點(diǎn)點(diǎn) DNA 就可以存儲(chǔ)一大堆數(shù)據(jù)。事實(shí)上,有瑞士研究團(tuán)隊(duì)估計(jì),一個(gè)茶匙的 DNA 可以容納人類迄今為止所產(chǎn)生的所有數(shù)據(jù),從最早期的洞穴壁畫,再到昨天的 Facebook 動(dòng)態(tài)更新。
這種技術(shù)目前需要耗費(fèi)大量的時(shí)間和資金,不過(guò)基因編輯或許是大數(shù)據(jù)的未來(lái):Futurism 最近報(bào)道稱,微軟正在研究利用合成 DNA 來(lái)進(jìn)行安全的長(zhǎng)期數(shù)據(jù)存儲(chǔ),已經(jīng)能夠編碼和恢復(fù) 100%的初始測(cè)試數(shù)據(jù)。
(6) 神經(jīng)形態(tài)計(jì)算
神經(jīng)形態(tài)計(jì)算技術(shù)的目標(biāo)是,打造一款像人腦那樣的計(jì)算機(jī)——處理和學(xué)習(xí)數(shù)據(jù)的速度能夠跟生成數(shù)據(jù)一樣快速。
到目前為止,業(yè)界已經(jīng)開發(fā)出能夠通過(guò)訓(xùn)練和執(zhí)行神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行深度學(xué)習(xí)的芯片,那是往正確方向邁出的一步。例如:General Vision 的神經(jīng)形態(tài)芯片包含 1024 個(gè)神經(jīng)元,每一個(gè)都是基于 SRAM(靜態(tài)隨機(jī)存儲(chǔ)器)的 256 字節(jié)存儲(chǔ)器,且有 3000 個(gè)邏輯閘,所有的神經(jīng)元都互相連接,平行運(yùn)行。
(7) 無(wú)源 Wi-Fi(Passive Wi-fi)
華盛頓大學(xué)的一個(gè)計(jì)算機(jī)科學(xué)家和電氣工程師團(tuán)隊(duì),開發(fā)了一種耗能比目前的電耗標(biāo)準(zhǔn)少 1 萬(wàn)倍的 Wi-Fi 傳輸生成方式。雖然這嚴(yán)格來(lái)說(shuō)不算是計(jì)算性能的提升,但它是網(wǎng)絡(luò)連接性的指數(shù)級(jí)增長(zhǎng),將會(huì)使能其它技術(shù)的進(jìn)步。
無(wú)源 Wi-Fi 被《麻省理工科技評(píng)論》列入 2016 年的十大突破性技術(shù),它將不僅僅可以節(jié)省電耗,還能夠使能最低耗能的物聯(lián)網(wǎng),讓更多之前非常耗電的設(shè)備第一次能夠通過(guò) Wi-Fi 連接網(wǎng)絡(luò),還有可能會(huì)催生新型的通訊方式。
……
一路走來(lái),雖然我們可能在接近硅芯片的性能極限,但技術(shù)本身同時(shí)正在加速發(fā)展,要阻止它成為現(xiàn)代生活的驅(qū)動(dòng)力是不大可能的。隨著新計(jì)算技術(shù)推動(dòng)機(jī)器人、人工智能、虛擬現(xiàn)實(shí)、納米技術(shù)以及其它震驚世界的進(jìn)步超越當(dāng)前被公認(rèn)的極限,它的影響力將只會(huì)有增無(wú)減。
簡(jiǎn)單來(lái)說(shuō),計(jì)算的指數(shù)級(jí)增長(zhǎng),或許無(wú)法永遠(yuǎn)持續(xù)下去,但它的盡頭仍比我們想象的要遙遠(yuǎn)得多。
到這里,不妨思考一下:在不久的將來(lái),如果上述的技術(shù)被成功用于硅芯片的設(shè)計(jì),那么將來(lái)的處理器將會(huì)是什么樣子?
請(qǐng)讀者腦補(bǔ)一下吧!
與非網(wǎng)原創(chuàng)內(nèi)容,不經(jīng)允許,謝絕轉(zhuǎn)載!
本系列更多內(nèi)容,請(qǐng)參照:處理器史話匯總。